時間:2017-11-01 來源:互聯網 瀏覽量:
競爭激烈的領域,友商們坐在一起暢談行業,並不多見。計算機視覺可能就是這樣的一個領域。深度學習技術成熟,國內計算機視覺領域的初創公司雨後春筍般湧現。商湯、曠視、依圖、中科視拓都是其中最為知名的幾家公司。據說,因為業務方向、產品具有一定的相似性,幾家公司還經常在各類競標中相遇。
在今年第二屆微軟亞洲研究院院友年度大會上,四家公司的高管難得被聚在了一起。 事實上,幾家公司都與微軟亞洲研究院有著深厚的淵源:中科視拓的董事長兼CTO山世光、曠視科技首席科學家孫劍是前微軟亞洲研究院院長沈向洋的團隊成員、博士生;依圖科技的創始人兼CEO朱瓏是前微軟亞洲研究院副院長張宏江的學生;商湯科技創始人湯曉鷗也曾是張宏江在微軟亞洲研究院媒體研究組的訪問教授。
基於這種種淵源,張宏江還在大會上開玩笑提問沈向洋, 能不能把大家都收購了,成立微軟亞洲研究院刷臉公司,“ 讓天下沒有難看的臉 ”。
一起回到微軟亞洲研究院,微軟全球執行副總裁沈向洋與5位微軟亞洲研究院的院友:曠視科技創始人兼CEO印奇、曠視科技首席科學家孫劍、商湯科技聯合創始人兼CEO徐立、中科視拓的董事長兼CTO山世光、依圖科技業務技術副總裁吳岷坐在一起,他們都聊了什麼呢?
人臉識別已經超越人類識別了麼?
計算機視覺技術從提出到如今,已經有51年的曆史了。深度學習算法出現,對其推動作用巨大。未來五年計算機語音有望會超過人類,但在計算機視覺領域,可能還有一段路要走。其中人臉識別領域,中國現在做得特別好,那麼人臉識別是否已經全麵超越人類識別?
綜合幾位嘉賓的觀點,答案是陌生人識別技術上,可能在一定程度上超越人,但在熟人識別中,技術還有不少提升的空間。
徐立認為,陌生人識別技術上,可能在一定程度上超越人,但是人類真的認識人的過程當中,其實特別是熟悉的識別,遠遠不是現在技術能達到的。不過,這並不一定會影響到技術商用,每一個階段都有那個階段的“技術成熟”。比如,十年前人臉識別就已經在諸如海關等場景中運用,當時的準確率是53%。而隨機猜的概率是50%。各個階段有各個階段不同的“技術成熟”,而現階段在一些場景中人臉識別已經可以應用。
印奇認為,AI領域,小到人臉識別,在接下來的商業路徑裏麵,都會跟場景緊密結合。將人臉整套係統、軟硬件一起來看,已經有很多創業團隊開始落地,在這些場景中,局部是可以與人進行比較的,而在未來兩三年,在一些剛需場景下,是有機會做的非常好的。
山世光也表達了類似的觀點。陌生人識別領域,特別是這個人相對比較配合的情況下,機器的能力肯定是超越人了,但在熟人場景下,就很難達到這樣的水平。據說,此前有人表示,讓家裏的機器人識別家裏5個人也很難做到100%識別。因此,人臉識別可能還有很多需要去做的地方,但在特定應用場景下麵識別已經做得很好了。
其實,在熟人識別的領域,人眼識別也不一定做的好。 吳岷就曾遇到這樣的案例,在一個警察客戶那裏,一個小夥子在係統裏搜尋了下女朋友的近照,為了保密係統不顯示身份證和名字,隻顯示人臉,結果屏幕上出現了12張臉,其中人臉的照片還是10年前或者20年前的身份證照片,最後幫他解圍,在係統中把名字顯示出來,看到排名第一的就是他女朋友。
而基於現在的技術,也有一些新的需求逐漸顯現。比如,警察客戶就向依圖提過需求,能不能識別屍體照片;也有其他客戶向中科視拓提過類似的要求,當時人臉識別還糾正了部分基因檢測的錯誤。在這些新的場景中,人臉識別就遠談不上人眼識別。
人臉識別雲、端與應用
當然,人臉識別主要有三個落地的方向:雲端平台、終端、垂直場景應用。那麼從什麼方向、什麼切入點切入去創業更有機會呢?
其實,幾家知名的公司目前基本都是在圍繞垂直場景做服務、做應用,尤其是在安防、金融領域。這很可能也是幾家公司的主要收入來源。
曠視科技從2011年開始創業,經過六年的發展,印奇認為目前值得專注的行業有2.5個,分別是金融行業、安防行業、手機應用(0.5)。金融行業整個業務都是線上化的,已經完成了信息化、聯網化,這一領域無論是人臉識別,還是智能風控,都是以雲為主。安防行業,基本上以線下攝像頭連接和智能化為核心,這是非常線下的生意。另外0.5個行業則是與手機相關的,包括APP、AR應用,之前這個行業是叫好不叫座,因為競爭激烈,目前都不怎麼賺錢,iPhone X出來之後,教育了市場,也許有機會在每一個垂直行業裏麵做精準。不管哪一方麵,AI公司能夠形成壁壘,一定要觸及數據,雲不是一個簡單API對外的服務,一定需要是SaaS,是完全數據閉環的服務。
在垂直場景中,尤其是安防場景中,雲加端成為一個較為普遍的模式。徐立認為雲加端的模式是未來AI技術企業發展的最好模式。 以安防為例,當前全球安防攝像頭約兩億五千萬支,預計2020年僅中國所有的室內外攝像頭就有可能達到10億支,如果按現在的模式,每個人都要盯住一個攝像頭,所以完全集中化可能性不高,需要在端上麵一定的布局和真的前置化的一些運算。
依圖目前的模式也是既有雲又有端,做垂直場景應用落地。在金融方向, 依圖的SaaS服務,對接了Azure等雲服務,接入了200多家互聯網金融遠程合成業務。在安防領域,也做了警務通等應用,幫助客戶解決真正的問題。
人臉識別的感知問題
人工智能做到最後往往都是感知和認知。很多感知和認知都是和人臉連在一起的。人臉比較特別的一點是,通過人臉就可以看出你的情緒,是不是生氣,是不是沮喪,是不是開心。
山世光認為,人臉識別的前端是感知,後端是認知。但是從目前來看,計算機視覺方向,能做的還多是感知。表情識別很難比人做得好,現在也暫時沒有做得比人好的,主要原因是因為標注專業人員不太夠,造成標注數據不夠。通過其他的方法,也可以感知到人內心的情緒。比如,利用高速相機捕捉到一些人眼不能夠感知到的微妙變化,然後進行解析。
孫劍也在思考類似的問題:為什麼感知到現在做不好,到底是因為沒有數據,還是其他原因?在他看來,下一步機器人要和人交互,一定要解決這個問題,這是值得投入精力去研究的問題。
不過,作為CEO,印奇和徐立,就沒有那麼擔憂這個問題了。印奇認為,即使是這類非常難的問題,也有可能用非常工程化的方法解決,不一定要用最難的技術,反而可以用性價比更高的方案來解決。徐立的觀點與之類似,認為必須根據實際的需求定義問題,同時要解決問題,超越工業應用的紅線。