當前位置:係統粉 >   IT資訊 >   微軟資訊 >  拿下微軟人臉識別世界杯冠軍的中國公司什麼背景

拿下微軟人臉識別世界杯冠軍的中國公司什麼背景

時間:2017-07-31 來源:互聯網 瀏覽量:

拿下微軟人臉識別世界杯冠軍的中國公司什麼背景(1)

夏畢斜

2016年6月,微軟向公眾發布了大規模現實世界麵部圖像數據集MS-Celeb-1M,含有10萬個名人的約1000萬(10M)張臉部圖片,鼓勵研究人員使用這些數據集開發、測試人臉識別技術。

同時,微軟還宣布了MS-Celeb-1M百萬人臉識別挑戰賽。參賽者需要根據(但不限於)挑戰賽提供的數據集作為訓練數據,開發圖像識別係統,從臉部圖像中識別100萬個名人。

簡而言之,抽取一張名人照片,參賽團隊利用自己設計的模型識別出這個人是誰,這個使用場景非常貼近日常生活,且更容易進入商業環境,比如圖像字幕和新聞視頻分析、輿情分析等等。

即使是在微軟看來,MS-Celeb-1M這件事兒是非常有意義的——數據集有效填補了工業界跟學術界的空白,通過有針對的評估指標設計,競賽實現了人臉“端到端”識別,有助於參賽模型投入現實應用。

在今年的一場挑戰賽中,一家中國初創公司獲得了百萬名人識別子命題有限製類第一名,它的名字是獵戶星空。

有限類數據比賽,比拚的是技術算法、團隊的產品邏輯思維

借助AI界計算機視覺領域頂級會議ICCV 2017的平台,微軟推出了——既包括大規模人臉識別競賽(Hard Set及Random Set),也推出全新的、更具挑戰性的小樣本學習(Low-Shot Learning)競賽,堪稱“級別最高、難度最大”的技術賽事。

在這場賽事中,無限製類不是單純算法的比拚,在某種程度上是在比拚數據,數據越多訓練的模型越好,無限製類是算法和數據的綜合比拚;而有限製類則是單純算法的比拚,也是從算法層麵難度更大的比拚,據了解這個——“東西隻能靠算法,因為數據是一定的。當沒有外部數據的情況下達到最高精度是非常困難的。”因此,組委會也認為了獵戶星空的難度極高,單獨列了一項采用受限數據集的子項目。

所以在獵戶星空所參與的這個項目裏,不可以使用外部數據,有限製類別隻能在限定的數據集內調用,比拚團隊的算法能力。

簡而言之,就是用盡量少的資源輸出最好的結果,其難點在於技術算法以及團隊整體的產品設計思維。

獵戶星空介紹,有限定數據集的競賽難度主要在於——競賽數據噪聲很大,無法直接用於訓練;而整個訓練數據集非常大,適合人臉模型大規模訓練的模型對資源的要求又很高,很難做到又快又好。

“訓練數據太髒。這裏的髒是指一個類別裏有很多不同的人,有時我觀察一個類別都不知道正確的人應該是誰,這種數據直接訓練很難。”向相關人士了解到。

經過研究,獵戶星空設計了一種魯棒的去噪算法,可以針對各類不同程度的噪聲數據都進行有效地去噪。同時選擇采用適合大規模訓練的triplet模型,並創新地使用了一種巧妙的設計,在有限資源下加速了triplet網絡的訓練,也大大提升了性能。

最終獵戶星空團隊獲得0.75/0.606(random set/hard set)的高分。用比賽舉辦方的話來說,0.75已經接近滿分,是一個非常難以達到的成績。而在hard set上0.606的成績,也是遠遠超過去年的最好成績(0.534)。

一個問題是——一年成立剛剛一年的公司,就能在這樣的賽事裏拿下這樣的成績,這家公司是什麼背景?

獵戶星空的背後,是圖像、語音識別兩大核心技術

AI技術所麵臨的問題,現在已經明顯——學術界的人才不停發paper,卻不一定能在大公司中將技術應用落地,快速推向市場;而目前缺失的是工業界的人才——他們麵臨著如何將論文、學術轉化為實際產品應用的問題。如何打開AI技術的應用市場,其實更注重後者。

獵戶星空所扮演的角色就是後者,讓技術落地,更貼近消費者。如今也已經擁有了不少落地產品。

檢索這家公司的資料——獵戶星空全名為北京獵戶星空科技有限公司,創立於2016年9月,是獵豹移動旗下人工智能公司。獵戶星空成立初就彙聚了全球人工智能的精英人才,初創團隊擁有來自美國矽穀,日本,台灣地區,中國北京,深圳等全球一流科技公司技術大牛和產品極客。

最早,獵戶星空投身人臉識別的研究和探索,他們在今年LFW人臉識別的評測中取得了前三名的成績,技術算法上——與隻追求精度的團隊不同的是獵戶星空是用盡量小的網絡來追求盡量高的精度的事情;而產品應用上,他們的策略就是快速應用到產品上。

據了解——關於這次人臉識別的比賽技術,獵戶星空會運用到實際場景中,最後將會落地在門禁、機器人、移動app等具體的產品裏。

其人臉識別技術已經應用到獵豹移動旗下的直播產品Live.me中,在Live.me上主要的作用就是鑒黃,直播平台每天會產生超過20萬小時的直播內容,而運用圖像識別技術進行24小時的實時監控,極大地提高工作效率和成果。

語音識別方麵,今年6月,獵戶星空聯合喜馬拉雅發布了一款麵向用戶的小雅AI音箱。這是獵戶星空AI生態鏈上的第一款產品,小雅AI音箱背後的核心便是獵戶星空全鏈路自研的遠場語音交互技術,這套係統從有呼必應、優質點播體驗和海量內容等多方麵打造完美的用戶體驗。

僅僅過了一個月,小米也發布了小米的第一款AI音箱——“小愛同學”。這也是獵豹移動旗下人工智能公司獵戶星空與小米的首次合作,這款產品由獵戶星空提供人聲回應技術以語音合成等技術。

簡而言之,當“小愛同學”再被喚醒的時候,回答的那一聲“誒”“我在”等交流內容由獵戶星空提供;而語音合成技術則是處理語音回饋時候的語音模型、語調,讓她聽起來不那麼機器人呢,更像是一個自然人。通過TTS語音合成模式,還可以讓你喜歡的明星用它的語氣和聲調每天叫你起床。

讓技術快速和旗下應用產品結合,正是這一家產品思維型AI公司的核心訴求。

傅盛的AI思維和獵豹的轉變

在獵豹CEO傅盛看來,互聯網+是上一波認知紅利,下一個則是AI ,AI+時代已經到來。

互聯網產業改變了我們傳統意義上認知的那個新聞+互聯網,變成了一個更龐大的互聯網世界。而AI人工智能技術也會是對整個產業的重構,是對我們整個思維方法的重新塑造。

“AI就跟互聯網一樣,互聯網本質上是一個技術突破嗎?它是由於產生這個協議、產生這個網站以後,使得很多的產品形式發生了改變。今天你看到的所有比如是支付,我們也叫互聯網+,所有的行業都架在互聯網上。今天互聯網所有的紅利都來自於和傳統行業的結合、和應用的結合。我們真正想一想互聯網的第一波其實也是一個互聯網+,它是把新聞和互聯網結合,然後是內容和互聯網結合、娛樂和互聯網結合,它都是一種基本的技術手段。

所以AI我認為也是這樣一個東西,它其實是可以改變很多行業的行業規則的,它本身很難成為一個所謂獨立的行業,一定要和應用的結合。所以叫AI+時代的到來。”

人工智能將現實所有物理事件產生的東西歸結於一個點——數據。然後,再把這個數據,用神經網絡的方式去認知和理解,達到過去所有算法無法企及的高度。

傅盛認為,深度學習的機會在於和應用的結合而不是技術輸出。深度學習的核心是數據驅動,雖然有模型調參,有自己的優勢,但別人有更多的數據調參很快拉平優勢,很難真的想像一家公司通過提供技術輸出就能成功。

在傅盛這樣的思維下,獵豹已經展開了內容產品的布局。

獵豹移動最早期的定位是安全、工具類產品。在成功實現了工具產品的商業化之後,獵豹移動開始升級賽道。

除了在美國市場做直播產品Live.me,收購新聞服務運營商News Republic,獵豹還投資了Musical.ly短視頻團隊。

根據2017年第一季度的財報顯示,內容型應用對獵豹總收入的貢獻從上一季度的11.3%增長到了18.8%,環比增長55.2%。這都得益於旗下內容型產品——Live.me、News Republic等在海外市場的搶眼表現,兩款產品都使用到了人工智能的技術。

這家獵戶星空公司,應該就是驅動獵豹步伐加快的新動力吧。

我要分享:

最新熱門遊戲

版權信息

Copyright @ 2011 係統粉 版權聲明 最新發布內容 網站導航