時間:2017-07-19 來源:互聯網 瀏覽量:
7月17日,有人工智能“世界杯”之稱的ImageNet大規模視覺識別挑戰賽(ILSVRC-2017)正式落幕。在本屆大賽中,360人工智能團隊最終奪得冠軍,並且刷新了此前穀歌、微軟、牛津大學等機構保持數年的世界紀錄。
ImageNet大規模視覺識別挑戰賽被譽為計算機視覺乃至整個人工智能發展史上的裏程碑式的賽事。本屆比賽共吸引了來自中美英等7個國家的25支頂尖人工智能團隊參賽。賽事共包括物體定位(識別)、物體檢測、視頻物體檢測三大類任務。最終,由360人工智能研究院與新加坡國立大學(NUS)組成的團隊在“物體定位”任務的兩個場景競賽中均獲得第一,同時在所有任務和場景中均取得了全球前三的驕人戰績。
360人工智能研究院院長顏水成表示:“很高興能夠在ImageNet上取得佳績,這也反映了360人工智能技術,特別是在視覺識別方麵的領先實力。360非常重視人工智能在垂直領域的發展,並將人工智能技術積極應用到各類產品中。當下人工智能的發展不能脫離具體業務,需要在垂直領域去解決具體的問題,能落地的人工智能才是真正的人工智能。”
圖1:使用訓練數據進行分類+定位的模型訓練
物體定位(識別)、物體檢測、視頻物體檢測都是計算機視覺的核心領域,對於人工智能的發展意義重大,有廣闊的應用前景,比如人臉識別、無人駕駛、智能機器人等。在本屆賽事中,“物體定位”任務共包括兩大場景,即“使用訓練數據進行訓練”,與“使用額外訓練數據進行訓練”。
在上述任務中,360與NUS團隊合作提出的“DPN 雙通道網絡+基本聚合”深度學習模型均取得了最低的定位錯誤率,分別為0.062263和0.061941。值得一提的是,穀歌、微軟、牛津大學等一直在此項任務中保持世界領先地位。此次,該項紀錄最終被360與NUS團隊成功改寫。
圖2:使用額外訓練數據進行分類+定位模型的訓練
計算機視覺識別是人工智能領域的經典命題,長久以來一直受到學術界和產業界的廣泛關注。ImageNet不但是計算機視覺發展的重要推動者,也是深度學習熱潮的關鍵驅動力之一。從 2010 年以來,ImageNet 每年都會舉辦一次全球性競賽,即 ImageNet 大規模視覺識別挑戰賽。來自全球各國的頂級人工智能團隊會在賽事中相互較量,比拚對物體和場景進行分類和檢測的能力。這些團隊既包括穀歌、微軟、Facebook等大型互聯網公司,也包括伯克利、牛津大學等世界頂級名校。整個賽事也成為了各團隊、巨頭展示實力的競技場。
任何成績的取得都不是一蹴而就的,而是來自於長期的積累。顏水成表示,一直以來 ,360人工智能研究院在計算機視覺領域持續投入研發。在長時間的研究工作中,打造了一支實力強大的人工智能團隊,對於計算機視覺領域有深刻的理解。
安全與智能是360當前兩大重點。360人工智能研究院立足於世界領先的深度學習研發能力,發力視覺、語音、語義和大數據四個方向,向360相關業務部門提供技術輸出,並完成人工智能相關方向的原始技術積累和前沿探索。
目前,研究院的人工智能技術已經廣泛應用於360的全係列產品中,包括直播、智能硬件、搜索和信息流等業務。未來,研究院將會推動360在人工智能方麵的技術實現突破性進展。其中,視覺技術將進一步提升,優化識別物體、行為等,並拓展到SLAM領域;語音分析將增強合成真實感,提高識別準確度,逐步建立基於NLP語義的對話係統;大數據技術的提高將帶動廣告、精準推薦等。