當前位置:係統粉 >   IT資訊 >   微軟資訊 >  這家AI公司的圖像識別技術讓穀歌和微軟甘拜下風

這家AI公司的圖像識別技術讓穀歌和微軟甘拜下風

時間:2018-07-27 來源:互聯網 瀏覽量:

2018年7月,在國際權威計算機視覺競賽PASCAL VOC comp4目標檢測競賽中,Yi+ AI團隊獲得了目標檢測單模型第一名,超越了現有排行榜中的微軟研究院、穀歌 、阿裏達摩院、Face++等國內外眾多知名公司,以精度90.7%的成績打破了世界記錄,成為世界第一家總成績突破90%計算機視覺企業。同時在Pascal VOC “comp3”中,首次突破80%,刷新世界紀錄。

這家AI公司的圖像識別技術讓穀歌和微軟甘拜下風(1)

Pascal VOC comp4是眾多國內外企業物體檢測團隊證明自己實力的地方,此次Yi+力壓群雄,取得了90.7%的成績,比第二名的阿裏達摩院高了1.5個百分點,在物體檢測領域,1.5個百分點意味著需要比對方“多”檢測正確6000多個框,同時值得注意的是,此次Yi+AI團隊使用的是難度更高的單模型,而第二名的方法是多模型融合。

這家AI公司的圖像識別技術讓穀歌和微軟甘拜下風(2)

PASCAL VOC可謂視覺識別類競賽的鼻祖,包含了物體分類、目標檢測、圖像分割等任務。PASCAL VOC對計算機視覺的發展具有深遠而巨大的影響,後續的ImageNet競賽的任務設置就基本沿用了它的設定。此前,微軟、英特爾、CMU、Facebook、UC Berkeley等國際頂尖研發團隊先後在這個排行榜上刷新紀錄。

Yi+AI的負責人表示,在此次Pascal VOC comp4競賽中,Yi+AI團隊使用的方法叫做FXRCNN,其中“X”,代表“多元”的意思,意味著Yi+AI使用的結構不僅僅是高準確率的模型,同時也適用多元場景,包括移植到移動端(通過更改Backbone和Head),實現圖像分割(增加Mask分支),實現人體關鍵點(增加Key point分支),實現人臉檢測(增加Face分支)。

Yi+提交的深度學習模型,雖然采用了Faster RCNN的基本結構,但有很多不同之處:1)采用ResNeXt作為基礎網絡,結合FPN實現多尺度特征融合,2)在後處理階段,采用SoftNMS和多框投票融合;3)通過Yi+海量數據進行預訓練;4)多尺度訓練,進一步加強數據增強。

近年來Yi+不斷加大對人工智能、大數據等新技術的研發和應用,本次提交的模型,是Yi+多年來技術積累的結果,是通過不斷的攻克實際問題的結果,是Yi+內部模型不斷優化的結果,Yi+ AI的FXRCNN在速度,內存,精度,應用範圍等多維度進行了全麵的優化。

這家AI公司的圖像識別技術讓穀歌和微軟甘拜下風(3)

在人工智能領域,目標檢測技術應用廣泛,是Yi+AI場景落地的關鍵性技術之一。Yi+將目標檢測技術應用在圖像搜索引擎和圖片視頻結構化引擎中,Yi+圖像搜索引擎可檢測類目超100類,覆蓋服飾、3C商超、家居、日用品、交通工具等;Yi+圖片視頻結構化引擎則采用目前業界最領先的基於深度學習的通用目標檢測算法,支持超過300類常用物體的目標檢測、識別,可實現對視頻和圖像中的場景、人、車輛、物體(輪廓)檢測、識別、分割、跟蹤;可識別近10,000種物品,400種場景。

這家AI公司的圖像識別技術讓穀歌和微軟甘拜下風(4)

目前Yi+AI已將目標檢測技術應用在多個使用場景中,包括“智能硬件”、“營銷”、“新零售”、“智慧城市”等解決方案,具體則應用在場景廣告平台、新零售平台、大屏AI助手、智慧安防、智慧交通、智慧社區等多項領域之中。

下一步,Yi+將結合現有技術優勢繼續深耕智慧城市、新零售、智能營銷、智能硬件等多個領域,讓計算機看懂世界,用科技提供人工智能服務,幫助人們看見非凡,see different。

Yi+獲得阿裏巴巴等B輪融資。服務了眾多500強客戶。團隊成員大多來自頂尖企業與高校,如哥倫比亞大學、帝國理工、耶魯、普林斯頓、普渡大學、新加坡國大、南洋理工、清華、北大等及微軟、IBM、英特爾、阿裏巴巴、騰訊、百度、華為等企業。

我要分享:

最新熱門遊戲

版權信息

Copyright @ 2011 係統粉 版權聲明 最新發布內容 網站導航