當前位置：係統粉 > IT資訊 > 微軟資訊 > 這家AI公司的圖像識別技術讓穀歌和微軟甘拜下風

這家AI公司的圖像識別技術讓穀歌和微軟甘拜下風

時間：2018-07-27 來源：互聯網瀏覽量：

2018年7月，在國際權威計算機視覺競賽PASCAL VOC comp4目標檢測競賽中，Yi+ AI團隊獲得了目標檢測單模型第一名，超越了現有排行榜中的微軟研究院、穀歌、阿裏達摩院、Face++等國內外眾多知名公司，以精度90.7%的成績打破了世界記錄，成為世界第一家總成績突破90%計算機視覺企業。同時在Pascal VOC “comp3”中，首次突破80%，刷新世界紀錄。

Pascal VOC comp4是眾多國內外企業物體檢測團隊證明自己實力的地方，此次Yi+力壓群雄，取得了90.7%的成績，比第二名的阿裏達摩院高了1.5個百分點，在物體檢測領域，1.5個百分點意味著需要比對方“多”檢測正確6000多個框，同時值得注意的是，此次Yi+AI團隊使用的是難度更高的單模型，而第二名的方法是多模型融合。

PASCAL VOC可謂視覺識別類競賽的鼻祖，包含了物體分類、目標檢測、圖像分割等任務。PASCAL VOC對計算機視覺的發展具有深遠而巨大的影響，後續的ImageNet競賽的任務設置就基本沿用了它的設定。此前，微軟、英特爾、CMU、Facebook、UC Berkeley等國際頂尖研發團隊先後在這個排行榜上刷新紀錄。

Yi+AI的負責人表示，在此次Pascal VOC comp4競賽中，Yi+AI團隊使用的方法叫做FXRCNN，其中“X”，代表“多元”的意思，意味著Yi+AI使用的結構不僅僅是高準確率的模型，同時也適用多元場景，包括移植到移動端（通過更改Backbone和Head），實現圖像分割（增加Mask分支），實現人體關鍵點（增加Key point分支），實現人臉檢測（增加Face分支）。

Yi+提交的深度學習模型，雖然采用了Faster RCNN的基本結構，但有很多不同之處：1）采用ResNeXt作為基礎網絡，結合FPN實現多尺度特征融合，2）在後處理階段，采用SoftNMS和多框投票融合；3）通過Yi+海量數據進行預訓練；4）多尺度訓練，進一步加強數據增強。

近年來Yi+不斷加大對人工智能、大數據等新技術的研發和應用，本次提交的模型，是Yi+多年來技術積累的結果，是通過不斷的攻克實際問題的結果，是Yi+內部模型不斷優化的結果，Yi+ AI的FXRCNN在速度，內存，精度，應用範圍等多維度進行了全麵的優化。

在人工智能領域，目標檢測技術應用廣泛，是Yi+AI場景落地的關鍵性技術之一。Yi+將目標檢測技術應用在圖像搜索引擎和圖片視頻結構化引擎中，Yi+圖像搜索引擎可檢測類目超100類，覆蓋服飾、3C商超、家居、日用品、交通工具等；Yi+圖片視頻結構化引擎則采用目前業界最領先的基於深度學習的通用目標檢測算法，支持超過300類常用物體的目標檢測、識別，可實現對視頻和圖像中的場景、人、車輛、物體（輪廓）檢測、識別、分割、跟蹤；可識別近10,000種物品，400種場景。