時間:2018-09-09 來源:互聯網 瀏覽量:
新智元AI WORLD 2018世界人工智能峰會
2018年最受關注的計算機視覺挑戰賽是什麼?
COCO!
MS COCO 的全稱是常見物體圖像識別(Microsoft Common Objects in Context),起源於是微軟於2014年出資標注的Microsoft COCO數據集,同名競賽與此前著名的 ImageNet 競賽一樣,被視為是計算機視覺領域最受關注和最權威的比賽之一。
而在ImageNet競賽停辦後,COCO競賽就成為是當前物體識別、檢測等領域的一個最權威、最重要的標杆,也是目前該領域在國際上唯一能彙集Google、微軟、Facebook 以及國內外眾多頂尖院校和優秀創新企業共同參與的大賽。
剛剛,ECCV官網上發布了2018年最新COCO競賽的結果:
在物體檢測、全景分割、人體關鍵點檢測、DensePose以及2018年最新提出的Mapillary街景檢測(Mapillary Detction)和街景全景分割(Mapillary Panoptic)6項任務中,中國的團隊包攬了所有的冠軍!
根據ECCV COCO Workshop的日程表,我們可以發現:
曠視團隊(Megvii)獲得了4項冠軍:實例分割(並列第一)、全景分割、人體關鍵點檢測,以及Mapillary街景全景分割;
北京郵電大學自動化學院模式識別與測控技術實驗室(BUTP-PRIV)獲得了DensePose任務的冠軍;
滴滴團隊(DiDi Map Vision)獲得了Mapillary街景檢測冠軍。
不僅如此,其他中國團隊也斬獲了出色的結果:
微軟亞洲研究院團隊(MSRA)獲得了人體關鍵點檢測亞軍;
北京大學和360組成的團隊(PKU_360)獲得了全景分割任務的亞軍。
MS COCO 2018,當之無愧是中國計算機視覺團隊稱霸的一年!
COCO 挑戰賽:ImageNet 後最權威的計算機視覺衡量標杆
今年的COCO競賽與ECCV 2018一同舉辦,而且新增了兩項街景識別的新任務——Mapillary Vistas,這是是新近推出的街景集圖像數據集,專注於圖像的高階語義理解,推動自動駕駛和機器人導航等領域的技術落地。在數據集和應用任務方麵,兩者有很多不同,而後者對前者起補足作用。通常來講,COCO 是自然場景下的物體識別,Mapillary 則聚焦於街景場景識別,因此聯合挑戰賽的形式有利於計算機視覺技術更貼近現實場景,更具應用價值。
COCO 是一個旨在促進目標檢測研究的圖像數據集,重點關注檢測上下文中的目標。COCO 的注釋包括 80 個類別對象的實例分割,91 個類別的物品分割,人物實例的關鍵點檢測,以及每個圖像都有 5 個圖像標題(image captions)。
自 2015 年首屆挑戰賽以來,COCO 賽項數量不斷更新,評估標準也更加複雜;COCO 2018 相較往年又有改變。在檢測方麵,實例分割近年在 COCO 上大為流行,今年,COCO 和 Mapillary 都有此賽項;隨著檢測技術走向飽和,COCO 去掉了邊界框檢測這一賽項,但成績依然出現在榜單上。
另外一個變動是新增了 DensePose 和 Panoptic Segmentation 兩個賽項。Panoptic Segmentation 同時解決一張圖像上前景物體與背景物體的分類問題,把互為分裂的語義分割和實例分割整合為一,推動分割技術步入新境界,不斷逼近現實應用。COCO 和 Mapillary 也都有此賽項。
COCO 2018 挑戰賽的具體任務包括:(1) 利用分割掩模進行目標檢測(實例分割),(2) 全景分割,(3) 人體關鍵點檢測,(4)DensePose。
1、COCO 實例分割任務
COCO 目標檢測任務(Object Detection Task)旨在推動目標檢測領域的先進技術。COCO 2018 挑戰中隻出現具有對象分割輸出的檢測任務。
隨著近年來物體檢測技術已經成熟,COCO 不再以邊界框檢測任務為主。雖然 leaderboard 仍保持開放,但邊界框檢測任務不是 workshop challenge;相反,競賽鼓勵研究人員專注於更具挑戰性和視覺信息的實例分割任務。
2、COCO 全景分割任務
COCO 全景分割任務(Panoptic Segmentation Task)的目標是推進場景分割的最新技術水平。全景分割需處理物體類和事件類,統一了兩種典型的語義和實例分割任務。“全景”(panoptic)的定義是指 “包括一個視圖中可見的所有內容”,即一個統一的、全局的分割視圖。
3、COCO 人體關鍵點檢測任務
COCO 人體關鍵點檢測任務需要在具有挑戰性、不受控製的條件下定位人物的關鍵點(person keypoints)。關鍵點檢測任務涉及同時檢測並定位人物的關鍵點(在測試時沒有給出人的位置)。
4、COCO DensePose 任務
COCO DensePose 任務需要在具有挑戰性,不受控製的條件下定位密集的人物關鍵點。DensePose 任務涉及同時檢測和定位人的密集關鍵點,將所有人物像素映射到人體的 3D 表麵。
Mapillary Vistas挑戰賽:2018年新加入的自動駕駛類任務
隨著計算機視覺技術的不斷進步,今年,Mapillary Research也加入了COCO競賽,並提供了Mapillary Vistas數據集。Vistas是一個多樣化的、像素精確的街道級圖像數據集,用於在全球範圍內增強自動駕駛能力。
Mapillary Vistas 數據集的設計和收集涵蓋了外觀的多樣性、注釋細節的豐富性和廣闊的地理範圍。相關競賽的難點和要點在於把互為分裂的語義分割和實例分割整合為一,推動分割技術步入新境界,不斷逼近現實應用。
Mapillary Challenges基於公開的Vistas Research數據集,其特點是:
28個stuff類,37個thing類,以及1個void類
25K高分辨率圖像
地理範圍覆蓋全球,包括北美和南美、歐洲、非洲、亞洲和大洋洲
非常多樣的天氣條件(陽光、雨、雪、霧、霧)和捕獲時間(黎明、白天、黃昏、夜晚)
廣泛的相機傳感器,不同的焦距,圖像寬高比和不同類型的相機噪音
不同的捕捉視角(道路、人行道、公路外)
基於Mapillary Vistas數據集的競賽任務包括:(1)目標檢測和分割掩碼(實例分割);(2)全景分割(panoptic segmentation),分別對應COCO的檢測和全景分割任務。
1、Mapillary Vistas目標檢測任務
Mapillary Vistas目標檢測任務強調識別靜態的街道圖像對象(如路燈、路標,電線杆)的個體實例,以及動態的街道參與者(如汽車、行人、騎自行車的人)。這項任務旨在推動最先進的實例分割,針對汽車或運輸機器人等自動駕駛應用的關鍵感知任務。
2、Mapillary Vistas全景分割任務
Mapillary Vistas Panoptic分割任務針對街景圖像中的完整感知區域。全景分割需要同時處理stuff 類和thing類,統一了典型的不同語義和實例分割任務。
COCO 2017競賽結果:中國團隊刷榜,超越穀歌、Facebook
回過頭去看2017年的COCO 競賽的結果,當時是在ICCV 2017 “Joint COCO and Places Recognition Challenge Workshop” 公布。
當時,微軟、Facebook、穀歌、商湯、曠視等企業,以及卡內基梅隆大學、北京大學、香港中文大學、上海交通大學等高校紛紛參與,競爭激烈。
在側重對物體的理解的傳統4大任務中:
物體檢測(邊界框 BBox):曠視研究院團隊第一,港中文&北大團隊 UCenter 第二,微軟亞洲研究院(MSRA)團隊與來自 FAIR 的團隊分別獲得第三、第四
語義分割(Segmentation):港中文&北大團隊 UCenter 第一,曠視研究院團隊第二,FAIR 和 MSRA 分別獲得第三、第四
人體關鍵點檢測:曠視研究院第一,北航&商湯團隊 OKS 第二
背景語義分割(Stuff Challenge):FAIR 團隊第一,牛津視覺實驗室第二
2017年的COCO 還聯合舉辦了 Places 2017 這項側重對場景理解的挑戰賽,分為3個子任務:
Places 分為場景分割、物體分割和邊緣檢測三項任務。其中,物體分割(Instance Segmentation)任務,曠視擊敗了穀歌,贏得了冠軍。
根據 Workshop 官方介紹,在 Places 環節受邀發表演講的是來自穀歌(G-RMI)、今日頭條(WinterIsComing,ByteDance)和中科院自動化所與京東合作的團隊(CASIA_IVA_JD)。這無疑是後兩個團隊在 Places 2017 競賽中取得好成績的證明。
新智元AI WORLD 2018大會倒計時 11 天
門票已開售!
新智元將於9月20日在北京國家會議中心舉辦AI WORLD 2018世界人工智能峰會,邀請機器學習教父、CMU教授 Tom Mitchell,邁克思·泰格馬克,周誌華,陶大程,陳怡然等AI領袖一起關注機器智能與人類命運。
大會官網:
http://www.aiworld2018.com/
活動行購票鏈接:
http://www.huodongxing.com/event/6449053775000
活動行購票二維碼: