當前位置：係統粉 > IT資訊 > 微軟資訊 > 出身微軟HoloLens功臣他們用3個攝像頭搞定自動駕駛

出身微軟HoloLens功臣他們用3個攝像頭搞定自動駕駛

時間：2017-12-06 來源：互聯網瀏覽量：

車東西文 | 曉寒

自動駕駛技術興起後，英特爾、英偉達、高通等科技公司紛紛入局，聲勢浩大地成立了自動駕駛部門並推出了一係列產品。

但這波跨界浪潮中卻唯獨少了微軟的聲音。

今年夏天，幾位來自微軟亞洲研究院，曾參與過Hololens核心算法開發，以及微軟認知服務研發的研究員創辦了自動駕駛公司——DeepMotion深動科技，算是替微軟“補上”了這個缺口。

近日，DeepMotion向車東西獨家展示了他們的技術DEMO——一套通過攝像頭陣列來幫助無人車實現3D感知、高精地圖繪製與定位的方案。DeepMotion方麵表示，這是國內唯一一套低成本、高精度的解決方案，技術難度非常之高。

那麼這家“微軟”係公司背後有何故事?他們的技術路徑又有哪些特點呢?且看車東西本期硬創先鋒為你揭秘。

一、微軟係自動駕駛團隊

DeepMotion的辦公室位於北京北四環邊上的一棟大廈裏，麵積不算大，但是布局的非常緊湊，今年7月份才剛剛整理完畢。

公司共有四位創始人，蔡銳、李誌偉、楊奎元和張弛，分別擔任CEO、CTO、首席科學家和研發總監的職務。在創辦DeepMotion之前，蔡銳、李誌偉、楊奎元三人已經在微軟亞洲研究院工作了將近10年的時間。

出身微軟HoloLens功臣他們用3個攝像頭搞定自動駕駛(1)

張弛之前雖然還沒有正式入職，但是他是微軟亞洲研究院與中山大學聯合培養的博士生，也參與了很多項目，因此與蔡銳、李誌偉、楊奎元三人也非常熟悉。

2016年起，科技圈有兩個方向最火，一是AR/VR，二就是自動駕駛技術。“雖然我們整天都紮在項目裏做研發，但其實也在密切關注外麵的形勢。”提起為何要離職創業，DeepMotion的CEO蔡銳這樣向車東西說道，“2016火了一整年後，AR/VR技術其實並沒有像預期那樣爆發，而另一邊包括自動駕駛公司在內的AI應用則在高速發展。”

AR/VR和自動駕駛技術之間這種發展落差讓蔡銳等人開始思考新的發展路徑。

“我們選擇創業方向的標準主要有兩點，項目的發展前景以及自身的技術儲備。”DeepMotion CTO李誌偉向車東西介紹道，“相較而言，自動駕駛技術是社會的剛需，也最能改變世界。”

2017年春節前後，李誌偉他們在研究了多個方向後，最終選擇了自動駕駛作為自己的創業方向。開公司創業就像是蓋房子，方向與創始人隻是框架，想要發揮房子的功能，一支高質量的團隊就像牆壁一樣必不可少，而砌牆則需要資金的支持。

“我們四個都不是土豪，”提起創業之初的資金來源，蔡銳並沒有遮遮掩掩，他坦言在公司成立前就拿到了投資。

蔡銳告訴車東西，在確定了創業方向後，他們借助身邊的朋友將項目BP送到了一些投資人手裏，然後就約著和投資人見麵。“那天我們約了兩家投資方，中午一家晚上一家，”蔡銳說道，“結果兩家投資方都在當天確定要投。”

DeepMotion後拿了晚上那家資方的數百萬美元天使輪投資，有了資金支持後，蔡銳、李誌偉、楊奎元、張弛四人在上半年陸續離職，從AR圈跨入到了AV圈(Autonomous Vehicle)。

今年7月份，DeepMotion正式成立，並逐漸擴張到了目前30人的團隊規模，其中全職與實習生的比例大概一半一半。

出身微軟HoloLens功臣他們用3個攝像頭搞定自動駕駛(2)

提起微軟，大部分人的第一反應都會是word、excel、ppt這些辦公軟件。那麼這支從微軟出來的隊伍，為何能夠做自動駕駛技術呢?

“我們是國內唯一兩個參與Hololens軟件算法研發的研究員。”李誌偉這樣向車東西說道。CEO蔡銳和CTO李誌偉參與過微軟旗下很多項目，但是提起之前的工作，他們最引以為傲項目還是微軟的明星AR產品—Hololens。

出身微軟HoloLens功臣他們用3個攝像頭搞定自動駕駛(3)

在項目期間，李誌偉主要負責Hololens 6自由度相機追蹤技術，采用了攝像頭+IMU慣導模塊的VI-SLAM技術方案，解決的是AR頭盔的空間位置與姿態問題。與他搭班的蔡銳負責的則是場景重建技術，即用頭盔上的深度攝像頭去重建外界物體的幾何模型，從而將虛擬的畫麵疊加到真實環境中去，實現AR效果。

首席科學家楊奎元和研發總監張弛雖然沒有參加Hololens項目，但兩人在微軟參與了很多的AI和3D立體視覺相關項目。具體點說，楊奎元研究的是如何用深度學習等AI技術，來幫助Bing搜索、微軟小冰等產品實現圖片識別與搜索功能。在楊奎元的幫助下，微軟必應團隊構建了10億級圖像理解平台。

張弛負責的是3D立體視覺，即通過對多個攝像機拍攝的畫麵進行處理，來恢複出場景的3D幾何結構。讀博士期間，張弛參加了多個立體視覺方麵的評測競賽，也拿到過幾個第一。

所以總結起來說，DeepMotion的四個創始人在基於計算機視覺的定位、識別、三維場景重建技術，基於AI技術的圖像識別等技術方麵有著深厚的積累。“之前的技術積累與自動駕駛技術強相關，區別無外乎是應用的領域與具體形式不同罷了。”李誌偉總結道。

二、產品：先做一部分技術

從宏觀上來說，可以粗略地將自動駕駛係統分為地圖定位、感知、規劃、控製等部分。

其工作原理即先確定自己的位置並通過高精地圖來規劃一個行駛路線，在行駛中通過感知係統來探測周邊的環境，隨後計算模塊則根據本車與其他交通參與者的運動信息，計算出車輛應該采取的動作，隨後再通過控製係統，讓汽車實現加減速和轉向等具體動作。

按照這個分類，DeepMotion鎖定的是地圖定位與感知部分，其設計了一套基於攝像頭與GPS、IMU等傳感器融合的低成本方案，可以為無人車提供環境感知、高精地圖繪製以及高精定位三大能力。

車東西在DeepMotion的辦公室看到了其自主設計的硬件模塊，並觀看了整套係統的Demo視頻。從實物來看，其硬件係統的體積還比較大，上麵安裝有三個攝像頭、一套GPS和IMU模塊，以及一塊自研的FPGA計算板卡。

出身微軟HoloLens功臣他們用3個攝像頭搞定自動駕駛(4)

DeepMotion CTO李誌偉告訴車東西，這攝像頭陣列、GPS、IMU等傳感器是嚴格同步的。FPGA提供了低成本的深度學習計算能力，實現了實時、智能的傳感器控製算法。

DeepMotion方麵認為，其係統在感知部分有兩大優勢，一是能夠實現像素級的感知能力，二是能夠對世界進行3D重構。

出身微軟HoloLens功臣他們用3個攝像頭搞定自動駕駛(5)

在其演示的Demo中，除了精準的像素級語義分割外，車東西還觀察到DeepMotion的感知畫麵上顯示的是一3D的城市場景，場景中的汽車是一個個立方體，而非一個個綠框。而最為重要的是，這個場景還能左右進行旋轉，以及切換到俯視圖視角。

出身微軟HoloLens功臣他們用3個攝像頭搞定自動駕駛(6)

那麼這種像素級的感知能力，以及3D場景重建技術對自動駕駛技術來說有什麼用呢?

在DeepMotion研發總監張弛看來，自動駕駛汽車對外部信息掌握的越詳細，其就越能夠做出最佳的駕駛決策。像素級感知係統可以識別出樹木、柵欄以及路牙等更多的物體，而3D場景重構則意味著能讓無人車以20cm的精度準確知道自己與道路上其他交通參與者的運動關係，從而做出更好的駕駛決策。

不過需要指出的是，感知係統的識別精細度越高、識別的內容越豐富，其對於計算能力的需求自然也越高。

DeepMotion研發總監張弛也向車東西坦言，上述Demo演示的部分算法確實需要較大的計算量，因此是在英偉達TX2上進行運算的，目前還沒有完全放到FPGA計算模塊裏。

“我們也在著手對這部分算法進行簡化，未來會逐步搬到FPGA上麵去。”張弛補充道。

感知能力之外，DeepMotion這套係統的另一個功能以及優勢，則是其能夠采集高精地圖並幫助無人車實現高精定位。

硬件上，采集高精地圖依靠的是三個攝像頭、GPS與IMU模塊。攝像頭拍攝到道路畫麵後，設計好的軟件會從畫麵中提取出車道線、路牌、道路邊界等關鍵信息。而融合了視覺、GPS信號和IMU慣導輸出的SLAM算法，則負責提供構建地圖必須的精確的位置信息。

出身微軟HoloLens功臣他們用3個攝像頭搞定自動駕駛(7)

當有了高精地圖後，無人車在行駛時可以將采集到的圖像與高精地圖中的輔助定位信息進行比對，再結合著GPS與IMU慣導模塊，來確定車輛的的精確位置，例如在道路的哪條車道裏麵，從而實現高精定位。

三、商業規劃：高精地圖有望明年商用

第二部分已經提及，DeepMotion目前采取的是先做一部分自動駕駛技術的發展路徑，而非是一家全棧式自動駕駛方案提供商。

目前，全球的自動駕駛初創主要兩種商業路徑，一是做完整的方案提供給Tier1供應商或是車廠，但是這條路徑要求技術具有高成熟度，並且時間漫長，並且還麵臨著Tier1自由自動駕駛技術的激烈競爭。

因此穀歌Waymo、Uber等公司想出了另外一條路徑，即與車廠合作來生產符合質量要求的自動駕駛汽車，運營一支自動駕駛車隊，直接為消費者提供出行服務。

出身微軟HoloLens功臣他們用3個攝像頭搞定自動駕駛(8)

很明顯，不做全棧式解決方案，也就意味著DeepMotion現階段並無法往這兩條路徑上靠。那麼他們這種發展模式的商業路徑又是如何呢?

“TOB，我們目前是一家TOB公司。”DeepMotionCEO蔡銳向車東西說道。在他看來，DeepMotion目前最大的商業模式就是將現有的感知、高精地圖和高精定位技術方案輸出給其他有需要的公司。

“至少在我們看來，國內沒有第二家有這種精確的像素級的感知能力，並且還能實現3D場景重建的方案。”談及為何能將技術賣出去時，蔡銳也說的直截了當。

蔡銳認為，雖然搞自動駕駛技術的方案商、車廠或是Tier1也都自行在做上述三大部分功能，但是由於團隊基因與技術積累問題，各家不一定每個部分都強，因此DeepMotion希望將自己的長處輸出出去。

“我們與很多業內公司交流過，”蔡銳說道，“他們看好我們的技術，尤其是高精地圖與高精定位部分的能力。”從蔡銳的話中能夠看出，DeepMotion的高精地圖與高精定位功能在眼下有著更強的市場需求。

蔡銳告訴車東西，他們已經與一些地圖商進行了積極接觸，對方對這種利用攝像頭+GPS+IMU的低成本生產方案非常感興趣，目前DeepMotion正在與其進行技術論證，並有望在2018年實現商業落地。

據悉，圖商或自動駕駛公司一般都在用搭載有激光雷達、高精度RTK定位等設備的地圖采集車來製作高精地圖，但是上述設備售價高昂，一輛采集車動輒百萬甚至數百萬元，因此各家的車隊規模都比較小，無法大規模采集數據，更何況實時更新數據了。

出身微軟HoloLens功臣他們用3個攝像頭搞定自動駕駛(9)

而一旦DeepMotion的技術通過論證，不僅圖商可以迅速組建一支大規模的采集車隊，並且也讓這套采集方案有了眾包的可能—即將其部署到大量的社會車輛上，讓其在每天的日常行駛中源源不斷地采集數據。

不過眾包地圖也並非是拚湊幾個硬件那麼簡單。

“對於眾包高精地圖方案，車端計算和雲端都是是必不可少的。”DeepMotion研發總監張弛補充道。“雲端算法通過全局優化，將收取到的零散的地圖數據整合成一張完整的高精地圖，這是相當複雜的一件事。雖然我們已經攻克算法難題，但工程實現上還有很多工作要做。”

結語:自動駕駛領域的細分與整合

最近，車東西觀察到全球自動駕駛領域一個明顯的趨勢是一部分創業公司正在加快向巨頭靠攏，例如智行者與京東綁在了一起開發自動駕駛物流車、地平線站到了英特爾陣營、德爾福收了nuTonomy等案例都說明了這一點。

但在整合的同時，另一部分自動駕駛初創們也在日益朝著更加細分的領域前進，例如馭勢科技選擇了做低速無人觀光車、禾多科技推出了名為軒轅的自動駕駛車輛開發平台，而今天的主角，DeepMotion深動科技則聚焦在了感知、地圖與定位模塊。

在車東西看來，自動駕駛領域裏這種整合與細分並存的趨勢在未來幾年內也會進一步加強，對於創業公司來說，在細分領域做到第一後向巨頭靠攏，未嚐不是一個成功退出的案例。

我要分享：

上一篇：智創巔“封” AI+移動媒體大會5月4日開幕穀歌、微軟人工智能大咖將雲集成都 下一篇：2017年微軟“編程一小時”讓你家娃也能變身編程達人！

出身微軟HoloLens功臣他們用3個攝像頭搞定自動駕駛

相關資訊

電腦問答

IT資訊欄目

最新熱門遊戲

微軟資訊推薦

微軟資訊熱門排行

出身微軟HoloLens功臣 他們用3個攝像頭搞定自動駕駛

相關資訊

電腦問答

IT資訊欄目

最新熱門遊戲

微軟資訊推薦

微軟資訊熱門排行

出身微軟HoloLens功臣他們用3個攝像頭搞定自動駕駛