時間:2018-08-11 來源:互聯網 瀏覽量:
李根 發自 凹非寺
量子位 報道 | 公眾號 QbitAI
太陽底下無新事,趨勢變化不是無跡可尋。
一次次科技轉關大同小異,無非錢動人動,最終潮水洶湧成勢能。
2017年何小鵬由投資人親任董事長,小鵬汽車便開啟錢至人至加速度,上周又剛官宣一輪40億元新融資,整體估值超250億元。
同時,隱而未宣的是又有AI人才加盟。
這一次,微軟計算機視覺科學家郭彥東,從微軟總部而來,任職小鵬汽車AI產品部計算機視覺首席研究員。
郭彥東將承擔的,是小鵬智能車AI視覺及感知相關的研發到應用。
這位80後科學家拿什麼hold住?
△ 小鵬汽車AI產品部計算機視覺首席研究員郭彥東
郭彥東其人雖然年輕,但郭彥東卻是這波AI浪潮中最“生逢其時”的一代人。加入小鵬汽車前,郭彥東在AI及CV相關的研發已有14年之久。
郭彥東本科和碩士均學成於北京郵電大學,曾在湯姆森研究院(後更名為Technicolor)和中國移動任職,參與過中國第一代甚低碼率可視電話的研發,也是中國移動彩信,手機電視,手機閱讀等等企業標準/國家標準的製定者之一。
其後拿到普度大學全額獎學金赴美讀博,師從美國工程院院士Jan P. Allebach與Charles A. Bouman。博士期間多項視覺領域的研究成果作為關鍵技術被應用在GE、HP等公司。
從博士畢業起,他就成為微軟美國總部研究員,專注機器視覺和圖像處理技術,是微軟智能識別服務的關鍵貢獻者。
在微軟期間,郭彥東在計算機視覺,人臉識別上的研究成果被廣泛應用在微軟圖像搜索(image.bing.com)、人工智能雲服務(Microsoft Cognitive Service)、情感計算小冰,知識圖譜(Microsoft Knowledge Graph)等微軟的視覺相關產品中。
特別是2016年與2017年,郭彥東將大數據、知識圖譜,以及深度學習的方法有機融合在一起,並和同事一起發起組織了微軟百萬名人識別競賽MS-Celeb-1M——後來被業內稱為人臉識別“世界杯”,在業界影響巨大。
△ 郭彥東學術論文列表節選
更關鍵的是,2016年開始,郭彥東領導了微軟互聯互通車項目的視覺感知部分,致力於將微軟的視覺技術推廣到汽車領域,主導研究開發了基於視覺的車內、車外感知功能。
也是如此專注的履曆,郭彥東成為何小鵬全球挖角之旅中的重要專家人選。
為何要挖CV科學家?在小鵬汽車,郭彥東一樣名校博士、履曆閃光的人都被稱作專家。既是出於人才的尊重,也為體現產學研一提的決心——不再是科學家科研、工程師落地的二分法模式。
而在此體係中,視覺和感知,是小鵬汽車AI研發平台下一個極其重要的業務方向。
小鵬汽車從創立之初,就以“智能車”為目標,而視覺與感知是智能的基礎與前提。智能化就是真正的理解車外與車內的場景,
△ 自動駕駛L0-L5
小鵬也對外多次介紹過,這將是一條從L2到L3,再最終邁入L4、L5的自動駕駛實現之路。
實際上,當前見怪不怪,有些輔助駕駛功能,作為獨立模塊,多可以有供應商提供了。
但這家造車新勢力寧願走得更難,希望自建AI視覺和感知研發,以此將AI用戶體驗與車輛安全熔於一爐,從而打造企業產品核心差異化。
郭彥東舉例說,如將智能感知與決策把獨立的輔助駕駛功能有機結合起來,才會打造出真正的智能車,才能夠提高用戶的體驗。
更具體而言,一方麵是車外的一些感知,如天氣、場景、以及事件的識別和預測。
△ 小鵬汽車G3車頂上的360°攝像頭
“一個司機在路上看到一輛校車停在路邊,車門打開了,他會知道可能有小朋友從車裏跑出來。但是什麼時候我們的輔助駕駛功能車,搭載了智能模塊以後也能做出類似的判斷呢?這才是我們樂於看到的事情。”
車外場景之外,車內的感知對用戶體驗也同等重要。
如乘客、司機的識別,通過麵部狀態監控對注意力、情緒的識別,對安全和體驗都尤為關鍵。
在郭彥東看來,麵部監控對於L2到L3的跨越非常關鍵。
L2級輔助駕駛,需要手不離方向盤,以保持對車控製;而L3則手可離方向盤,但是需要用戶隨時接管方向盤。讓用戶隨時能夠恢複接管的前提就是需要知道用戶的狀態,提醒用戶保持注意力集中。有統計數據表明,在輔助駕駛的情況下,用戶反而會傾向於降低關注度。
“如果在駕駛過程中,讓傳感器實時感知,能夠更好理解司機狀態,不斷做出反饋,那L2到L3之間過渡的核心問題便能得到安全性高體驗性地解決。”
如此方案,聽起來容易理解,但做起來其實並不容易。
小鵬汽車內部,已形成三步走共識。
△ AI Car
智能車係統三步走按照數據量的三階段:冷啟動,係統模型訓練,最後量產車場景迭代,將AI智能車係統分三步走。
第一步,無車/少車情況下,數據冷啟動。
郭彥東認為可以依靠4方麵,1)互聯網大數據、2)仿真大數據、3)自有車隊或測試車隊大數據,4)中國真實用戶大數據。
這位曾經參與微軟Bing圖片搜索核心技術研發的科學家說,互聯網數據量非常之大,對早期算法的演進意義重大。
但也不是“完美無瑕”,畢竟這部分數據可能跟無人駕駛、智能車需求的數據分布不盡一致,標注也存在困難,需要用遷移學習的方式將互聯網的結構化信息轉移轉換,賦能於車。
於是為了驗證遷移學習的效果,同時也得到更多,更真實的數據,也需要關注仿真大數據、自有車隊數據,以及用戶真實數據等其他3個渠道。
總之,數據是深度學習之關鍵,也是智能車係統模型優劣的關鍵。
數據經過冷啟動階段,接下來就是搭建AI平台,訓練深度學習模型。
郭彥東強調,在智能車的場景中,往往最有價值的就是長尾(long-tail)數據。
即那些低頻場景下才能產生的數據,盡管長尾數據需要的種類、類別、數量都會非常多且有挑戰,但越多長尾數據收集,就越能讓智能車適應更多場景。
這也就要求需要有一個快速處理長尾數據能力的AI平台。業界也有很多相關的努力。
比如微軟的custom vision,郭彥東博士本人就曾參與該項目的核心研究工作,可以在樣本數很小的情況下,用非常短的時間,得到很準確的模型的。
雖然純互聯網係統平台與車用場景並不一致,技術上還有諸多挑戰,但郭彥東堅信能克服,並在量產車場景下實現更快,更精準,能夠處理長尾數據的智能閉環迭代。
作為整車廠,從無到有造車自然不易,但也是吸引郭彥東的核心“優勢”之一。
有了數據,有了AI模型訓練平台,還需要更多數據幫助迭代,而量產車正是最獨一無二的場景。
此前在Uber和特斯拉發展自動駕駛時,業內便對這種路線頗為看好,核心原因之一便是有時刻不停地真實場景下的量產車“幫助”數據迭代和模型迭代。
所以郭彥東博士認為,一旦小鵬量產車上路,雖有更大更多數據反饋方麵的繁重工作,但每一次都會讓智能車係統更出色,迭代升級會更快,用戶的反饋也能幫助智能車各項功能的調校。
這讓AI視覺科學家們渴求。
更何況,比起在美國造車,中國有更廣闊的市場空間和更獨特的路況場景及駕駛行為。
回國造車郭彥東坦承,回國參與一番事業,是每一個中國AI人才的夢想。
而且小鵬汽車所承載的市場機遇,前所未有。
有數據統計,美國汽車千人保有量是910輛,但中國千人隻有154輛。
加之經濟發展勢頭,未來5-10年的增長機遇,空間和趨勢不言自明。
郭彥東說,想要做出更具影響力的產品,讓所學技術被最多人使用,就要跳上最富潛力和前景的航海船。
小鵬汽車,對他而言就是這艘AI大航海時代的船。
當然,郭彥東也心懷教育傳承之心,雖然他已同時是北京郵電大學和電子科技大學的兼職教授,但他希望能帶領更多年輕人躬行實踐,將所學化為所用。
他說在小鵬汽車還有一項重要使命——招募更多年輕有為的人才。
從業務劃分,他認為自然可以分出個車內智能、車外環境感知、關鍵視覺技術模塊開發和模型優化與融合的招聘方向。
但更重要的是年輕、幹勁足,學習成長快,而且有自主自研的決心。
郭彥東說,拿來改和用很簡單、堅持自研很難,但最難的路也最考驗基礎、最容易造就創新。
注:中美汽車保有量數據來源
【1】“Vehicle Statistics: Cars Per Capita”. Capitol Tires.
【2】 “環境保護部發布《中國機動車環境管理年報(2017)》”. 中華人民共和國環境保護部. Retrieved 2017-11-01.
— 完 —
誠摯招聘
量子位正在招募編輯/記者,工作地點在北京中關村。期待有才氣、有熱情的同學加入我們!相關細節,請在量子位公眾號(QbitAI)對話界麵,回複“招聘”兩個字。
量子位 QbitAI · 頭條號簽約作者
վ'ᴗ' ի 追蹤AI技術和產品新動態