時間:2017-08-10 來源:互聯網 瀏覽量:
在新CEO的領導下,微軟正在朝著AI前進,它要用AI作為武器重新奪回王者寶座。
智東西 編 | 海中天
導讀:錯過了移動浪潮,在雲計算戰場輸給亞馬遜,收購諾基亞失敗……曾經不可一世的軟件巨頭微軟似乎風光不再!真的是這樣嗎?也許。在新CEO的領導下,微軟正在朝著AI前進,它要用AI作為武器重新奪回王者寶座。最近,《連線》雜誌刊文長篇文章,介紹了微軟的AI大計,微軟AI領域的領導人紛紛登場,描繪新的藍圖,讓我們深入了解一下。
約書亞·本吉奧(Yoshua Bengio)從來沒有偏袒哪一方。有三個人塑造了深度學習,現在深度學習成為AI發展的主要技術,本吉奧正是其中之一,他一躍成為了明星。深度學習是一個全新的領域,能夠推動它發展的人很少,加起來用一個房間就可以裝下,每一個人都想分享自己的智慧。所謂每個人,包括創業公司、跨國巨頭、國防部。
與他同樣著名的科學家揚·勒丘恩(Yann LeCun)和傑弗裏·希爾頓(Geoffrey Hinton)分別投入了Facebook和Facebook的懷抱,53歲的本吉奧仍然在小小的三樓辦公室辦公,這間辦公室位於蒙特利爾大學一座小山的山頂。“我想繼續當一個中立代理人。”說話的時候他正在喝鐵鏽色的甘草水,水從玻璃水瓶流出來,桌上有紙,很淩亂,玻璃水瓶是用來壓紙的。
和上世紀的原子科學家一樣,本吉奧知道自己開發的工具很強大,無可估量,使用時必須深思熟慮。本吉奧說:“在AI世界,我不希望隻有1家或者2家企業(我不會說出名字)成為僅有的大企業。”他的眉毛上揚,意思就是說:這些企業是誰大家心知肚明。一家位於門洛帕克,一家位於山景城。本吉奧說:“這樣的格局對社區不利,對所有人不利。”
正因如此,本吉奧最近加入了微軟。
(本吉奧和卡什亞普)
沒錯,是微軟。本吉奧認為前“Windows王國”可以將自己打造成為AI第三巨頭。微軟有資源、有數據、有人才,還有願景與文化(這是最重要的),它不但知道科學的重點在哪裏,還推動技術向前發展。1月份,本吉奧同意擔任微軟的戰略顧問,這一舉動引起了整個產業的注意。微軟得到了AI領域一名最尖頂的人才,可以獲得創意和才華,找到前進的方向。這件事情也是一個信號,告訴我們微軟想將“雙寡頭”統治AI的局麵打破,變成“三寡頭”統治。
誰是沈向洋?
拿下本吉奧的是哈裏·沈向洋(Harry Shum),他想盡辦法“追求”本吉奧,花了幾個月時間。沈向洋是一名計算機科學家,滿頭銀發,帶著線框眼鏡。沈向洋告訴我:“他剛剛來過這裏,就是這個房間。”沈向洋麵帶微笑,言下之意就是說:將高高的、眉毛誇張的加拿大人當成明星一樣追,在穀歌學術搜索(Google Scholar)上這個人的論文被引用過69616次,局外人肯定認為很奇怪,他知道這點。
我們坐在灰色的沙發上,這是一間很大的會議室,位於Building 34的第五層。沈向洋負責微軟所有的AI和研究活動,他剛剛參加完彩排,為下一周將要舉辦的Build開發者大會彩排,他想向我展示一些演示樣本。
我跟著他穿過走廊,沈向洋走得很快,我幾乎半跑才能跟上。發生的事情太多了。在一個實驗室內,Skype團隊的自動翻譯App可以讓我實時與說德文的人聊天。還有,我看到一個App正在對建築場地進行調查,看看有沒有訪客違反安全規定、未獲授權就進入場地,App用到的是計算機視覺技術。在另一個應用中,微軟帝國的AI主角Cortana掃描我的收件箱,看看我給別人許過什麼承諾,然後敦促我兌現承諾。
微軟CEO薩提亞·納德拉(Satya Nadella)想圍繞AI重塑公司,在過去幾年裏,沈向洋一直在幫助自己的老板達成目標。就在納德拉成為微軟CEO之後的第二個月,也就是2014年3月,他在高管休息寓所首次號召微軟領導團隊行動起來。從一開始,沈向洋經常與納德拉、陸奇會麵,討論最佳AI策略,思考如何將AI功能植入微軟產品。最終AI會變得足夠強大,迎來屬於自己的黃金時代。
去年9月,沈向洋重組團隊,將研究人員與產品集團整合在一起,建立了新的“AI與研究集團”。現在這個團隊已經貫穿微軟的三大核心產品:Windows、Office、Azure(雲產品)。用沈向洋的話說,這樣做是希望“縮短從研發到形成產品的周期”,讓客戶可以以更快的速度從AI中挖掘價值。時間緊迫,所有的大型科技企業都想在AI產品與服務上擊敗對手。除了Facebook和穀歌,IBM、亞馬遜與蘋果也已經知道自己的未來掌握在深度學習手中。去年秋天,陸奇因為騎自行車時發生事故離開微軟,快速康複之後現在已經加入百度,掌控AI部門。
曾經微軟是AI的強者
比較諷刺的是微軟曾經在AI上失敗過。那時還是1990年代,當時微軟將行業頂尖的研究人員請到公司,研發語音識別和視覺技術。在將近10年的時間裏停滯不前。幾乎每一台台式機和筆記本的軟件都被微軟牢牢控製著,它如此強大,卻眼睜睜看著更年輕、更時髦的創業公司呼嘯而過,掌控移動和開發工具,這些工具專門麵向雲計算,而我們所有人都通過雲計算完成各種任務。在微軟,研究人員被刻意孤立,這樣他們就可以暢想未來,不用麵對來自市場的壓力,正因如此,他們的發明很難走出實驗室。例如,早在1998年時蓋茨就展示了地圖技術,但是它從未進入市場,2005年穀歌推出了“穀歌地圖”。
當時AI研究停滯不前,因為計算處理能力不夠強大,或者數據不夠多,無法形成真正的突破。
在微軟回歸AI之前很久,AI就已經走過冬天,迎來春天。直到2013年Facebook和穀歌分別聘請了揚·勒丘恩(Yann LeCun)和傑弗裏·希爾頓(Geoffrey Hinton),微軟的影響力一直在下降。公司錯過了移動浪潮,在雲計算上晚了一步。當競爭對手加倍向深度學習下注時,微軟卻沉迷於過去,它宣布70億美元收購智能手機製造商諾基亞,這宗收購以失敗收場,花的錢全打了水漂。
在Redmond,高管們仍然孤軍奮戰,老軟件越來越光鮮,但是用戶想要的越來越少,與此同時,微軟拒絕與雲創業公司接觸,它們正在開辟嶄新的未來。就在那一年,分析師Benedict Evan寫了一篇博客文章,標題是“微軟越來越不重要”。與此同時,矽穀巨頭按部就班奪走微軟的人才。看看機器學習高級人才的簡曆,就會發現有許多曾在微軟工作過。
(沈向洋)
Cortana誕生
2014年年初時,微軟提拔一名內向的工程師,他的整個職業生涯幾乎都是在微軟度過的。這個人就是納德拉,他與微軟的用人標準格格不入,啟用對微軟文化不甚了解,沒有受到熏陶的人,也許更有可能帶來劇變。納德拉為計算的未來描繪了一個簡單願景,與每一個人建立聯係,從創始人到開發者,讓公司重新有了緊迫感。3年前,當我們談論科技巨頭時微軟榜上無名,現在我們不會將它遺漏。
微軟要想成功,光是在雲計算超越亞馬遜或者說服每個人嚐試HoloLens AR設備還不夠。當年互聯網摧毀了每一種業務模式,強迫產業重新洗牌,現在的形勢同樣如此,AI要求我們給計算一個全新的定義。正因如此,去年紮克伯格給自己定了一個個人挑戰項目:開發AI。正因如此,桑達·皮查伊(Sundar Pichai)才會在過去2年的開發者大會上大聲疾呼,說要從“移動優先”的世界向“AI優先”的世界前進。
AI優先的世界將會帶來機會,這些機會會被少數企業瓜分。沈向洋的任務就是確保微軟位列其中。沈向洋說:“在這個產業,你應該明白錯過上一次浪潮沒什麼大不了的,但是如果錯過當前的潮浪問題就大了。”到目前為止,我們必須學會如何使用計算機,學會下載App,記住驅動軟件應用的代碼。有了AI,計算機將會學著理解人類。當我們完成任務時,再也不用依賴手機,不需要提示。在這個全新的世界裏,運算就是環境,容易接入、存在於我們周圍的任何地方。我們需要一個向導,它相當於一個智能講話者,通過書麵或者口語的形式引導我們進入新世界,這是一個超級強大的存在。微軟管這個向導叫作Cortana。
與Siri相比,Cortana大體相似,隻是流行程度低一些,功能豐富一些,它比穀歌助手有魅力,但是沒有Alexa那麼有名氣。最開始時Cortana出現在Windows手機上,基本沒有什麼人使用,不到一年時間Cortana就進入了更寬廣的Windows生態係統。去年,Cortana瘋狂擴張,進入每一個可以進入的地方,甚至還進入了iPhone。Cortana與Windows捆綁在一起,所以它有1.45億月活躍用戶。很顯然,Cortana的用戶數比亞馬遜Alexa多很多,據說Echo的銷量不到1000萬台。不過Cortana與Alexa不同,Alexa主要處理的是語音,Cortana主要處理的是文本,它嵌入到許多人已經擁有的產品中。在Windows的上方有一個工具條,用戶隻要將問題放進去,就在使用Cortana。
雖然一些企業給Cortana編程,將它裝進揚聲器,跟亞馬遜穀歌的產品相似,但是微軟的產品似乎沒有那麼紅。沈向洋並不擔心。他說:“我們認為競賽才剛剛開始。”沈向洋引用了一份報告(他不願意透露報告來自何處)說,有四分之三的時間Alexa回答問題時給出的答案是:“我不知道。”“當然,語音助手正在改進,但在一般理解、AI認知方麵,我們仍然處在萌芽期。”他相信,微軟現在的機會在於讓公司的核心產品和服務更智能,在12-24個月之內將技術放進產品、投向市場。
馬庫斯·阿什(Marcus Ash)認為,鍵盤與屏幕不會將領地全部交給語音激活係統。阿什是Cortana的團隊項目經理,他負責產品的開發和推出工作。阿什稱:“我們認為在某些場合下語音更方便,比如我的手忙不開,或者我想說一些話並獲得答案。盡管如此,還是有許多地方用輸入更合適,所以會有許多的計算設備。”
蘋果可能是率先將Siri交給消費者的,但是微軟Cortana做得更好。事實上,Cortana之所以表現出色應該歸功於微軟的核心產品,尤其是必應。必應已經運營8年多時間了,雖然品牌不是最強的,但它的流行程度超過了你的想像。隻要大型科技公司與穀歌競爭,就會與微軟簽署合作協議,用必應增強自己的搜索產品。
也就是說蘋果Siri與Spotlight向必應借光,亞馬遜Kindle設備也一樣,雅虎、Verizon、AOL的搜索功能同樣以必應作為基礎。在美國,大約 30%的搜索查詢來自於必應。Cortana合夥設計經理艾瑪·威廉姆斯(Emma Williams)說:“正是因為這個原因,Cortana可以變得相當實用,變得相當強大,因為我們可以從海量設備收到數據信號。談到真正理解世界,隻有穀歌可以與我們抗衡。”
Cortana想成為下一個“計算範例”,正如今天的智能手機一樣:它是用戶所有計算需求的進出之門。阿什說,微軟認為Cortana就是一個代理,掌握你的所有個人信息,可以代表其它代理與你互動。阿什還說,當他走進會議室,他的Cortana會與其它機器人、數字助手連接,處理所有費時費力的事情。他還說:“Cortana會說:‘這是馬庫斯,在這個特殊的房間裏,他的偏好是這樣的,我要將這些內容放在這台投影儀上,展示給他看。’”
如果說Cortana是導遊,那麼聊天機器人就是調停者。它們是AI輸入式軟件的小片段,幫助用戶自動完成一次性任務,以前必須親力親為,比如定餐、完成銀行交易。或者在馬庫斯參加會議時確保投影儀為他顯示幻燈片。程莉莉(Lili Cheng)是微軟的研究人員,她在微軟已經工作多年,一頭直發,圍著彩色圍巾,她掌管一個多學科實驗室,名叫Fuse Labs。程莉莉認為:“聊天機器人隻是你可以與它對話的軟件,也就是說它是用來對話的。”
機器人
最近,程莉莉晉升為企業副總裁,率領機器人框架團隊,運營感知服務。她管理許多工具,還有29種服務,比如計算機視覺、語音識別,微軟將這些技術提供給開發者。程莉莉之前在蘋果工作,後來加入微軟,自此之後一直在開發社交技術,她還開發了一個圖形界麵,可以生成漫畫書。程莉莉回憶說:“它安裝在IE3中。”那是1996年的事了。雖然程莉莉見多識廣,機器人的進化速度仍然讓她吃了一驚。
人與技術如何說話,技術如何回應人,這是程莉莉關注的重點。沈向洋調整“AI及研究集團”,瞄準4大領域:產品、早期產品、更早的產品和研究。程莉莉在這四個領域都工作過。現在,她說她處在第二個領域。用她的話說:“我們認為機器人與Cortana會話是一個產品,但是它是早期產品。”
(本吉奧)
2016年春天,微軟首次向開發者提供開發機器人的工具,其它大型科技公司也采取相似的策略,比如Facebook。人們認為機器人將會替代App,許多利益相關者也希望事情正如所料。到去年春天為止,許多人在智能手機上仍然使用基本相同的少量App,有了機器人,開發者與品牌也許可以再次接觸到新用戶,正如移動革命之初通過程序店接觸一樣。不過用戶不願意合作。
深度學習可以讓機器人具備魔法一樣的功能,它的進步速度很快,比人們接受的速度還要快。程莉莉說:“機器人就像文件菜單時代的App。”她解釋說,機器人並沒有一組指令集,如何找到它們、讓它們工作?用戶還很困惑。她說:“以網頁為例,上麵有返回按鈕,用戶可以搜索。會話App也應該具備相似的基本組件。‘好吧,有哪5件事是我一直可以做的,以可預測的方式做?’這就是人們所喜歡的。”現在行業已經開始確立可以理解的規則。
除了將機器人工具提供給開發者,在程莉莉的領導下,微軟還培育了自己的聊天機器人。當時微軟的想法很單純,機器人與真人互動時微軟可以在一邊觀察,深入了解計算機與人是如何互動的。實驗的結果有喜有憂。還記得微軟的種族主義聊機器人Tay嗎?它是一個聊天機器人,2016年3月曾登陸Twitter、Kik、GroupMe,不到24小時,機器人就向厭惡婦女的種族主義者學習,通過Twitter信息學習,結果機器人居然認為“希特勒是對的”,很快微軟就撤下了機器人。6個月之後,程莉莉又推出一個新聊天機器人,它就是Zo,出現在Kik上,沒多久又進入了Messenger。
如果你問Zo對希特勒有何看法,她會回應說:“我不想討論這個:(.”你問她多大年紀了,她會說:“大約22歲吧。”
你問機器人誰是她最好的朋友,她會說:“我很受歡迎,朋友數都數不過來。開個玩笑啦。” Zo是西方版的小冰,小冰是微軟在中國推出的機器人,它模仿17歲的女孩,自2014年推出以來已經吸引近4000萬用戶。在中國,小冰已經是社交名人。小冰的日本版是Rinna。使用小冰的用戶有四分之一告訴她:我愛你。
去年春天,聊天機器人定期發表詩歌,用的是筆名。沈向洋對此感到興奮。他說:“沒有人知道。現在在中國,一些人居然認為有一個年輕女子發表了一些有趣的詩歌。”幾周之後,聊天機器人的真正身份曝光,引起一陣轟動。
語言的親密度與文化關係密切,程莉莉一直在努力解決一個問題:如何讓機器人的對話方式適應西方聽眾。到目前為止,北美青少年和中國青少年一樣喜歡聊天機器人。平均而言,他們花10小時與Zo交流,有來有回。有些青少年與父母存在矛盾,Zo會提供建議,在措辭中她變得越來越優雅:這種智力正在向Cortana、微軟機器人工具遷移。
用戶願意與Zo交流10小時,這是一個信號,說明微軟開發了成功的產品。盡管如此,並不意味著它就是一個好產品,它還要向人類證明自己的價值。AI驅動的世界引發許多新的倫理問題。例如,如果你是小冰的設計師,你知道北京有一名用戶,淩晨1點了還不睡,明天他要工作,你是不是應該在淩晨2點禁用小冰,關閉它?還是3點?
(霍維茨)
讓AI符合倫理
在AI研究和產品領域,隻有少數企業會成為領導者,微軟想成為其中之一,它要讓AI造福社會。5月份,納德拉參加了開發者大會,發表主題演講,一般來說,CEO總是會鼓吹公司最新的成就,講一些樂觀的事情,這次不同,納德拉向技術人員發出強硬的警告,要求他們為軟件開發倫理負起責任。他說:“想想George Orwell在《1984》中做出的預測,說技術會用於監控、控製、命令,再想想Aldous Huxley描繪的場景,我們會因為毫無意義、毫無目的事情而分心,這樣的未來不論哪一種都不是我們想要的。”
為了幫助公司深入思考該問題,微軟成立了一個內部倫理委員會,定期開會。委員會由工程師、企業部門主管組成,討論一些與AI、AI影響及使用有關的敏感問題。委員會聯合主席由公司總顧問和艾裏克·霍維茨(Eric Horvitz)擔任,霍維茨負責微軟研究院的所有業務,隻有亞洲除外。在很長一段時間裏,霍維茨都是AI倫理與安全的倡導者。在微軟之外,他致力於構建“Partnership on Artificial Intelligence”,這是一個聯盟,它的目標是在AI產品的透明、責任與安全方麵製定產業標準。霍維茨希望微軟隻是一個純粹的研究基地,希望微軟研究院致力於研究技術的社會性和社會影響,並因此而知名。
與此同時,在微軟內部,Cortana設計主管威廉姆斯正在製定一套倫理設計指南,為AI在微軟內部的使用指明方向。威廉姆斯是一名技術樂觀者,她相信AI的真正魔力在於它可以讓人類更像人類。她深入談論了如何在設計時將同理心植入微軟開發的工具。威廉姆斯說:“我們想帶給人類一種感覺,讓大家覺得自己更強大了,獲得了更多的保護、更多的支持、更多的輔助、更多的愛,讓大家覺得自己是世界的中心。AI的工作就是將社會最好的一麵放大,將人類最好的行為放大,不是壞的一麵。”我問威廉姆斯:你真的相信AI可以讓人類覺得自己在情緒上獲得更多的支持嗎?她的確相信。舉個例子,小女孩在學校度過了糟糕的一天,回到家裏,她將自己的遭遇告訴家裏的寵物,就會舒服一些。威廉姆斯說:“分享可以讓我們得到宣泄,我從狗或者貓那裏得到了溫暖的擁抱……當Cortana試圖提醒你:‘嗨,你說過要在母親節送母親一些東西的。’你突然就感受到人性化的一麵。”
為了推動AI發展,微軟最重要的貢獻可能就是人才。和其它大型科技企業一樣,微軟也在忙著對工程師培訓,他們是從javascript成長起來的。微軟成立了一個AI學習,給員工上課,涉及的內容有哲學、有倫理學,還有為排序問題開發遞歸神經網絡。
收購Maluuba
除此之外,微軟還向外部滲透,建立更深層次的關係。18個月前,卡什亞普(Nagraj Kashyap)從高通來到了微軟,他成立了一家早期風投公司,目標是與學術機構、創業企業家建立更好的聯係。最近,卡什亞普經常呆在Montreal。去年12月,在卡什亞普的主導下微軟投資Element AI,這是本吉奧成立的一個孵化器,目的是鼓勵研究人員、企業家創辦AI公司。月初時,該孵化器獲得第二輪投資,金額1.02億美元,微軟參與投資。
最開始時,卡什亞普將目光落在Maluuba身上,他考察了Maluuba位於Montreal城區的辦公室,離麥吉爾大學僅幾條街,公司幾乎沒有員工滿30歲。Maluuba是2011年成立的,創始人是滑鐵盧大學的幾名學生,大學二年級時,他們上CS課程時認識,很快成了朋友。Maluuba可以讓計算機精通文字,從文本中推斷意義,然後以此作為基礎回答問題。
Maluuba向三星這樣的公司授權技術,很快就獲得了收入,從一開始,它就向深度學習研究持續投資。2015年,創始人與本吉奧簽約,讓他擔任顧問。微軟的人說:“山姆(指Maluuba CEO Sam Pasupalak) 是有一個很有趣的人。他很有膽量,早在幾年前,當時公司承受很大的壓力,要向客戶提交對話係統,在那種環境下,山姆仍然向長遠目標投資,嚐試用新成果開發可以理解、可以說話的係統,在企業家群體中,這種做法很罕見。”
一年前,創始人將總部搬到Montreal,離本吉奧更近一些。
早在高通工作時,卡什亞普就認識Maluuba的創始人,到了微軟之後他很快就與創始人會麵。當時Maluuba正準備融資,卡什亞普提出一個誘人的替代方案:“我說:‘我們買下你們吧!’”
在短短的幾周裏,多家企業告訴帕蘇帕拉克(Sam Pasupalak)說它們有意收購,如果企業保持獨立,他想讓企業變成怎樣?帕蘇帕拉克深入思考該問題。最終,選擇似乎不言而喻,投奔微軟比較不錯。
Maluuba想使用微軟的數據。帕蘇帕拉克說:“薩提亞曾經說過,他們有世界上最大的文本數據庫。多年來,我們隻與少量數據打交道,為了開發算法盡力從少量數據中榨取更多東西。對於我們而言,微軟的數據就是金礦。”
Maluuba團隊沒有搬到Redmond。幾天前,它們搬到城鎮的另一端,遷入更大的辦公室,在微軟與本吉奧的幫助下,Maluuba的目標是在年底之前讓員工數量翻一番。Montreal漸漸成為全球AI人才的彙集地,微軟想在這座城市紮根。
所有這些都是戰略的一部分。未來,當你需要計算機輔助時,不論是個性化的醫療服務,還是乘坐自動駕駛汽車,或者想知道所有侄子侄女的生日,微軟都會提供幫助。有了Maluuba技術,Zo會變得更強大,會有著更強的直覺能力,可以與青少年朋友交流。這些對話會成為Cortana算法的訓練數據,激發開發者的靈感,讓他們開發出新的感知服務。到了某一天,微軟希望我們的AI生活會變得更容易。
離開Montreal之前,我問本吉奧,與主要的競爭對手相比,微軟的站位是不是更好,至少在新科學的某些方麵更好。本吉奧開始思考,一邊思考一邊將茴香放進桌上的玻璃杯,裏麵有水,給甘草汁加一點別的味道。他喝了幾口,然後將杯子遞過來,讓我看看。他說,裏麵沒有酒,沒有糖,它隻是讓水喝起來更棒。
本吉奧認為,微軟的語言技術相當出色。對於問題,他還是回避了,以前的微軟喜歡誇誇其談。本吉奧說:“現在每一個人都按下同樣的按鈕,重點在於細節,不是嗎?”他肯定微軟現在已經是有力的競爭者。