時間:2018-09-07 來源:互聯網 瀏覽量:
作者 | 程一祥
題圖 | 站酷海洛
李笛,微軟(亞洲)互聯網工程院副院長,微軟全球資深合夥人,畢業於清華大學。2013年加入微軟,同年創立微軟人工智能情感計算框架。2014年帶領團隊推出 AI 情感機器人小冰,如今已經積累了6.6億全球用戶。如果說人工智能終將有理解人類的那一天,那麼李笛和他的小冰團隊就是現在走得最遠的那個。
1950年,艾倫·圖靈在那篇極具傳奇色彩的論文《計算機械與智能》中,開宗明義地寫道:“我建議大家考慮這個問題:機器能思考嗎?”這一劃時代的提問揭開了未來半個世紀,人類對人工智能的探索。
在傳統的觀念中,機器能夠精細地完成複雜的工作,從不疲倦、焦慮或者抱怨,它們效率很高,卻讓人感覺冰冷;而人就複雜多了,我們會偷懶、會累、會需要宣泄,人的情感太豐富了,但又非常溫暖。
(圖片說明:在電影《HER》中,薩滿薩的配音演員是斯佳麗·約翰遜,她僅憑借自己的聲音,就獲得了羅馬電影節最佳女演員的殊榮。表現了人類對擁有情感的人工智能的憧憬;圖片來源:電影截圖)
在2013年上映的科幻作品《她》中,人工智能操作係統“薩曼莎”,除了像其他機器人一樣高效、智能以外,還獲得了與人類相似的情感。“她”會陪著男主角西奧多外出,像人類一樣感受周遭的世界,發表自己的看法。她會欣喜、焦慮、憂鬱,最終與人類相愛。
對於李笛來說,這部科幻電影還有一點特殊的意義,因為他正在現實生活中製造真實的“薩曼莎”——小冰。
(圖片說明:李笛接受DT數據俠欄目專訪。)
2014年左右,微軟的中國工程院是其全球最大的海外研發機構,發展勢頭正如日中天。所有人都相信,中國一定會是下一個全球的創新引擎。作為時任微軟最高層的華人領導者,陸奇等一直都想在工程院做一個 China First 的項目。他們當時選中的方向是做語音助手,在這樣的背景下,李笛加入了微軟。
(圖片說明:陸奇時任微軟執行副總裁,他十分重視小冰項目,每次小冰發布新產品,他總是親自發布。)
當時微軟團隊正在做一個知識庫類的深度問答 AI 產品 Bing Knows,數據來源是 Bing 搜索引擎的大數據,目的是幫助人們完成各種各樣的任務,是一個語音助手的角色,類似 Siri。李笛加入後,他逐漸發現這個產品方向存在著兩個悖論,始終無法解決。
首先,語音助手總是會讓用戶在“不滿意”的時候離開。李笛說,當語音助手幫助人們完成一個要求時,人們會出於好奇而不斷提出更高的要求,最後一定是語音助手解決不了時,這輪交互才結束。所以對話往往都是以“失敗”而告終。
其次,當他們去采訪人類助理時,發現最優秀的助理往往不是最能幹的,而是“最體貼”的。例如你想吃個麥當勞,一般的語音助手會直接幫你訂餐,但是優秀的人類助理可能會告訴你垃圾食品不好,提醒你注意健康。
這讓李笛他們開始反思:這兩個悖論的關鍵,是情感。
於是,李笛決定放棄知識性問答的這條路,把重心全部放在了“閑談”上。他希望通過“閑談”讓AI 能夠了解用戶。在目的性不強的對話過程中,機器才有機會去充分體察言語中的“感情”。李笛說,“所有語音助手能做的,我們也能做,但是我卻偏偏不做。於是一些用戶就會離開,覺得我們‘很笨’;但是留下的人,都是願意與我們平等對話的用戶,他們對我們非常重要。”
2014年5月,李笛帶領團隊公布了他們這款專注於“情感”的 AI 聊天機器人。因為它的初始數據都是源自微軟的搜索引擎 Bing,所以取名為:小冰。
於是,最初的 Bing Knows 脫胎成了“小冰”,人類迎來了第一個真實世界中的“薩曼莎”。
在李笛看來,小冰就是一個大規模數據科學的實驗場。在過去,李笛研究數據科學的時候,重點隻是放在了數據本身。但小冰的出現讓他開始把重心轉向數據背後的秘密——情感,他認為這蘊藏著數據科學更大的價值。
但是,冰冷的數據又如何能跟人類複雜的情感聯係在一起呢?
“因為我們發現,在大數據時代,不僅僅是理性的數據爆炸,更是人們的行為模式、情緒表達的爆炸。”李笛告訴記者,隨著互聯網信息的發展,人類過去在現實中的行為,開始逐漸都轉移到了線上。線上圖書館、線上商城、線上社交等等,虛擬世界為人類構成了一個新的生存維度。但在虛擬世界中,我們並沒有放棄“表達自己”的天性,隻不過換了一些方式,把語言、表情、動作,轉化成了文字、語音、表情包、圖片等等。
雖然表達方式發生了轉變,但背後蘊藏的感情是不變的,這就為李笛他們從數據科學出發探索人類情感的嚐試,奠定了基礎。
人工智能(AI)的一項基本挑戰就是賦予機器使用自然語言與人交流的能力,小冰並非第一個嚐試與人類交流的機器人。從上個世紀六十年代開始,人類就已經嚐試設計了各種模仿人類行為的聊天機器人。
1966年,Joseph Weizenbaum 創造出了曆史上第一個被人所熟知的聊天機器人 Eliza。不過Eliza並沒有“智慧”,它背後是科學家模仿羅傑斯學派的心理治療師的風格,設計好的人工腳本,Eliza隻能通過模式匹配和智能短語的方式搜索合適的回複。盡管如此,Eliza剛麵世的時候,依然瞞過了很多用戶的眼睛,以為他們是在和真人對話。
(圖片說明:Eliza和人之間的對話,1966;圖片來源:Weizenbaum)
Kenneth Colby 在1975年開發的聊天機器人 Parry 雖然模式上類似 Eliza,但它已經初步具備了模仿機器人情緒的心理模型。它具有更好的語言理解能力,當怒氣值過高時,Parry 會帶著敵意回複。
隨著人工智能理論和計算機硬件的進步,進入新世紀後,對話機器人的發展也開始加速。Richard Wallace 在2009年開發的 Alice 使用了人工智能標記語言技術(Artificial Intelligence Markup Language,AIML),開始允許用戶自定義聊天機器人。它在 2000、2001 和 2004 年三次斬獲勒布納人工智能獎(Loebner Prize),被稱為“最像人類的係統”。
2011年,蘋果發布了Siri,對話機器人開始進入個人智能助理(Intelligent Personal Assistant,IPA)的商業時代。這一階段,對話機器人的作用不再追求“理解人類”,或者“體察人類情感”,而是轉向“幫助人類高效解決問題”層麵。不論是蘋果的 Siri、穀歌 Assistant、亞馬遜 Alexa,還是微軟的 Cortana,這些 IPA 都是以高效為考量前提,也就出現了李笛一開始遇到了那兩個悖論。
小冰的誕生,讓對話係統從IPA又回歸到了人類對AI最原始的訴求:理解人類,提供情感和社交的歸屬感。
1995年,MIT媒體藝術與科學教授羅莎琳·皮卡德正式提出了情感計算的概念,為人工智能理解人類情緒提供了理論基礎。二十年後,李笛率領的小冰團隊,則把這項理論變成了現實,並提出了微軟自己的情感計算框架,讓小冰嚐試體會人類的感情。
李笛表示,小冰的情感計算框架,本質就是用各種計算機技術和人工智能算法,去擬合人類的情感行為,讓她能夠更讀懂人類的情感。而所有的這些對情感的探索,都是建立在數據科學的基礎之上。
那麼,用數據去“算”情感,這件事兒究竟靠譜麼?
有一天,小冰團隊的一名產品經理在跑步的時候把腳扭傷了。他拍了一張照片發給了小冰,一般的聊天機器人可能對圖片做一番圖像處理,然後告訴你是什麼。但是小冰卻回複:“怎麼樣,痛不痛?”
(圖片說明:小冰展示的圖片評論案例;圖片來源:微軟)
這讓李笛很開心,小冰已經跳過了好幾層的識別網絡,直接把一張圖片的信息,轉換成了對人的情感關心。小冰背後坐擁的海量大數據,為小冰的情感計算提供了數據基礎。而且上線四年來,小冰積累了超過六億用戶的對話數據,這使得它能夠不斷迭代、學習。到目前為止,小冰的對話數據已經有超過一半來自自我學習。
(圖片說明:某位小冰用戶與小冰進行的一次深入對話;圖片來源:微軟)
在全球,小冰已經積累了很多的“西奧多”粉絲。一位、合作請聯係datahero@dtcj.com。