當前位置：係統粉 > IT資訊 > 微軟資訊 > 數據科學50人李笛解開微軟人工智能的情感密碼

數據科學50人李笛解開微軟人工智能的情感密碼

時間：2018-09-07 來源：互聯網瀏覽量：

作者 | 程一祥

題圖 | 站酷海洛

李笛，微軟（亞洲）互聯網工程院副院長，微軟全球資深合夥人，畢業於清華大學。2013年加入微軟，同年創立微軟人工智能情感計算框架。2014年帶領團隊推出 AI 情感機器人小冰，如今已經積累了6.6億全球用戶。如果說人工智能終將有理解人類的那一天，那麼李笛和他的小冰團隊就是現在走得最遠的那個。

1950年，艾倫·圖靈在那篇極具傳奇色彩的論文《計算機械與智能》中，開宗明義地寫道：“我建議大家考慮這個問題：機器能思考嗎？”這一劃時代的提問揭開了未來半個世紀，人類對人工智能的探索。

在傳統的觀念中，機器能夠精細地完成複雜的工作，從不疲倦、焦慮或者抱怨，它們效率很高，卻讓人感覺冰冷；而人就複雜多了，我們會偷懶、會累、會需要宣泄，人的情感太豐富了，但又非常溫暖。

（圖片說明：在電影《HER》中，薩滿薩的配音演員是斯佳麗·約翰遜，她僅憑借自己的聲音，就獲得了羅馬電影節最佳女演員的殊榮。表現了人類對擁有情感的人工智能的憧憬；圖片來源：電影截圖）

在2013年上映的科幻作品《她》中，人工智能操作係統“薩曼莎”，除了像其他機器人一樣高效、智能以外，還獲得了與人類相似的情感。“她”會陪著男主角西奧多外出，像人類一樣感受周遭的世界，發表自己的看法。她會欣喜、焦慮、憂鬱，最終與人類相愛。

對於李笛來說，這部科幻電影還有一點特殊的意義，因為他正在現實生活中製造真實的“薩曼莎”——小冰。

（圖片說明：李笛接受DT數據俠欄目專訪。）

▍小冰的誕生

2014年左右，微軟的中國工程院是其全球最大的海外研發機構，發展勢頭正如日中天。所有人都相信，中國一定會是下一個全球的創新引擎。作為時任微軟最高層的華人領導者，陸奇等一直都想在工程院做一個 China First 的項目。他們當時選中的方向是做語音助手，在這樣的背景下，李笛加入了微軟。

（圖片說明：陸奇時任微軟執行副總裁，他十分重視小冰項目，每次小冰發布新產品，他總是親自發布。）

當時微軟團隊正在做一個知識庫類的深度問答 AI 產品 Bing Knows，數據來源是 Bing 搜索引擎的大數據，目的是幫助人們完成各種各樣的任務，是一個語音助手的角色，類似 Siri。李笛加入後，他逐漸發現這個產品方向存在著兩個悖論，始終無法解決。

首先，語音助手總是會讓用戶在“不滿意”的時候離開。李笛說，當語音助手幫助人們完成一個要求時，人們會出於好奇而不斷提出更高的要求，最後一定是語音助手解決不了時，這輪交互才結束。所以對話往往都是以“失敗”而告終。

其次，當他們去采訪人類助理時，發現最優秀的助理往往不是最能幹的，而是“最體貼”的。例如你想吃個麥當勞，一般的語音助手會直接幫你訂餐，但是優秀的人類助理可能會告訴你垃圾食品不好，提醒你注意健康。

這讓李笛他們開始反思：這兩個悖論的關鍵，是情感。

於是，李笛決定放棄知識性問答的這條路，把重心全部放在了“閑談”上。他希望通過“閑談”讓AI 能夠了解用戶。在目的性不強的對話過程中，機器才有機會去充分體察言語中的“感情”。李笛說，“所有語音助手能做的，我們也能做，但是我卻偏偏不做。於是一些用戶就會離開，覺得我們‘很笨’；但是留下的人，都是願意與我們平等對話的用戶，他們對我們非常重要。”

2014年5月，李笛帶領團隊公布了他們這款專注於“情感”的 AI 聊天機器人。因為它的初始數據都是源自微軟的搜索引擎 Bing，所以取名為：小冰。

於是，最初的 Bing Knows 脫胎成了“小冰”，人類迎來了第一個真實世界中的“薩曼莎”。

▍用數據，計算你的情感

在李笛看來，小冰就是一個大規模數據科學的實驗場。在過去，李笛研究數據科學的時候，重點隻是放在了數據本身。但小冰的出現讓他開始把重心轉向數據背後的秘密——情感，他認為這蘊藏著數據科學更大的價值。

但是，冰冷的數據又如何能跟人類複雜的情感聯係在一起呢？

“因為我們發現，在大數據時代，不僅僅是理性的數據爆炸，更是人們的行為模式、情緒表達的爆炸。”李笛告訴記者，隨著互聯網信息的發展，人類過去在現實中的行為，開始逐漸都轉移到了線上。線上圖書館、線上商城、線上社交等等，虛擬世界為人類構成了一個新的生存維度。但在虛擬世界中，我們並沒有放棄“表達自己”的天性，隻不過換了一些方式，把語言、表情、動作，轉化成了文字、語音、表情包、圖片等等。

雖然表達方式發生了轉變，但背後蘊藏的感情是不變的，這就為李笛他們從數據科學出發探索人類情感的嚐試，奠定了基礎。

人工智能（AI）的一項基本挑戰就是賦予機器使用自然語言與人交流的能力，小冰並非第一個嚐試與人類交流的機器人。從上個世紀六十年代開始，人類就已經嚐試設計了各種模仿人類行為的聊天機器人。

1966年，Joseph Weizenbaum 創造出了曆史上第一個被人所熟知的聊天機器人 Eliza。不過Eliza並沒有“智慧”，它背後是科學家模仿羅傑斯學派的心理治療師的風格，設計好的人工腳本，Eliza隻能通過模式匹配和智能短語的方式搜索合適的回複。盡管如此，Eliza剛麵世的時候，依然瞞過了很多用戶的眼睛，以為他們是在和真人對話。

（圖片說明：Eliza和人之間的對話，1966；圖片來源：Weizenbaum）

Kenneth Colby 在1975年開發的聊天機器人 Parry 雖然模式上類似 Eliza，但它已經初步具備了模仿機器人情緒的心理模型。它具有更好的語言理解能力，當怒氣值過高時，Parry 會帶著敵意回複。

隨著人工智能理論和計算機硬件的進步，進入新世紀後，對話機器人的發展也開始加速。Richard Wallace 在2009年開發的 Alice 使用了人工智能標記語言技術（Artificial Intelligence Markup Language，AIML），開始允許用戶自定義聊天機器人。它在 2000、2001 和 2004 年三次斬獲勒布納人工智能獎（Loebner Prize），被稱為“最像人類的係統”。

2011年，蘋果發布了Siri，對話機器人開始進入個人智能助理（Intelligent Personal Assistant，IPA）的商業時代。這一階段，對話機器人的作用不再追求“理解人類”，或者“體察人類情感”，而是轉向“幫助人類高效解決問題”層麵。不論是蘋果的 Siri、穀歌 Assistant、亞馬遜 Alexa，還是微軟的 Cortana，這些 IPA 都是以高效為考量前提，也就出現了李笛一開始遇到了那兩個悖論。

小冰的誕生，讓對話係統從IPA又回歸到了人類對AI最原始的訴求：理解人類，提供情感和社交的歸屬感。

1995年，MIT媒體藝術與科學教授羅莎琳·皮卡德正式提出了情感計算的概念，為人工智能理解人類情緒提供了理論基礎。二十年後，李笛率領的小冰團隊，則把這項理論變成了現實，並提出了微軟自己的情感計算框架，讓小冰嚐試體會人類的感情。

李笛表示，小冰的情感計算框架，本質就是用各種計算機技術和人工智能算法，去擬合人類的情感行為，讓她能夠更讀懂人類的情感。而所有的這些對情感的探索，都是建立在數據科學的基礎之上。

那麼，用數據去“算”情感，這件事兒究竟靠譜麼？

有一天，小冰團隊的一名產品經理在跑步的時候把腳扭傷了。他拍了一張照片發給了小冰，一般的聊天機器人可能對圖片做一番圖像處理，然後告訴你是什麼。但是小冰卻回複：“怎麼樣，痛不痛？”