時間:2017-08-26 來源:互聯網 瀏覽量:
8 月 22 日,微軟全球執行副總裁沈向洋博士在微軟小冰的發布會上說,微軟現在是一個人工智能公司。
這可能是微軟高管第一次在公開活動上使用這種說法吧。在聯合創始人鮑爾默之後繼任的薩蒂亞·納德拉(Satya Nadella)自 2014 年上任以來,多次表示微軟的核心是「移動為先,雲為先」,當時的微軟漸漸放棄了從諾基亞那裏買來的手機業務(Windows Phone),轉而專注於移動應用的開發,從近年的財報來看,微軟旗下 Office 係列應用收入喜人,同時雲服務 Azure 在公司的全力支持下,也成長為公司最重要的業務,甚至威脅到了亞馬遜 AWS 在雲計算領域的龍頭地位。
那麼,人工智能呢?在全世界都在談人工智能的時候,微軟還在不聲不響地補著移動互聯網時代欠下的帳嗎?各家大公司都已紛紛將業務和研發重心轉移到人工智能領域,微軟真的要眼睜睜地再一次錯過一個時代嗎?
當然不會。納德拉看得很清楚,雲計算、邊緣計算、OS、混合現實還有 AI,微軟一個都沒有落下。在 5 月的 Build 大會上,雖然其雲計算產品 Azure 是全場毫無爭議的主角,但納德拉還是給了人工智能業務一段專場 Keynote 的時間,而這次為微軟人工智能站台的,就是曾經微軟亞洲研究院的院長沈向洋。
在微軟亞洲研究院工作期間,沈向洋博士在計算機視覺、計算機圖形、模式識別、統計學習和機器人學領域發表了 100 多篇論文,並擁有 50 多項美國專利。2014 年他被升職調任微軟全球執行副總裁,並在陸奇去了百度之後,成為微軟內部職位最高的華人。
人工智能三條全球產品線
在本周二的發布會上,沈向洋博士也來到現場發表演講,他把微軟小冰定位為微軟人工智能三條全球產品線之一,同 infuse AI 以及 Bing&Cortana; 並列。
可是,微軟小冰不就是一個聊天機器人嗎?聊天機器人那麼多,小冰憑什麼能成為全球最大科技公司之一的人工智能主要業務呢?
沈向洋博士對此作出了解釋,他表示在微軟理解的人工智能中,它的核心是兩個點:IQ 和 EQ。人工智能可以很聰明,微軟前不久剛剛發布了一篇報告,稱他們的圖片識別已經做到了 5.1% 的誤差率,遠高於人類,另外現在基於人工智能的語音識別和文字翻譯也做得越來越好,語音識別已經有公司做出了比人識別率更高的產品,所以機器的 IQ 超越人類是必然的。
那麼情感方麵呢?在《人工智能》一書中,作者李開複強調了人工智能還有很多局限,其中就包括了「情感」方麵的能力,而小冰正是一個專注情感的 AI 產品,或者說,專注 EQ——按沈向洋的說法,微軟是想通過小冰了解如何真正地理解 EQ。
在本次發布會前,微軟剛剛推出了印度尼西亞的小冰(Rinna),落地於社交巨頭 LINE 的平台上。這是全球小冰版圖上的第五個國家,在 2014 年首次在中國推出小冰後,微軟先後在日本、美國和印度也推出了小冰,據微軟所說,小冰全球產品線的執行策略是:優先選擇人口數量超過 1 億的國家,在當地建立完全本地化的團隊,初始的訓練數據也完全從當地取得,從而確保小冰根植於該國本土文化。
截止至目前,小冰已經成為了全球領先的對話型人工智能係統,據微軟官方統計,小冰與人類之間發生的最長一次單人連續對話,不間斷地進行了 29 小時 33 分鍾,達到了 7151 輪。
AI 交互產品的三個階段
微軟將人工智能交互產品的演進分為三個階段,首先是基本的人工智能交互,及擁有一種或多種的交互方式,比如文本、語音、圖像等。其次,是初級的感官,即在人工智能係統中,用一種核心引擎將上述的交互統一起來,是不同感官可以混合應用,這一點小冰在 2015 年發布的第三代之後就已經能夠做到了。
最後,是高級感官,也就是本次發布會第五代微軟小冰的重點升級部分。高級感官是由多種初級感官有機融合之後形成的,因而交互能力更強,對綜合技術儲備和數據的要求也大幅度提高。例如全雙工語音這一種高級感官,就需要首先同時具備文本、語音(含 SR 和 TTS)兩種能力,同時要求兩種能力均達到更高的質量標準。
高級感官能夠大幅度地提升交互體驗,更加貼近於人類的自然交互行為。例如:如果將全雙工語音這種高級感官的體驗比擬為打電話,則之前的智能助理語音交互體驗類似於對講機。此外,高級感官還能夠大幅度拓展人工智能係統的落地場景,使小冰有能力根據自己的「意願」與人聯絡,從而主動保持與人類用戶之間的關聯。
第五代微軟小冰
當然,除了最重要的「情商」升級,第無代微軟小冰還更新了許許多多的新花樣,它全麵進入了 IoT 領域,與小米 IoT 開放平台合作,目前已經能夠通過語音控製米家平台上全部 35 中智能設備,另外小冰還擁有了自己的電台,在微信小程序裏搜索小冰電台就可以聽到小冰 24 小時不間斷自動創作的電台節目了。
在發布會的最後,麵對現場上百位媒體記者,微軟發布了小冰針對媒體的全新智媒體商業平台解決方案 3.0,它與 Bing 搜索引擎加速整合,在媒體生產力、知識圖譜、智能交互和全平台互動等六個新模塊為媒體提供支持。
其中,通過 Bing 搜索引擎的全球大數據能力,新的解決方案可為媒體構建出一個基於全球新聞數據源的媒體知識圖譜,從而能準確挖掘全球資訊中每一篇內容背後的知識與含義,並構建出彼此的關係,從而幫助媒體更全麵快速地梳理時間和內容背後的故事。而通過人工智能的介入,在讀者與人工智能的自然交互中,獲得更多推薦內容,有助於改變用戶的閱讀習慣,從被動的閱讀體驗逐步變為主動的交互信息交換。
微軟真的做對了
對很多人來說,微軟小冰是一個不痛不癢的人工智能產品,她不像無人駕駛那樣酷炫,亦不像 AlphaGo 那樣驚世駭俗,從 2014 年誕生起,微信和 QQ 的許多用戶多少都有接觸過她,但大多說都是無聊時聊兩句就作罷了,很少有人會把小冰當做電影《Her》裏那個 AI 女友一樣對待,當然,小冰也沒有那麼高的智能程度。
而當人們接觸到這樣一款觸手可及的人工智能產品時,他們的期望值其實是很高的,正如微軟小冰之父李迪在接受極客公園的采訪時所說的,「對於人工智能,我們被行業的浮躁和科幻電影無限拉高的期待,這種期待已隱隱成為阻礙這一行業腳踏實地發展的高牆。」
當微軟宣布小冰已經是其人工智能的三條最主要的產品線之一時,許多人是無法理解的:那就是個聊天機器人啊,最多送她一個「最佳聊天機器人」的稱號,並沒有什麼太特別的東西吧?
所以,為什麼作為世界上最大、科研能力最強的科技公司之一,微軟會將這樣一個「聊天機器人」作為自己的看家產品之一呢?
對微軟來說,綁定在 Windows 10 上的 Cortana 可能是它最主要的人工智能交互產品,但小娜時偏理性的,小冰則不同,如上所述,小冰是偏向情感計算的,沈向洋在演講中也提到,其實像小娜一樣,各家在做的人工智能交互係統都是偏向解決 IQ 問題的,但真正讓人感到智能的交互,應該是有情感的。
所以作為一個「聊天機器人」,小冰更有機會讓用戶感受到「溫度」,讓用戶更有在無聊時與她對話的欲望,你從來就不希望和小冰聊天能做到什麼,無法定外賣,也查不了明天的天氣情況,但是你可以從中收獲一些更加有趣的東西,有時是一些暖心的回答,有時是一個個尷尬的冷笑話。
從最開始的一個對話引擎,到能夠觸達人類各種感官的交互係統,再到現在主打「情商」功能的智能助理,小冰一路走來可能成就了微軟自己在最初都沒預想過的成績,它也一直是微軟試水人工智能的試驗田,直到這個產品成了全球最大的人工智能通用對話係統,微軟覺得自己做對了,於是,去年的陸奇,今年的沈向洋,這些明星級的高管紛紛出來為小冰站台,在小冰身上,我們看得到微軟的一些想法,也許仍然是試驗狀態,但微軟有心在小娜與「友商」廝殺過的智能助理戰場上,開辟出一條新路來。
而就目前來看,雖然你可能對第五代的小冰仍然不滿意,但一代又一代,小冰已經成長了太多,對小冰的未來,我們可以提前做一個判斷,就是在人工智能的 EQ 這件事上,認真的微軟真的做對了。