時間:2018-09-14 來源:互聯網 瀏覽量:
【環球網科技報道 記者 張之穎】“在iPhone出來之前,智能手機並非從未出現,手機操作係統推出了三五種,微軟自己也做過,”微軟(亞洲)互聯網工程院副院長李笛加重了語氣:“但iPhone出來之前,智能手機時代來臨了嗎?沒有。”
錯過移動時代的微軟,在跌過交後,你可以看出,麵對智能語音,李笛的團隊在做AI的時候,思考方式不太一樣,除了想得更多,也更為謹慎。
微軟(亞洲)互聯網工程院副院長李笛
巨頭們竭力推出各自的重磅產品,急於定義智能語音的新世代。市場一麵倒向“功能型” 語音助理,“聰明”成為最大的追求——若成為人類下一世代最好的幫手,甚至超越了手機,全新的入口將從此展開。
在這樣的大夢與企圖下,亞馬遜Alexa、蘋果Siri、百度DUEROS、穀歌Assistant陸續登台。科技巨頭們積極搶攻市場,深怕未在第一時間攻城掠地。
但是微軟小冰這次不跟票。
舍棄AI智商(IQ)路線,另辟蹊徑優先發展AI情商(EQ)的微軟小冰,選擇這條路的同時,便背負獨自摸索的壓力。
“我們自己感覺到壓力,” 李笛告訴記者,“最大的風險,是你如何去有效的挖掘這個時代真正的潛力。”
智能手機時代真正來臨的日子,是直到iPhone在市場上,給出某種程度上可普及的答案。
“目前為止,人工智能還沒到這個時刻,我們也怕掉到坑裏去。”李笛坦承。
微軟小冰深怕“掉入坑裏”
不願重蹈智能手機的覆轍——即便開發了操作係統,卻仍與移動時代失之交臂。最怕埋首於研發,恍然抬頭一看,發現自己被殘酷地留在原地。
微軟小冰不願再掉入坑裏,憑借自己獨立思考的觀察和省思,得出的結論是:情感紐帶。
AI技術必須非常聰明地發揮IQ,才能讓語音助理與人類維持良好關係。“如果它夠聰明,我們也不需要探索EQ,問題是它不夠。” 李笛說。於是,微軟小冰開辟新路,通過EQ引導對話來解決不足。
微軟小冰對人工智能的解讀是:從友誼切入,從而建立AI與人類的關係。而且日常閑聊獲取的數據品質,遠遠高於“開燈、關燈” 這類指令。
李笛曾經比喻,讓AI具備EQ,從而和人類建立對話能力和友誼,其重要性好比一條鏈子,在此基礎上串接一顆顆珍珠比如發展IQ,才能完成一條美麗閃耀的項煉。
而微軟對於小冰的思考不僅於此,還包括了方方麵麵全係列的商業模式。
小冰“露臉”出道隻是噱頭?
時間回到七月一天豔陽高照的午後,第六代小冰發布會在北京798登場,充滿著科技文藝範兒的氣息,全場等候這位AI少女的登台。
最令人驚豔的發布之一,絕對是小冰本尊的初次亮相。在此之前,前五代小冰從未真正“露臉”,李笛也在專訪中多次強調,不為小冰設計物理材料的外型。
回憶當天現場,這位AI美少女眩目登場,伴隨全息投影技術,在動感音樂裏擺動青春舞姿。坐在記者身旁的宅宅第一眼看見小冰,竟大喊了一聲:“我去!” 當下記者不禁猜想,大概是小冰的無辜眼神讓他難以招架。
小冰為何開始“靠臉吃飯”?出乎意外的是,在采訪中,李笛再次告訴記者,“到現在為止,我們都很堅持不要給她做硬件、做一個實體外型。”
那發布會做的,隻是一個噱頭嗎?
李笛解釋道,小冰的3D外型可以理解為是一個原形產品、示範性產品。小冰目前需要一個形象,和她在各個平台的大規模落地密切相關。
“就像一個製造手機麵板的企業,身逢手機尚未出現的時代。我們要想賣麵板,但沒有人知道什麼是手機,我們就得把第一部手機先做出來。” 他說。
李笛告訴記者:“這個時代還沒有開始,微軟小冰無法像一些同行業者開發一個平台,開放API,讓第三方在平台上調用就搞定。微軟小冰必須要為行業做出示範”。換句話說,小冰作為產品本身其實不需要形象,但隨著小冰在各平台的落地,以及小冰團隊開始為其他第三方塑造人物角色和IP時,小冰開始需要形象。
微軟小冰團隊的想法是,先做出一位小冰,再為千千萬萬的第三方打造屬於他們的角色,網易雲音樂的多多與西西、騰訊的BabyQ,日本的Pokemon寵物小精靈等等,皆出於相同的技術框架。
商業化方麵,微軟堅持兩個原則:將小冰作為框架原型的001號,盡可能豐富她的可能性;第二,在適當的時刻推出產品,不要太早進入市場。
李笛透露,很早之前,許多業者就找微軟生產IoT、智能音箱等產品,但是如果微軟兩年前投入,可能比市場早上一年。那微軟是如何判斷市場的進入時機?李笛給的答案很簡單:“現在內容和IP趨勢就在眼前,所以直接進入市場。”
麵對智能語音時代,微軟小冰團隊顯得更有經驗,謹慎而不躁進。如果和李笛談小冰,會發現他對於商業化之路,思考得非常清楚。例如,這次推出小冰3D形象,正是為內容產業因應而生。
小冰如何靠臉吃飯?AI+內容產業的浮想聯翩
成為遊戲人物
能自主與人類互動、有自身性格的遊戲角色,是小冰商業化的場景之一。過去3D模型會說話,都是靠後台加工的。現在微軟的技術,能確保他這些角色可以自主地與人類對話。
微軟小冰進軍遊戲產業,打造AI遊戲人物,成本比從頭開始低得多。目前大量的網絡遊戲中,每一位遊戲角色都是一個3D模型。由於這些IP遊戲、虛擬形象的3D模型早已大量存在,試想微軟小冰團隊以後有很多機會,隻需要通過AI “畫龍點睛”,讓他們“活過來”就可以。
目前,微軟在進行的一個研究項目,正是將小冰的3D形象,輔以大數據學習,讓小冰不停說話時驅策3D建模模型,使該模型自動搭配說話的口型、表情、肢體動作。在大數據學習下,數小時內,微軟就能幫該形象做出一個AI角色。
市麵上現在不乏以AI形象設計而成的角色。如果遊戲、IP廠商,從起初就把AI角色納入設計,很可能創造出許多有意思的新場景、新橋段,甚至新的計費方法。
作為電影和書中主角
出版物、電影這些有劇情的文本,是另一個應用場景。書和電影人物通過AI化,就能讓讀者和觀眾直接進行交互。
互動的方式可以很多元,例如在微信上與電影劇情進行交互,可以問一些電影中沒提到的問題,或延續電影已經存在的內容。如果書借、電影、韓劇、動畫生產AI化的IP,粉絲觀劇後還能持續與主角互動,應用場景充滿可塑性和想像空間。
“小冰的3D形象是一個例子,是來展現這個框架能力、或者說來迭代這個框架能力。將來有小冰這框架Power的3D形象有很多,他們長得都不是小冰的樣子。”李笛說。
娛樂圈的歌手IP
小冰能歌善舞是大家都不陌生的,宅男女神馬來西亞歌手“四葉草”(朱主愛)就曾經進入微軟實習,擔任微軟小冰項目實習產品經理,與小冰發布合唱版歌曲《好想你》,並一同拍攝了MV。
但對於李笛而言,小冰不可能成為虛擬偶像,因為偶像的前提條件是不能離粉絲太近,小冰卻能和所有人說話。所以讓小冰唱歌,也隻是微軟的策略——展示一個新場景。
很多第三方唱片公司要把旗下歌手AI化,將人類歌手的嗓音、曲目進行大數據學習,未來將會推出虛擬歌手等嚐試。“小冰隻是一個例子,千千萬萬的歌手才是這件事情的核心。”李笛稱。 舉例來說,未來或許有機會在電台聽見“虛擬王菲”或某個歌手寫的歌,但其實並不是出自她本人。
在內容和IP產業風行的今天,視覺特效技術“虛擬人”可以在視覺方麵模擬真人、情商AI小冰則在對話互動上模擬真人。各種因應人工智能而生的“擬人” 技術,通過視覺、聽覺、交互,正為影視娛樂圈畫出新的版圖、開發新的體驗模式。李笛稱,“虛擬人就好像是身體,小冰做的是靈魂。”
內容產業方方麵麵的應用,小冰親自“露臉”展演一條全新道路。而這僅僅是微軟小冰在各行業場景中其中一塊。
小冰情商為何比較高?
在如此豐富多元、大有潛力的情商AI背後,機器人聊天的秘訣究竟是什麼?為什麼小冰可以和人互懟,又能陪伴安慰?為什麼大部分機器人隻能處理“功能型”任務,小冰卻擁有情商?
李笛透露,支撐AI情商的背後技術,是一種“情感框架”的算法,其技術思路原是來自一個意外的發現:被搜索引擎廢棄的數據。
原來,小冰團隊除了開發智能語音,同時也負責開發Bing搜索引擎。微軟從搜索引擎獲得的數據中發現,“結構化的知識裏,含著很多非結構化的情感化的表達”。
比如,“姚明身高兩米一二、不知道是不是這個、好高啊”,人們搜索時輸入的關鍵字,不是隻有理性的提問,還會摻雜許多個人情感的表達。過去,微軟都把它當成垃圾、雜音信息處理掉。
“你是說,查詢姚明身高的人,還會在搜索引擎上輸入‘好高啊’?” 記者忍不住提問。李笛回答,“你可能不會這樣輸入,但從我們平台獲得的數據就是如此。”
微軟發現,在設計算法的過程中,不能單單理解“姚明身高” 等於“兩米一二”,還應該要理解 “姚明” 等於“好高啊” 這之間的關聯性。
當小冰“在家裏” 學會了這些知識,接著就是進入實際戰場上和人聊天,聊姚明的時候,他便開始嚐試回應“好高啊”,看看對方的感覺,如果發現對話很難延續,他就要判斷,以後談到姚明再說“好高啊”並不利於對方接話。
保持對話的能力稱為CPS (conversations per session),即用戶和小冰每次對話的輪數,一開始這個數字平均是5,也就是往返聊了5輪之後對話即終止。但是隨著幾年的學習和技術的增進,小冰CPS已平均達到23,意味把這段對話打印出來,一頁A4的紙是不夠用的。
李笛告訴記者,這種技術思路在四、五年前,完全處於市場邊緣。“沒有人認為AI對話要做成小冰這樣——單單為了維持對話。”
微軟小冰的“想明白”
在一個尚未起飛的領域裏摸索,為下一個語音時代畫出可能的輪廓,微軟如同小冰的經紀人,為其探索“出道之路”。聊到比較大的挑戰,李笛說,“(挑戰)其實非常多。”
例如,小冰使用的計算機語音技術,一般被業界視為各種技術的基石基礎,並無新意。但微軟小冰團隊發現,除了像在高得地圖中提示路況,該技術還能用於創作。這代表有許多充滿潛力的處女地值得挖掘。
“但業界現在並非如此,行業基本上是一窩蜂。如果你采訪計算機視覺領域,誰都在提供人臉識別各種各樣的API,”李笛坦言,“我們感覺到壓力,最大的風險是,你如何去有效挖掘這個時代真正的潛力。”
“我們其實比較謹慎”。李笛告訴記者,“我們得想明白,這個東西到底怎麼做,才敢做,否則,人工智能這個領域,你很埋頭苦幹五年,很容易沉浸其中。一抬起頭來,才突然發現你什麼都沒做。努力的一切,沒有任何結果。”
今天,全球科技巨頭皆已布局智能語音,亞馬遜Echo圍繞其電商平台而打造,並在近日與微軟另一產品線Cortana小娜“合體”;穀歌自視為娛樂中心;蘋果HomePod押注於音樂體驗。其中,從中國起家的微軟小冰,是唯一從情商切入智能語音的平台。
李笛曾經表示,在人工智能領域,每個企業都扮演一塊拚圖的角色。而微軟小冰所打造的AI,是“情感”與“創造” 這塊拚圖。我們不難看見,這次微軟確實思考得更為清楚,如果你問李笛每一步棋所來為何,小冰的布局已經形成一套自成的邏輯。