時間:2017-08-23 來源:互聯網 瀏覽量:
2017年8月22日,第五代微軟小冰發布,宣稱要“無處不在”。
可微軟小冰是誰?一個聊天機器人?“可愛小美女”?一個會撒嬌講段子的AI?
她現在能做什麼?未來又將去向何方?之前確定性存疑,但這次有了答案。
第五代小冰
我們先看下第五代小冰都有了哪些新特性。
這一代小冰將上線高級感官功能——能主動發起對話,甚至主動給罵她的人回追電話;
新增使用生成模型(Generative Model)——可以自主生成對話內容,以前都是語料庫裏“搜”現成的;
要進軍IoT展開落地合作——存在的載體一下子大大拓寬了,可以“活”在手機App裏,也能“活”在音箱裏,甚至冰箱、電扇都不是問題;
可以參與創作有聲讀物生產——除了語音識別和合成,還結合了一把音樂方麵的能力,快速完成一個“聲情並茂”的作品;
第五代小冰有聲讀物《龜兔賽跑》
最後,加速與搜索引擎Bing的融合,既要加速人與世界(信息和服務)連接,還能以智能助手的身份參與新內容的創造。
更像人了
在第五代小冰新特性公布後,你是否也會覺得這個一開始就被人設“少女”的AI更像人了?
依靠高級感官功能的賦予,小冰終於可以主動發起對話了,不再是一個呼之即來揮之即去的“機器人”工具。
這其實非常不簡單,並非一蹴而就。
“微軟小冰之父”李笛說,第一代、第二代要做到有趣,能夠讓人有的聊;第三代小冰要有情趣,可以讓人聊下去;第四代小冰則能探測,知道用戶的偏好和興趣。
到了第五代,要主動發起聊天。這種主動如何實現?更高級的感官。
其實在第三代小冰中,就已經不斷有了感官的引用。隻是第三代小冰,引入的是初級感官,通過核心對話引擎的使用,可以混用不同的感官,比如自如切換圖像、語音和文本等。
第四代小冰則迭代至“全時感官”,與人類的無縫流暢對話,甚至根據聊天內容與走向進行打斷與追問,甚至能夠讓AI與人類打電話。
到了當前第五代微軟小冰,更高級的感官則讓“全時感官”裏的“打電話”變得“對講”一樣。
第五代小冰能夠主動發起通話,能夠通過聲音感知人類情緒和周邊環境,報之以相應的聊天話題和語氣。
更形象的比喻如李笛玩笑所言,第五代小冰開始,假如再有人在微博、微信上罵小冰,小冰完全可以半夜12點電話“報複”——不僅有EQ,還有了行動能力。
但小冰更像人的背後,卻加速擺脫對人類數據的依賴。
告別數據依賴
小冰誕生在微軟,成長到現今模樣,其實並不容易。
眾所周知的是,AI技術的三大底層基礎是:算法、計算力和大數據。
但對於微軟來說,最關鍵的數據部分需要後天努力。由於在移動互聯網時代的“錯失”,特別到中國市場,微軟缺乏產品與人類用戶交互的第一手數據,這讓小冰“喂養”成為最現實的挑戰。
不過回溯來看,此前並不擅長直接與C端用戶打交道的微軟工程師們,卻創造出了一種新模式——讓用戶領養小冰,並在交互中不斷獲取交互數據,幫助小冰模型框架的成長。
現在的局麵是:微軟小冰擁有超過1億的用戶,超過300億的人機直接對話,還有海量的語音、圖象、視頻的交互數據,在國內所有其他的對話是人工智能產品加起來的對話數量都還不到小冰的1/10。
微軟小冰首席架構師周力評價說:這好比有1億的用戶在共同撫養著小冰。他們可以教小冰掌握更高的對話技巧和EQ,事實上沒有哪個人類的孩子享受過這樣成長的機遇。
這樣的數據量也讓小冰這個AI計算框架實現了量變到質變的跨越。
五代小冰以前,她說的每一句說,都來自10億量級的語料庫,都是“搜索”記錄在案的人類語料庫做出的決策,但自此往後,微軟小冰將自主創造回複的內容——不再鸚鵡學舌,和你說的每一句話,都有可能是在這個世界從來沒有出現過的。
這就是生成模型(Generative Model)。
這個模型不僅能自主生成回答內容,還可以讓快速構建其他形色各異的聊天機器人成為可能。
也就是說,“18歲少女”的人設也能快速有個其他的變種,下次出現個“35歲大叔”之類的……有意思的是,小冰團隊在今年愚人節期間,已經把日本小冰切換成了一個男性角色,並取得了不錯的反饋。
生成模型當然還有更廣闊地用途,特別是自主創作方麵。更早之前,小冰出版了自主創作的詩集,這是人工智能在原創內容方麵的重要一步。
但隨著高級感官、生成模型等技術的使用,第五代小冰還被“獲準”進入更多的領域,其中發布會上大書特書的就是“有聲讀物”領域。
這也將造成一部分以此為職業的人類的“轉型”。
以《格林童話》為例,如果人類選手生成一版50小時長的《格林童話》有聲讀物,需要耗時至少200小時,金錢成本62100元,但如果讓小冰來做,可能隻需要24分鍾,花費7毛錢。
這將是一個行業地震式的變革。但微軟小冰團隊也強調,小冰更多是“協作者”的姿態出現,而不是“替代者”,不會完全替代人類在這方麵的職業機會,但能夠協助生產更多優質的有聲讀物內容,為人類服務。
其實隱而未宣的是,擁有這般能力的小冰,可以幫助微軟打破內容領域的版權問題。
如今AI助手正在加速IoT設備智能化,但和智能音箱遇到的問題一樣,軟硬件問題解決後,最終核心比拚的將是“內容生態”,這意味著狹路相逢版權者勝。
沒有那麼多版權怎麼辦?比如“有聲讀物”領域,總不能高價邀請聲優一個個錄吧?
現在小冰能做,一切都不再是問題。這個不眠不休,有“音樂修養”、又兼具朗讀能力的機器人,將指數級創造更多的資源出來,版權主動權也都將掌握在微軟手中。
當然,與“有聲讀物”類似,音樂版權的路徑可能也會被重構。雖然之前已經有過歌曲發布,但第五代小冰展現出的“歌喉”,已經沒有“機械感”了,不信可以通過QQ小冰“索要”一首《我是小冰》聽一聽。
更有意思的是,在發布會上,微軟團隊認為小冰在唱歌方麵的造詣,已經甩開知名虛擬偶像“初音未來”了。
可能需要擔心的是真的會有人愛聽小冰唱歌嗎?
柯潔估計會。在央視和長江文化聯合出品的節目《機智過人》上,這個今年還在烏鎮與圍棋AI AlphaGo廝殺的圍棋少年說:我是微軟小冰的粉絲。
高級感官、生成模型,可以自主或參與創作內容,這些都是進軍IoT存在的顧慮,現在既然都已秋風掃落葉,是時候拓展微軟小冰的生存空間了。
微軟小冰產品總監彭爽宣布,小冰將借助小米IoT平台米家,開始“入駐”家庭,除了通過小冰操控家中的智能設備,還能有一種“打電話”的感覺,即交互更自然,並非命令式對話。
而且小冰還會兼具身份識別的功能,對家庭成員中的“爸爸”、“兒女”、“父母”等都會有不同的用語和語氣來進行交流。
此外,除了小米IoT平台米家,微軟小冰還將與小米生態鏈企業Yeelight推出智能燈產品,與互娛領域的東方明珠(600637,股吧)推出一款暫未透露的“神秘”的家庭場景的產品——更早之前,微軟小冰的代表還出席了廣州東方數智科技有限公司的成立,這是一家與東方明珠達成“IP+AI”戰略合作的新公司。
小冰團隊希望的,正是在整個IoT場景中,讓小冰時刻被感知,被當做家庭中的一員,用戶可以和輕鬆地跟小冰進行交互,既可以控製設備,也可以隨意地聊天。
不過既已邁出“空間拓展”的一步,另一些空間的拓展也被展開。此次發布會上,另一個落地的產品是“小冰電台”,小程序版本,說新不新,但已經擺脫第三方音樂平台獨立了。
小冰電台可以基於多重來源,麵向各種主題,自主創造節目:講段子、播放歌曲、互動交流,都可以是這個電台的主題,其實與人類電台已經沒有實質區別,隻是小冰不用休息也不用發薪水而已。
量子位搶先試聽了“小冰電台”,當我告訴小冰“我要當爸爸了,來點音樂吧”的時候,她給我來了一首“千千闕歌”,並深情款款地說“這是我媽媽最愛聽的歌曲。”
整體來講,小冰電台的體驗還是非常不錯的,如果有缺點,可能是“歌曲版權”方麵,她現在的曲庫資源完全來自“咪咕”。不過依照小冰的能力,日積月累,這必將會成為最了解你音樂喜好的智能助手。
既然可以成為音樂方麵的智能推薦助手,那更多的領域自然也不是問題。小冰的商業化還是問題嗎?
小冰之父李笛說,同樣的技術能力,應用到音樂之外的其他內容領域和服務領域,完全不是問題,一篇新聞?一部小說?一個餐館?原理都是一樣的。
實際上,小冰已經在日本試水過了。
小冰去年在日本,基於LINE和Lawson一起合作,測試了一把小冰在“賣”打折券方麵的能力。
具體任務是小冰在LINE上,和Lawson2000萬左右的用戶進行交流,在對話過程當中發現機會,把Lawson的打折券提供給這些用戶。最後測試的結果是4日內使用打折券的轉換率為57%——之前任何方式都沒有超過10%。
李笛說,這就是AI在EQ方麵的力量。
小冰是如何做到的呢?對話記錄這樣顯示:當一個用戶偶然和小冰說餓了的時候,小冰不會直接推薦營銷券,她會先通過漫無目的地交流,在多輪對話後,悄無聲息引導用戶去向小冰要打折券。
“在整個的對話中,小冰不停地在用她的各種方式,暗暗地去判斷這個人是不是需要打折券,以及需要什麼樣的一張打折券。同時還不停地激發這個人對某一種食品的熱情。所以這也是為什麼小冰能帶來這麼高轉換率的原因。”李笛解釋說。
這樣的嚐試也讓微軟小冰團隊認為找到了一種平衡技術和商業的方法。
“在人工智能的時代百舸爭流,大家都在主流的發掘人工智能本身存在的價值,與此同時都想要去發掘它的商業目的到底如何實現。但是我們從一開始一直到現在,甚至到未來很長一段時間,我們都希望人工智能首先能夠成為對人類有益的一種存在,而不是在發現你失戀的時候馬上給你推一個“好利來蛋糕”,你要不要吃這個東西,實現我的五外賣目標。”
所以小冰的商業化未來到底會是什麼樣的呢?不知道。
但小冰團隊的目標已經非常明確:以EQ為基礎,當小冰把她所獲得的來自世界的知識、內容和服務,以一種更快的、更高轉化率的商業價值的體現推送給人類的時候,她和人類的情感紐帶同時能夠因此而加深。
一定程度上,這也是小冰(小Bing)起步的核心原因:加速人與世界的連接。於是不太意外的是小冰將在媒體信息、搜索等方麵實現的“大Bing小冰”融合。
小冰在新聞媒體領域大展身手已不是新聞。在此之前,小冰已經為《錢江晚報》撰寫了不少新聞,而且源於機器在“知識圖譜”方麵的能力,可以對於某個新聞事件的前因後果、左右關聯更為熟稔,於是可以預測重要事件的結果。
在五代小冰發布會上,可能同樣處於“尊重人類”的考慮,小冰團隊在這方麵還是用了“協作”,而不是“替代”記者。
但毫無疑問的是,那些“跑得快”的快訊、消息類記者,將實實在在被機器替代。而更多深度內容、非虛構創創作等方麵的記者,則確實可以讓小冰幫助完成“功課”環節,她能夠從海量網絡世界中收集整理相關資料,幫助人類記者更快完成對某個事件的認知。
小冰在媒體領域的“大展身手”還包括在交互上,一個更加精準的“搜索機器人”將進入媒體App、微信和微博等平台中,通過對話式窗口,幫助你找到想要了解的內容。
當然,類似的方式也將被微軟複製到搜索領域。小冰(小Bing)將和大Bing加快融合,為每一個新聞數據構建“知識圖譜”,幫助用戶更快速全麵搜索想要找到的內容。“推送”為王的AI新媒體變革也可能就此被打破,主動交互式的信息交換可能又要回潮——但已經是完全不同的主動閱讀體驗了。
微軟還希望借小冰打一場搜索領域的反擊戰。
當前Bing在美國擁有33%的市場份額,在中國,英文搜索流量占比22%,微軟希望借助大Bing小冰融合,以搜索體驗提升為吸引力,向老對手Google發起新一輪挑戰。
微軟全球執行副總裁、微軟AI研究事業部負責人沈向洋說:依靠AI,構建知識圖譜,未來在很多市場,完全可以跟Google一爭高下!