時間:2017-08-25 來源:互聯網 瀏覽量:
8 月 23 日下午,在微軟第五代小冰的發布會上,有一個這樣的橋段:小冰通過電信網絡直接撥通了現場一位媒體觀眾的手機,在和他說了生日快樂,唱了幾句生日歌,又寒暄了幾句之後,用“你還在開會很忙吧”,結束了對話。
這種讓人工智能像人類一樣說話的技術,微軟亞洲研究院叫它“全雙工語音”,意思是 AI 不再隻能在聊天軟件裏你來我往的交流,現在可以像真人一樣,實時的在你說話之後給你一個回複。微軟說,小冰的模式不僅是回應你說的話,在你沉默不說話的時候,她也知道要說什麼來讓話題繼續下去。
微軟亞洲研究院曆來重視小冰發布會,這個研究項目三年半前立項,在發布之初,她被設定成一個 15 歲的少女,可以通過文字的方式和人聊天。如果從一個普通用戶的角度來看,幾年過去,小冰慢慢可以看懂圖片,聽懂你發的語音,回複語音,看懂更多的圖片和視頻,給你唱歌……現在終於可以和人直接聊天。
第五代發布會,小冰展示的最大亮點,是她的“創造”能力。
小冰以後可以直接撥電話給你
從小冰這段示例語音來看,她每個字直接的連讀更像人,句、逗之間的語氣聽起來有上下文承接,和百度、科大訊飛、蘋果的其他語音助手最大的區別是,它能夠結合上下文把多音字讀出正確的讀音。
在一段“龜兔賽跑”的童話朗讀語音實例中,隻有小冰能沒有人工幹預的情況下準確識別“生長”和“伸長”中多音字的正確讀法,可以認為是小冰具有對中文上下文理解的能力。過去在小冰參加的電視綜藝節目裏,也可以看到她對自然語言的實時反應。
總得來說,可以認為小冰現在學會了說話。
微軟在發布會上宣布,從 9 月開始,小冰開始啟用全新的“生成模型”來生成對話。過去,基於大數據和深度學習的模式,實際上全世界“聊天機器人”這個類型的人工智能,他說的每一句話應該都是有另外的用戶曾經說過的。微軟把這種模式叫“檢索模型”。
但“生成模型”不一樣。在這個模式下,小冰說的每一句話都有可能是完全生成的。目前,微軟小冰和她的不同語言版本在中國大陸、日本、美國和印度已經上線,這個月也開始在印度尼西亞提供服務。微軟說,中國、日本、美國和印度的小冰采用了混合模式,也就是大部分回應是檢索出來的,小部分是全新生成的,但在印尼投入的新版本完全使用“生成模型”運轉,每一句話都是新的。
小冰實時對話之前就出現過。去年,微軟已經在發布會上展示了打電話的功能,但這次發布會宣布的是這項功能大規模測試的開始,以後所有普通用戶都可以在周三例行更新日的時候跟小冰預約,小冰可以直接把電話打到你的手機上,移動、電信和聯通都可以。
關於打電話這個能力,微軟還描述了一個令人細思恐極的場景:未來用戶在微博上如果對小冰出言不遜,她可能可以直接打電話給你聊一聊。
微軟說,小冰以後要從事內容創作
微軟在發布會上展示的讀童話故事,不僅僅是語音生成能力的展示,似乎也預示著未來小冰的商業模式。
過去幾個月,微軟已經用小冰來生成童話朗讀節目匿名發在蜻蜓 FM 和喜馬拉雅電台上累計播放數量約為 30 萬,而且從評論裏來看,似乎很多聽眾沒有分辨出這個朗讀是人工智能生成的。微軟說,一本 210 集的《格林童話》有聲讀物內容大概是 50 小時,人類配音演員需要 200 小時工作時間,成本大約 6 萬元。相比之下,小冰隻需要 24 分鍾,拋開研發之外,運行成本可以忽略不計。
和印花 T 恤衫這種看起來更像是營銷的項目相比,有聲讀物確實更像是一個可行的商業模式。在音樂和電台類應用裏,有很多虛構類文藝作品的聽書節目,基於聽書這種形式,這些節目大部分都是用來休閑和打發時間,人工智能也許可以勝任這種“敷衍”的娛樂。
“現在的智能音箱還不算是人工智能”,微軟也不做智能音箱
發布會主持人之一、小冰產品總監彭爽說,語音本身不是智能音箱產品的核心。更不應該逼迫用戶去和它說話。
微軟將和第三方合作,來研發內置小冰的硬件產品。目前宣布的有小米生態鏈企業 Yeelight,這家廠商之前做過智能台燈;合作方還有東方明珠,微軟說會做一款兒童取向的智能產品,幾個月內上市。
目前,小冰 FM 以微信小程序的方式上線。在實際體驗裏,小冰 FM 確實可以基於合作的咪咕音樂的版權內容不斷播放新的節目,比如熱門音樂排行榜之類。點擊“錄音”按鈕可以語音互動,告訴她“下一首”,她可以回應“你不喜歡這一首嗎?”然後切換新的歌曲。
但小冰 FM 似乎沒有視頻裏展示的那麼智能,比如說“我喜歡 XXX 歌手”,得到的回應更可能是“我也喜歡”,而不是換成這位歌手的歌曲。簡單的說,小冰 FM 現在還更像那個隨便聊天的小冰,而不是一個音樂主播。
還有一個問題來自小冰簽約的版權曲庫咪咕音樂:如果你恰好問道咪咕音樂沒有版權的歌曲,小冰就會開始比較生硬的岔開話題,不幸的是,咪咕音樂缺的歌挺多。
微軟想讓小冰接觸更多人,可似乎用力的方向不大對
微軟在推廣小冰這件事上做了不少事情,但看起來效果一般。
小冰在東方台《看東方》節目播了很長一段時間的天氣預報和客串主持,但視覺形象隻有一行字和一個麥克風圖標;在北京青年廣播和湖南電台音樂之聲做過客串主持,但聽收音機本來就是一件不再流行的事,更何況是要宣傳一個看不到形象的聲音。
最近在湖南衛視播出的《我是未來》看上去是小冰形象最突出的一次,節目給她設計了一個虛擬形象,節目的內容也和人工智能關係密切。
相比之下,百度做的人工智能在電視節目《最強大腦》裏的表現就要突出很多,不僅給這個人工智能設計了一個實體機器人,還在比賽環節裏給它拚命加戲:比如選手和人工智能比賽人臉識別的環節,百度這個機器人也假模假式地看著照片,實際上稍有了解的人就知道,這些數據是直接喂給人工智能的,根本沒有所謂“看”的環節。
微軟在發布會上說,接下來小冰會參與 CCTV 一檔《機智過人》的綜藝節目,估計以後 CCTV 的宣傳效果會相對好一些。
從微軟內部產品來看,它們會把 AI 慢慢加進產品序列。現在 Office 套件中已經集成了很多人工智能的組件,比如對幻燈片實時文字解說和實時翻譯的工具,Skype 裏麵也有人工智能翻譯工具等等。
微軟執行副總裁沈向洋說,微軟的人工智能主要兩個路線,一個是圍繞現有產品的人工智能化,比如 Windows 和 Office,一個是圍繞政府、醫療、交通行業的行業應用,另外還有人工智能倫理方麵的前瞻研究。
喜歡這篇文章?去 App 商店搜 好奇心日報 ,每天看點不一樣的。