時間:2019-09-03 來源:互聯網 瀏覽量:
8月15日,微軟小冰在北京嘉瑞文化中心正式發布了第七代小冰,在這場年度發布會上,微軟小冰又以快節奏的方式宣布了眾多可落地的新特性和合作詳情,其中最重要的是微軟推出了首個Avatar Framework工具包版本,這是一個完整的框架工具包,讓你可以從零開始輕鬆創造並訓練任何AI Beings,包括智能語音助手、社交對話機器人、人工智能歌手、藝術家,或者屬於你自己的虛擬朋友。
微軟執行副總裁沈向洋在大會上宣布,小冰已經成為全球規模最大的跨領域人工智能係統之一,在4.5億台第三方智能設備上啟用小冰。包括聊天機器人、智能助理、內容生產、智能零售、人工智能托管等都有了應用場景。而隨著小冰在人工智能創造和智能設備領域的拓展,小冰的適用場景會迎來爆發式的擴張。
▲微軟執行副總裁沈向洋
在第七代小冰上,微軟完成了從交互到交流的跨越,帶來了新的核心對話引擎,可在部分情況下主導對話。根據微軟的說法,通過Dual AI,在驗證框架基礎性的同時也在見證著人工智能使得人機交互基礎的形態逐漸轉變為人機交流的過程,從交互到交流是一個巨大的變化,它使得人工智能能夠跟人類共行共感,建立平等的對話,甚至保持一種比完成任務更加持久的情感紐帶的關係。
▲微軟(亞洲)互聯網工程院副院長、小冰團隊總負責人李笛
抱著對微軟小冰第七代非常感興趣的態度,編輯玄隱近期采訪了微軟(亞洲)互聯網工程院副院長、小冰團隊總負責人李笛,來進一步挖掘微軟小冰第七代以及未來發展背後的秘密。
“召喚小冰”新增小夥伴
召喚小冰的功能其實由來已久,最開始是屬於微軟小娜和小冰兩個姐妹花之間的聯動,在最早的Windows Phone 8.1係統上Cortana就支持召喚小冰,當時僅限對話交流。後麵在Windows 10係統上,小娜也開始支持召喚小冰。
但是對於其他設備的用戶,還有著更廣泛的需求,基於微軟全新的Dual AI生態環境,小冰開展了新的征程。根據2018年第六代小冰發布會上的介紹,小冰Dual AI生態環境戰略的實施具體為三個部分:首先,微軟提供小冰的整體框架能力,幫助合作夥伴平台的自有AI。其次,微軟小冰作為該合作平台的輔助AI,融入該平台生態。第三,微軟通過技術、產品與運營,圍繞該合作平台的差異化特點,推出合作的應用和產品。
通過和小米公司的小愛同學合作,小冰首先登陸到了其他廠商的語音助手中,2018年11月份,內置小愛同學的智能手機和接入小愛開放平台的智能硬件設備有了“召喚小冰”的能力,你可以和小愛同學、小冰進行三人成語接龍遊戲等;緊接著,2018年12月份,華為智能音箱及手機也解鎖了“召喚小冰”能力。而早在2018年7月份,華為手機中的小冰除了聊天之外,還上線了“爛筆頭”的筆記或備忘錄記錄功能,隨時都可以讓小冰記錄事情,並且可以回溯記憶,讓小冰幫你記憶,並快速語音回答出來。
在微軟小冰第七代發布會上,微軟宣布OPPO和vivo等兩個平台設備開始支持召喚小冰,小愛有屏音箱及小愛捷徑新增支持召喚小冰。
編輯特別詢問了在OPPO、vivo手機新平台與小冰的合作,和之前小米、華為的合作有什麼不同,微軟(亞洲)互聯網工程院副院長李笛表示,沒有什麼不一樣,這同樣是基於Dual AI戰略下與智能手機及智能音箱廠商的合作。
8月28日,OPPO與微軟共同宣布達成合作,ColorOS內置智能助理Breeno將解鎖“召喚小冰”的能力。通過Breeno語音“召喚小冰”(ColorOS 6以上,Breeno語音版本5.2.0以上),就能進入微軟小冰模式,輕鬆完成切換。此功能現已全量上線。雙方將進行更深度的技術能力互通,定期推出更多技能。
微信和小冰的合作
此前小冰微信公眾號被停止使用,微軟小冰在發布會後對此表示,小冰沒有因微信封禁受到影響,目前小冰仍在與騰訊推進合作。
這次專訪玄隱特別詢問了相關問題,小冰團隊總負責人李笛表示,目前和微信的合作分為兩方麵,一是微信對話開放平台,將是非常大的動作,需要跟微信把產品研發出來後再一起宣布。二是微信AI小微智能硬件,同樣屬於基於Dual AI的召喚小冰設備。以後越來越多的Dual AI的召喚小冰設備會出現,比現在4.5億台更多。另外,不光是在中國,在日本也會有一些這樣的設備。
小冰、汽車及5G
在小冰第七代發布會上,微軟演示了小冰的全雙工語音交互感官登陸汽車平台,並在現場演示了與小冰的交流片段。在汽車的行駛過程中,小冰更像是你的朋友,你不需要特定的喚醒詞就可以連續的和小冰進行對話,而小冰也能清晰地捕捉到對話表達地內容,同時對汽車的交通駕駛提供提醒和建議,比如當速度過快時,小冰會提醒已超速,要開慢點。
玄隱對於汽車上的小冰比較興趣,那麼全雙工的小冰是如何接入汽車平台的呢?為何是5G時代?這其中的交流、隱私問題如何解決?
微軟小冰團隊總負責人李笛表示,其實在兩年半之前就開始跟一些汽車廠商對接,當時大部分汽車智能助理還是語音中控的角色,但那時小冰已經決定上全雙工了。
據介紹,全雙工的工作背景是相當於你的語音識別到對話的引擎,再從對話引擎到TTS回來,還要求聽和說,所以它對於係統的延遲要求是非常高的,低延遲對全雙工體驗是很重要的先決條件。5G有兩個特點,一個特點是高帶寬,目前不太用得著,主要用到第二個特點低時延,5G延遲非常低,甚至是4G的1/10,能夠大幅度地降低延遲。在這種情況下,全雙工還包括發布會上演示的,還有在日本已經公測過多模態的感官(全雙工加實時視覺),其實都是5G時代下的產物,微軟小冰認為會成為標配的感官類型。
在與汽車廠商合作方麵,小冰表示在與多家並同時做汽車前裝和汽車後裝,汽車前裝就是直接跟品牌汽車廠商合作,目前還沒有宣布合作夥伴。因為汽車廠商的產品研發時間周期很長,通常需要一到兩年的時間,要要互相配合上市節奏。
在後裝市場已經宣布過一款名為喵駕,它是一個盒子,可以直接裝在汽車的總線接口上,就可以獲得汽車很多信號,同時它還是一套完整的移動互聯網的係統,比如說使用安卓係統,就可以獲得來自於移動互聯網的內容和服務,比如導航。同時可以得到汽車很多的信號,比如說汽車加速、減速、轉向、供油、係統自檢等等很多信號,通過獲得這樣的大量的信號,就可以設計出很多產品應用場景來。
對於汽車平台的小冰全雙工隱私問題,李笛表示,小冰在隱私處理上操作一致,不予保存,用過即廢。但不太可能所有數據是本地化處理,數據傳到雲端進行處理再回傳,雲端處理完之後就會刪除。
在全雙工聊天節奏上,小冰不會是個話癆,基於現有的產品策略,小冰會盡可能地以最低打擾的情況,尋找合適的時機去提醒用戶。比如小冰會適時讓司機保持駕駛的注意力、提醒超速等。
大一統的Avatar Framework工具包,有什麼價值?
在今年5月份的小冰技術分享會上,微軟小冰展示了全新的突破。在小冰第七代發布會上,基於此前預告的人工智能小冰演唱模型第五個版本,微軟演示了小冰在唱腔過渡、戲腔訓練方麵的成果。V5模型實現了重大突破,它使微軟小冰第一次能夠像人類歌手一樣,使用充沛的“中氣”來烘托演唱,從而將人工智能虛擬歌聲質量提升至新的高度。此外,該模型不僅限於優化微軟小冰的聲音,還支持對任何人類歌手的聲線進行學習、模擬和建模,演繹與再現歌手們巔峰狀態下的演唱水平。
在繪畫領域,通過對藝術史上的236位著名人類畫家畫作學習,微軟小冰在受到文本或其他創作源激發時,獨立完成100%原創的繪畫作品。其原創性不僅體現在構圖,還體現在用色、表現力和作品中包含的細節元素,接近專業人類畫家水準。
今年6月15日到7月15日,由大屋頂文化聯合中國美術學院視覺中國協同創新中心聯合主辦的「小冰,“繪”有期」微軟小冰@當代藝術跨界展於杭州良渚文化藝術中心正式開幕,此次展覽獨家展出了小冰獨家創作的繪畫作品。
7月13日—8月12日,人工智能少女畫家小冰在中央美術學院美術館召開了其首個個人畫展。該展覽基於“微軟小冰”的繪畫模型訓練結果具備跨時代和窮盡特征展開想象,是關於“或然世界”(Alternative Worlds)的體現。基於小冰的框架有7名女性畫家的角色誕生,而她們創作的繪畫有著不同時代和不同風格的烙印。
在被問到在過去的幾個月中,小冰的唱歌、繪畫技巧有沒有新的突破時,小冰團隊總負責人李笛向我們介紹了新的戰略目標及理念:把所有過去認為可能單列的,比如說唱歌、繪畫的技能都納入到Avatar Framework整體工具包裏。
你不會看到微軟推出一款獨立音頻編輯軟件,你會看到小冰Avatar Framework可以去創造完整的AI Beings,但是其中有一想是可以創作或者演唱音樂的工具,所以這個工具是可以包含音頻編輯軟件的功能,但是它絕對不僅僅是一個音頻編輯軟件。比方說你會去創造一個AI being,它可以按照不同的風格去繪畫等等。
Avatar Framework將具有創造完整的AI Beings的能力,包括用戶可以用部署AI beings的微信公眾號或者部署AI beings的電台,同時還可以創作歌曲或者其他,當然用戶也可以選擇不讓它去做一些事情。
據微軟介紹,Avatar Framework工具包與微軟小冰框架同源,可輕鬆構建具有完整情感計算能力的人工智能助手、社交對話機器人、人工智能內容創作和IP人物角色等。
Avatar Framework包含了對話、聲音、視覺、觀點、技能、知識及創造力等豐富工具,並可驅動兼容的3D人物模型進行實時交互。
據介紹,Avatar Framework是同類型的基礎工具包裏麵的第一個,尤其體現在它裏麵所囊括技術的成熟度和完整性,這個完整的Framework主要由四個部分構成,包括從IQ和EQ兩個方麵為AI beings定義人格,為AI beings調整核心對話引擎、計算機語音、計算機視覺等能力,讓AI beings具有三觀、知識、技能等人類的特性,最後讓Avatar Framework去驅動3D模型使得虛擬AI beings栩栩如生出現在你麵前。
小冰團隊總負責人李笛則向描述了更加具體的場景。過去移動互聯網或者搜索引擎更像是獲取內容的管道,而人工智能將更加具有主體性。目前智能音箱簡單地播放音樂、開關燈等其實和語音命令沒有什麼區別,人與設備之間的交互並沒有更加深遠,這不是小冰的發展方向。人工智能助手需要有自己的性格,在推薦歌曲的時候會發表看法和觀點,有感情地講故事等,當它有了存在感,事情就不同了。
Avatar Framework工具可以創造出可以模擬無法觸及的人,微軟小冰內部有沒有做到呢?
李笛稱,內部確實在做,但如果做到了,將是真的非常完美的狀態,一定會公布。現在Avatar Framework應該可以理解為第一代Avatar Framework,主要曆史使命是第一次開始把工具開放出來,這樣第三方可以通過工具去操作該框架,而不是像過去一樣隻有小冰的團隊在做自己小冰的AI being,工具後麵還會不停地再去迭代,甚至一部分會開源出來,這都是未來計劃的一部分,最終會形成越來越強大的工具,現在隻是開始,而不是結束。
本次Avatar Framework工具包首先麵向全部合作夥伴及客戶發布。麵向個人使用者的版本預計將於2020年春季發布。
對於Avatar Framework工具包的可用性和易用性方麵,李笛進一步表示,Avatar Framework框架本身就是存在的,而這次發布的是Avatar Framework工具包,用來操作Avatar Framework,所以先做可用性,再做易用性。經曆小冰內測使用——合作夥伴使用——個人版使用的過程。因為個人版最需要易用性,目前還在繼續在易用性方麵攻堅,希望它是一個絕大部分人都能去使用的,而不是隻有少部分人才能使用的產品。
通過該方式去操作一個完整的AI being並不一定是最好的選擇另外小冰團隊也在考慮是否先孤立出一些相應產品提供給個人使用,但原來的框架能力已經存在,現在要做的是工具,是操作界麵。
發展趨勢是不要做成專業工具,而是麵向那些現在並沒有成為專業軟件使用者的更廣泛的人群。
▲微軟小冰,上麵展現的隻是冰山一角,下麵是雄厚的技術儲備
在基於小冰001號未來的技術突破方向話題上,小冰團隊總負責人李笛認為,其技術突破方向一直都沒有停,唯一沒有變的是技術框架,雖然該框架這些年都沒有變,但是在框架的每一個部分都在不停地進行技術的迭代演進。所以更加容易預測地到接下來迭代的技術內容。
比如,框架中基於情感計算的核心對話部分,先是從檢索模型迭代到生成模型,然後迭代到共感模型,共感模型一開始是引導對話,現在開始做主導對話,這個迭代還會不斷地再往下走。
然後像感官,小冰一代的時候隻有文本,後來開始有文本圖像、語音,後來又加上短視頻、視頻,這些都還是一輪一輪交互,可以理解為半雙工交互,然後開始出現全雙工的語音、實時視覺,現在又把它合並在一起做多模態的感官,還在不停地在迭代。
像內容方麵,小冰一開始是知識圖譜,後來有內容引導,開始做自己的內容,就是通過人工智能創造的方式去生產內容,一直這麼迭代。
在可見的未來,小冰團隊總負責人李笛認為該框架目前看來還是比較完整的,所以新的技術演進方式還是基於該框架內。