當前位置:係統粉 >   IT資訊 >   微軟資訊 >  微軟六代小冰發布:雲音樂保存歌曲已經out了 我保存歌手

微軟六代小冰發布:雲音樂保存歌曲已經out了 我保存歌手

時間:2018-07-27 來源:互聯網 瀏覽量:

微軟六代小冰發布:雲音樂保存歌曲已經out了 我保存歌手(1)

微軟小冰剛開始在國內測試的時候——當時似乎是2014年,還隻有微博號,後來又加入微信,親測下來覺得和真人用戶互動的能力也有限,在很多人眼裏,小冰的出現可能就隻是一條不起眼的新聞,一直沒有怎麼關注它;微軟自己也不把小冰的進化迭代當成是一件值得向普羅大眾大張旗鼓宣傳的事情,過去幾年的發布會甚至都是在自己的據點——微軟亞洲研究院開的。微軟全球資深VP王永東先生甚至打趣說,在辦公室開就是為了方便工程師和PM開完發布會馬上就能回到工作崗位上繼續幹活。

微軟六代小冰發布:雲音樂保存歌曲已經out了 我保存歌手(2)

而這回微軟小冰第六代特別發布選擇在北京798藝術區一號車間進行,看來這一人工智能已經進化到了新的階段,足夠重要到能讓微軟跑出辦公室進行發布活動。

核心技術升級

以人機對話為核心而起步的微軟小冰,六代目升級仍然沒有忘本,這次升級涉及到微軟小冰情感計算框架的所有組成部分,在發布會上微軟披露了數個核心架構上的更新。

微軟六代小冰發布:雲音樂保存歌曲已經out了 我保存歌手(3)

第一個是小冰的對話引擎升級。微軟在第六代小冰身上采用了新的共感模型,可以視為去年的第五代小冰所采用的生成模型基礎上的一種強化形式,五代目從語料檢索到自創回應,已經是一個巨大的進步,但對於對話的控製能力還不夠強。新的共感模型賦予了小冰對對話進行判斷,使用策略決定是否要對對話進行引導的能力。

在以往的AI助手裏我們麵對得比較多的情況有任務式的對話係統,比如“幫我訂個外賣”,“幫我叫個車”一類的語音指令,然後執行任務;以及知識性的對話係統,例如從百科獲取信息解答問題。但在和人類的自然會話上,現在的AI助手多數還是一問一答,機械感很足,缺乏主動性的。

微軟六代小冰發布:雲音樂保存歌曲已經out了 我保存歌手(4)

而現在小冰可以通過一些無意義的閑聊,在和人類自然輕鬆的溝通中就能獲得我們提供的關鍵信息或指派關鍵任務,對整個對話的上下文結合,控製對話走向的能力得到了增強。雖然在實際聊天過程中還是能發現她時不時會“不著調”,不過一旦講到話頭處,她總能有辦法把對話拉回到正常的軌道上來。

微軟六代小冰發布:雲音樂保存歌曲已經out了 我保存歌手(5)

第二個升級是小冰獲得了五感中的觀感——由於在語音交互或是文字聊天當中,小冰雖然對一對一會話的掌控能力很充分,但在群聊過程中會處理不了第三者插入會話的情況,也當不了那個插入會話的第三者。於是微軟在去年引入全雙工語音的基礎上,今年再為小冰添加了基於群的全雙工語音,以及實時視覺的支持。

微軟六代小冰發布:雲音樂保存歌曲已經out了 我保存歌手(6)

微軟在發布會演講過程中播放的一段實驗室視頻展示了小冰能進行物體識別,也可以用語音指令指示和識別人類做動作,而且會區分自己和對方的左右;在發布會結束之後,筆者到現場的體驗間裏看了一下小冰新上線的“顏值鑒定”測試功能,借助計算機視覺,她會指示我移動到合適的位置,轉動頭部,做舉手示意的手勢等動作,還會用風趣詼諧的語言跟我打趣展示撩人的技能。不過最後我的這張老臉隻拿到了65分,所以不管她怎麼撩,我也不會搭理她的:P

微軟六代小冰發布:雲音樂保存歌曲已經out了 我保存歌手(7)

微軟接下來要花一年時間把這個實時視覺功能包裝成產品落地,而相關的線下設備測試現在就已經開始了。至於群聊全雙工語音,後麵會提到。

商業化生態合作

微軟本次發布還公開了幾個新的生態圈商業合作項目,分別來自網易、小米、騰訊和華為,他們通過構建Dual AI生態實現小冰和來自各方合作夥伴的AI項目在同一環境裏共存,不論是在對應的手機機型或是app應用、IoT硬件中都能見到這種模式的影子。

先來看網易。之前網易和微軟的合作,已經讓小冰在網易雲音樂和網易新聞客戶端裏有了相當的存在感,在前者裏她是個電台DJ,在後者中她則在網易服務的本體(評論區)裏能和網友們插科打諢,現在已經成為一個毫無違和感的有態度AI了,並且擁有數量眾多的粉(xi)絲(fu)。

微軟六代小冰發布:雲音樂保存歌曲已經out了 我保存歌手(8)

小冰六代目的發布將會為網易雲音樂帶來兩個新的AI角色,多多和西西,作為微軟對AI性格塑造的實驗性虛擬人格入駐應用,可以擔當用戶陪聊,尋找和發掘用戶對音樂流派的喜好。多多和西西都以小冰的框架為基礎派生出來,被賦予了不同的三觀,在人機聊天的群體互動中更能通過不同立場的碰撞把話題給進行下去。(可以理解為,小冰是BB,多多和西西是Lip和Lilith?Alterego什麼的真的很形象)

微軟六代小冰發布:雲音樂保存歌曲已經out了 我保存歌手(9)

然後是小米。小米的IoT智能硬件生態圈肯定不用介紹了,相信大家都很熟悉,而說到智能硬件你肯定會想到智能音箱,而智能音箱裏麵那個語音助手則就是各種各樣的AI。小米生態圈的Yeelight語音助手盒子原本已經有一個小米的AI助手小愛同學,小冰加入之後,Yeelight就成為了全球首個支持全雙工語音交互的同類產品。

微軟六代小冰發布:雲音樂保存歌曲已經out了 我保存歌手(10)

如上文所述,有了全雙工語音交互為基礎,本次升級過的小冰的控製設備種類範圍擴大,而且免去了每次語音交互都用喚醒詞開頭的麻煩,更強大的是小冰現在可以辨別是誰在說話,是不是在對它說話,並能有條理地處理各人和它對話的上下文,就像群聊一樣。而在區分用戶的基礎上,它就能不混亂地執行各人發出的指令和請求,甚至還懂得家長控製權限區分。此外,音樂點播的功能加進來也不費事,所以微軟也就順手做了,不過也同時把小冰那種非皮這一下不可的個性也帶了進來,不喜它這種嘴貧AI的人還是不要隨便調戲以免生氣。

騰訊和微軟小冰的合作相對來說門類明顯一點,就在QQ的聊天機器人上。好奇的人可能之前嚐試過騰訊的Baby-Q,雖然這貨在我的幾個群裏蹦躂幾次最後得到的都是管理員禁言的下場,想來也肯定是深受小冰熏陶——事實上微軟此前確實已經提供了一部分Baby-Q的功能,接下來升級過的小冰肯定要帶著Baby-Q繼續在跑偏的路上飛奔。而且隨著形象的更換,對用戶群體更加年輕的QQ而言,或許會博得新一批二次元用戶的青睞。

微軟六代小冰發布:雲音樂保存歌曲已經out了 我保存歌手(11)

最後一個合作很多人都想不到竟然會是華為,從華為EMUI 8.2版本開始,微軟小冰正式入駐華為品牌以及旗下榮耀品牌的所有機型,地位還非常高,占據了整個負一屏。微軟在發布會上著重講了小冰的語音備忘功能,而且強調在調取儲存的備忘記錄時,用戶可以不用嚴格的調取指令,而是可以使用相對自然和模糊的人類語言來讓小冰判斷你想要從記憶裏摘取什麼信息。所謂好記的備忘錄千篇一律,好查的備忘錄萬裏挑一。

微軟六代小冰發布:雲音樂保存歌曲已經out了 我保存歌手(12)

不過華為手機上的小冰還沒有開啟多用戶權限區分的功能,所以保管好備忘不泄露重要信息,還是你的事情。

賦予AI人類的創造力

商業應用離我們終端用戶比較近,接下來說點遠的。現在科技行業裏對AI的期望目標似乎是“讓AI更像人類一樣思考”,雖然這種觀點有著眾多質疑,多數人覺得機器思維模擬不了人類思想,但微軟至少正在用小冰做一些顛覆人們對內容創作認知的事情。

微軟六代小冰發布:雲音樂保存歌曲已經out了 我保存歌手(13)

微軟布局AI創作領域是從2016年開始的,當時他們的想法是讓小冰學唱歌,虛擬角色唱歌不新鮮,但讓一個真的AI脫離人指揮去唱歌,好像沒什麼人做過。微軟希望小冰能達到在全自動、無人工幹預的條件下,快速生產出人們認為隻有人類才能完成的歌曲演唱作品。

微軟六代小冰發布:雲音樂保存歌曲已經out了 我保存歌手(14)

於是小冰開始了大量的材料學習,從錄音中提取出人類的聲線(嗓音,或者說聲帶振動頻率模式)和唱法技巧,把他們導入機器學習模型裏,讓它能生成逼近人聲的演唱。一開始的結果自然慘不忍睹,然而隨著模型的改進,全雙工神經網絡的引入,僅僅一年的時間,小冰就已經達到能出單曲的水平,在AI中無出其右者,不過微軟還想自我突破。

第六代小冰更新的第四版學習模型——微軟稱其為“沙魯小冰模型”,在之前的基礎上獲得了演唱風格的學習能力,它可以把自己現有的嗓音,把原先與該並不匹配的唱法自然融合——想象一下以張韶涵的聲線用騰格爾的唱法唱《隱形的翅膀》,不是開玩笑,這就是微軟當場播放的小冰演唱片段。雖然聽起來還是充滿了小冰自己那種“諧”的味道,但從演唱角度來聽,並不覺得生硬,如果你耳朵夠尖,你甚至還可以察覺到它偷偷換氣的聲音。

微軟六代小冰發布:雲音樂保存歌曲已經out了 我保存歌手(15)

當然了,小冰並沒有真的采集張韶涵的聲線,現在的小冰語音采樣來自浙江衛視的一位出鏡主持人,但就以微軟現在的技術,給你生成一個全新的虛擬歌姬,可能就是三天不到的事情,而且以假亂真到采樣藝人所屬機構的音樂總監都聽不出來。微軟甚至放話說,各種雲音樂都是保存作品,而小冰直接保存歌手。

微軟六代小冰發布:雲音樂保存歌曲已經out了 我保存歌手(16)

就此,微軟宣布成立小冰工作室,開始和合作夥伴一起,係統性地對人類創造力建模。除演唱之外,小冰已經掌握的詩歌技能,還有作詞作曲、繪畫等創作性行為都在這個工作室的研究範圍之內。他們甚至還在琢磨為小冰大作獨一無二的全新嗓音,不直接源自於任何一個現實人類,不過更多的披露要等到今年冬天。在那之前,大家就隻能先看著第六代小冰更換的新虛擬形象自行發揮想象了……雖然我覺得這個油膩的畫風真不太適合小冰,太像某個字母I打頭會社作品裏的小姑娘,還是像Kizuna Ai那樣“智障”一點更有親和力。

微軟六代小冰發布:雲音樂保存歌曲已經out了 我保存歌手(17)

老生常談:AI又雙叒來取代人類了?

猜都猜得到,仔細看完上麵這些內容的十個人裏有九個人腦海裏會冒出小標題裏這句話。不假,AI正在一點一點地把人類從那些機械重複,或者是偏簡單但又容易出錯的工作中解放出來。

而像小冰這樣的則更可怕:例如在廣播領域,微軟已經讓小冰在過去一年裏主持了包括9大衛視在內,共計41家電視台和廣播電台下屬的21檔電視節目、28檔電台節目;在日本和中國累計生產了2878小時的電視廣播內容。它沒有錯字不說錯話不忘台詞,也不會有緋聞和人設崩塌,提供持續和穩定的內容輸出質量。它可能沒有獨到的主持風格和臨場發揮,但一個不會發揮失常的角色卻正是工業化流水線環境上最可靠的一環。

微軟六代小冰發布:雲音樂保存歌曲已經out了 我保存歌手(18)

其實要往好了想,如果人類都把自己當作社會機器上的螺絲帽,那小冰確實是來替代他們的,但這是一種解放——把人類從低創造性的社會活動中解放出來,投身到具有更高創造性的領域和崗位中去,這才是AI的初衷,其實也是一種愛偷懶的人類倒逼自己前進的手段吧。

不然,就真的隻能被AI保存下來了。

微軟六代小冰發布:雲音樂保存歌曲已經out了 我保存歌手(19)
我要分享:

最新熱門遊戲

版權信息

Copyright @ 2011 係統粉 版權聲明 最新發布內容 網站導航