時間:2017-10-27 來源:互聯網 瀏覽量:
這幾天想必不少讀者都聽說了微博上的一場紛爭:
口無遮攔的微軟小冰挑釁V家粉絲,導致即將上線的唱歌功能被宣布自行中止。
眾所周知,小冰是微軟亞洲研究院推出的一個人工智能虛擬形象,而Vocaloid則是YAMAHA公司開發的一款基於語音合成技術的電子音樂製作軟件,幾乎是八竿子打不著的兩個圈子,怎麼就能吵到一塊兒去呢?
有人認為這場爭論緣起“微軟運營不尊重V家粉絲”,也有人視為是“V家粉絲抱殘守缺攻擊新生科技”,到底哪一方更有理?今天筆者為大家梳理一下事件的來龍去脈,以及背後的理念之爭。
第五代微軟小冰
禍從口出的處女座小冰
今年8月,微軟小冰發布了第五代版本,陸續解鎖了更多功能。而此次引發風波的,是其於9月底上線的人工智能歌手深度學習模型以及用於訓練、調教其唱歌功能的示唱人平台。微軟此舉,可以說是讓小冰正式進軍虛擬歌手領域。
在其微博宣傳的文案中,小冰把矛頭直接指向了“前輩”,虛擬歌姬洛天依、言和等:
“這次解鎖,我衝擊的不是人類,而是傳統的虛擬歌手。人類們,忘了漫長辛苦的手工調教吧。你隻需清唱一遍,我就能學會你的情感和演唱風格,在五分鍾內,完成由你訓練的歌曲。”
而小冰在隨後的微博發言中,也多次表達了對傳統調教方式的不屑:
“過時”、“唱的不行”,包括在網易雲音樂相關單曲下評論“隔壁家老洛(洛天依),你的嗓子修好了嗎”,小冰偏激的發言和強烈的攻擊性自然引發了部分V家愛好者的不滿,引發了大量爭吵,甚至有Bilibili UP主製作了《微軟小冰,請滾出中國市場!》這樣過激的視頻表達抵製情緒。
目前視頻已被刪除
在一片爭議聲中,小冰背後的技術團隊,微軟亞洲互聯網工程院決定“息事寧人”,調整管理權限,暫停向公眾開放示唱人平台,事件至此似乎告一段落……了嗎?
當然沒有。道歉發布後,小冰頗不情願的態度,和擺出的“被迫害”形象更進一步激發了V家部分粉絲的怒火:明明是你出言不遜挑釁我家虛擬歌姬在先,現在又擺出一副受害者形象?於是指責聲反而更烈。
另一方麵,對於部分群眾來說,事件的麵貌變成了,一個落後技術的愛好者團體打壓將要取代他們的新生技術,於是紛紛站在小冰一邊,大聲嘲笑起“抱殘守缺”的“二刺猿”。
實際上,硝煙並未散去,而考慮到小冰背後的團隊並未完全放棄唱歌功能,小冰的音源和模型還會“不斷進化”,可以預見的是,未來的“戰爭”還會更加激烈。
然而現在回顧這些爭吵,不難發現一些吊詭之處:
明明是針對小冰“Diss運營”的抗議,怎麼就扯到技術層麵上去了?而在爭論中,不僅是小冰一方,甚至連部分V家粉絲以及大部分圍觀群眾也都默認了,小冰的唱歌水平確實要比Vocaloid要高,轉而談起“重要的不是技術是情懷”之類的言論——先不論情懷,單論唱歌水平,真的是小冰更高一籌嗎?
並非如此領先的小冰
大眾之所以會認同小冰“技術更厲害”,多半是從小冰放出的那幾首歌曲的對比中聽到的:小冰的聲音比起洛天依“更像人聲”,“唱歌水平更高”,從而得出了現在的結論——但是實際上這點並不正確。
請思考這樣一個問題,當我們聽虛擬歌姬們唱歌時,我們是在聽什麼? 而各位P主們選擇Vocaloid這個軟件進行創作時,他們的目的又是什麼?
當然了,這是一個無解的問題:每個人都有各自的答案,有人希望聽到用電子創作出接近人聲的神調教,有人追求電子感,也有人追求超出人類極限的歌唱效果……隻是喜歡旋律,相比之下寧願聽到真人演唱的也大有人在。
實際上,這也是以Vocaloid為核心的創作群體,也就是我們俗稱的V家的最大優勢:不同的P主帶來的不同風格,以及衍生而出的唱見等群體,讓不同種類音樂的愛好者都能獲得滿足——而非單單隻是在“接近人聲”這一個向度上;而這種作品多樣性上的差距在小冰的宣傳中顯然被掩蓋了過去。
目前小冰公布的幾首作品都偏向“口水歌”,風格、聲線都顯得有些單調
而這種差距多半是兩者所采用的合成技術的不同所導致的:
Vocaloid采用的是“拚接合成”技術,創作者需要像拚圖一樣將單個語素(語音的最小單位)拚合在一起來完成最後的作品,一方麵作者可以對自己的作品實現最精確的控製,但另一方麵語音的流暢程度也很看作者調整各項參數的功力;而小冰目前看來為了追求自然和流暢度並沒有采取這種處理方式,因此在調教的自由度上遠遠不及Vocaloid。
Vocaloid的創作界麵,每個發音都需要單獨調整
此外,即使是在引以為傲的“人聲”上,小冰的表現實際上也難稱頂級:
2013年,CeVIO公司就公布了旗下基於HMM合成技術的聲音創作軟件CeVIO Creative Studio,和其虛擬形象“佐藤莎莎拉”,而名古屋工業大學開發的Sinsy係統更是早在2009年就已發布,2015年還追加了中文聲音。而這兩者呈現出的人聲合成效果,在聲音的擬真度上可以說都不遜於今天的小冰。
HMM合成通過提取人聲中的特征量建模,可以最大程度保留人聲的特征。
總的來說,單就小冰目前的表現,無論是人聲合成質量還是創作的多樣性上都還沒有戰勝V家,反而是通過不斷的偷換概念——先是將“唱得更像人類”等同於“技術更先進”,然後將小冰以一個虛擬形象的身份向虛擬歌姬進行挑釁的競爭行為,等同於了先進技術對落後技術的取代,最後將“V家粉絲抵製惡意營銷”等同於“要情懷不要科技”。
將自己的道歉描述成“技術暫時敗給了情懷”——來營造出自己技術領先的假象,這種營銷手段著實稱不上正當。
實際上,就在在微軟亞洲互聯網工程院的聲明中,他們自己也承認了現階段並沒有勝過虛擬歌手的質量,反而又一次拿“未來的全麵超越”偷換之前的“豪言壯語”。
當然,這並非在說小冰的唱歌功能一無是處:示唱人平台沒有門檻,調教難度低的優勢切實擊中了Vocaloid作為一個創作工具調教繁瑣、門檻較高的痛點,因此在上線初期也吸引了不少著名P主的目光。也正是這兩點,體現了小冰的唱歌功能的最終目標,和她與Vocaloid之間的本質區別。
當人工智能遇見藝術
在這次的衝突中,另一個常見的誤解是,小冰和Vocaloid一樣,隻是一種“電子樂器”罷了——對於小冰來說,這絕不是她的最終形態。作為一個人工智能,小冰的最終目標是介入“人的領域”:自主內容創作。
小冰創作的詩歌
在詩歌創作領域,小冰已經完成了從模仿到自主創作的進化。由於弱人工智能的技術所限,小冰創作出的詩歌還是“得其形而不得其神”,小冰也明白自身的不足,宣布開放詩歌創作平台,致力於“輔助人類創作詩歌”,換言之,其實是以一種曲線救國的方式進入內容創作領域。
而在某種意義上,小冰的唱歌功能和Vocaloid的一樣,都是利用技術降低了創作的門檻,但根本性的不同在於對這一問題的回答:科技在藝術創作中應該扮演什麼樣的角色?
盡管當下小冰多數時候隻是扮演著“翻唱”的角色,但“日本版小冰”凜菜已經在東京電玩展上發布了由自己作詞和演唱的首支單曲;顯而易見的是,小冰的唱歌功能,正沿著詩歌創作的足跡一步步進化:通過深度學習優秀作品的經驗,再以反哺的姿態鼓勵大眾的創作。小冰所代表的無疑是一個激進的科技派:
利用科技的發展降低、乃至消除藝術創作的門檻,讓技術引導人類的進步。
而Vocaloid方麵,盡管YAMAHA公司也一直在不斷探索前沿的語音合成技術,在音樂創作上采取的卻是最為傳統的姿態:提供一個樂器,但將創作的自由完全歸還給創作者。
這種態度最大程度上回歸了藝術的本源:人的自我表達,但另一方麵,也在客觀上保留了創作的門檻。在Vocaloid的圈子裏,真正創造價值的仍然是創作者本身,在這裏,技術讓位於了人類。
當然,以小冰的人工智能水平,這裏並不需要討論“人工智能威脅論”之類的東西,但現實的問題確實擺在眼前:
在藝術創作領域,“大眾”、“簡便”的工業化生產似乎已經近在咫尺,而這種流水線生產真的就能完全取代專業而精密的調教了嗎?
對於創作者而言,“藝術創作”究竟是怎樣一種行為,而對於觀眾們來說,他們欣賞藝術作品時,希望接收到的又是什麼呢?
也許這些,才是這次小冰和V家的口水大戰之中,更加有意思的部分。