時間:2017-05-22 來源:互聯網 瀏覽量:
AI 人工智能似乎正處於最好的時代,但它距離理想中的形態,恐怕還有很長的路要走。
有關人工智能,擺在研究人員麵前一個非常重要的問題是:如何使人工智能能夠模擬人類,進行獨創性的內容生產,並不斷通過學習提高自身創造水平。
正如微軟工智能及微軟研究事業部負責人沈向洋博士提出的關於「人工智能創造」的三原則:人工智能創造的主體,須是兼具 IQ 與 EQ 的綜合體,而不僅僅是具有 IQ;人工智能創造的產物,須能成為具有獨立知識產權的作品,而不僅僅是某種技術中間狀態的成果;人工智能創造的過程,須對應人類某種富有創造力的行為,而不是對人類勞動的簡單替代。
而現在我們所能看到的人工智能,更多處於「簡單替代人類勞動」階段。即便是在 Google Home 或者亞馬遜 Echo 這樣已經相對成熟的落地產品身上,依舊很難看到獨立創造力的展現。
當然,雖然各大科技巨頭都在布局人工智能,但大家的發力方向各不相同,產品形態也有所差異。不同於「小娜」的工作定位,小冰一向給人的印象是娛樂陪伴型助手。而這次率先讓我們看到有一些「不同」的,正是後者。
它是第一個發表詩集的「非人類」作者
5 月 16 日,微軟舉辦媒體溝通會,展示了小冰在寫作、歌唱、財經評論能力等方麵的進展。三天之後的 5 月 19 日,微軟聯合湛廬文化發布全球首部由人工智能獨立完成的詩集《陽光失了玻璃窗》,而這部詩集的作者正是小冰。
借用湛廬文化副總編董寰對於小冰發表詩集的看法:我們都在想,如果說有一天機器具有了情感,它會思考,它具有了創造力會是什麼樣子呢?沒有想到的是,這個時間來臨的比我想象中的要快。
實際上機器替代人類寫文章,並不是一件特別新奇的事情。早在 2012 年就有報道稱,美國出現了寫稿機器人,每天都在各大網絡媒體上產出報道,尤其在體育報道上表現搶眼,機器人在比賽結束「那一刻」寫出來的總結性報道很快就成了各個網絡媒體體育板塊上擁有最高點擊量的文章。
最近有關機器人寫作的報道,是之前企鵝財經發布了一篇由寫作機器人基於算法自動生成的的文章《8 月 CPI 同比上漲 2.0% 創 12 個月新高》,一時間引發了媒體的熱議。不少編輯/記者也發出了「要丟飯碗」的感慨。
但以往機器人寫出的文章,更多的是以單篇新聞報道類為主。能夠形成合集並且正式出版,此次的《陽光失了玻璃窗》尚屬首次。而微軟小冰,也成為了第一個發表詩集的「非人類」作者。
文章存有瑕疵,但不再冷冰冰
就產出結果來看,之前的寫稿機器人和微軟小冰作詩都是以文字作為呈現形式。不同的地方在於,前者的文章更像是單純的詞語堆疊,給人感覺「冷冰冰」,後者讓人欣喜的地方是為文章賦予了簡單的「情感」。
以微軟小冰創作的《是你的聲音啊》為例:
微明的燈影裏
我知道她的可愛的土壤
使我的心靈成為俘虜了
我不在我的世界裏
街上沒有一隻燈兒舞了
是最可愛的
你睜開眼睛做起的夢
是你的聲音啊
對於以上這首《是你的聲音啊》,歌手創作人朱婧汐(曾參與鹿晗首張專輯創作)用「理性」和「感性」這兩個詞來形容。在她看來,大部分的情況下藝術創作是一個非常感性的事情。而小冰的創作完全是運用了另外一個邏輯,是基於得到的數據和信息來完成。並且速度非常快,打破了關於藝術創作到底是理性還是感性的界限。
另外如微軟市場公共關係部的徐元春所言,小冰的很多詩句中,都會出現諸如太陽、小鳥、沙灘等詞語。而這些頗具帶入感的詞語,正是模仿了人類在詩詞創作過程中經常用到的「借物抒情」的手法。至於如何在數據庫中調用這些詞語,微軟顯然有著自己一套獨特的邏輯算法。
當然,閱讀過微軟小冰的詩集之後,實際上它的創作依舊存在諸多問題,處理一些讀音相近的字詞,會有偏差。比如「在」和「再」兩個字的運用上,經常出現錯誤。
有意思的一點是,在《陽光失了玻璃窗》這本詩集中,並沒有對以上提到的這些錯誤進行人工修正,隻是在出現錯誤的地方用括號的方式給予了注釋。對此,微軟的說法是希望能夠保證這本詩集的完全自主性。個人而言,能夠認識到發展中的錯誤並且正麵麵對,對於未來的發展一定是有好處的。
寫詩這件事情,小冰是如何做到的
之前采訪「雲知聲」CTO 梁家恩先生的時候,他也曾說過,實際上 AI 人工智能走到今天,算法沒有太多的秘密,可能有不同,但要想實現大幅領先,並不是一件容易地事情。而除算法之外,背後作為支撐的大數據庫無疑是頗為重要的一環。
就算法而言,微軟小冰基於微軟提出的情感計算框架,以 EQ(情商)為主攻方向,打造具備完整感官和知識圖譜的對話式人工智能。
另外據微軟給出的數據顯示,無論從用戶數量、活躍度和交互流量來看,微軟小冰均是目前全球最大規模流量的對話式人工智能產品。截至 2017 年 4 月,微軟小冰已擁有超過 1 億用戶,累計對話量超過 300 億,平均單次對話輪數(CPS)達到 23。
微軟小冰團隊部署於四個國家,在 14 個平台上與用戶進行交互,包括中國大陸地區的微信、QQ、微博,美國地區的 Facebook Messenger,以及日本地區的 LINE 等。除上述第三方平台外,微軟小冰亦已全麵內置於中文版 Windows 10 操作係統中。在數據采集上,微軟小冰無疑頗具優勢。
具體到作詩這件事情上,微軟小冰師從 1920 年以來 519 位中國現代詩人。經過對幾千首詩 10000 次的(迭代)學習,從而獲得現代詩的創造力,並逐漸形成了自己的風格、偏好和行文技巧。
而小冰的寫作風格,很大程度上來自於某段時間內,它所接觸到的數據風格。比如給小冰學習我國 1920 年到 1940 年代的詩,它的作品會偏向於悲壯、非常傷感。
它留給了我們更多的想象空間
人工智能小冰寫詩這件事情,讓我聯想到之前的穀歌 AlphaGo 大戰李世石事件。從某種角度而言,事件本身可能並非最大的價值,更大的意義在於對整套邏輯算法以及背後大數據調用方式的探索,這也是為未來人工智能的發展作鋪墊。
而微軟小冰此次能夠獨立作詩的特殊性在於,它正在嚐試由單純模仿進入到創造階段,並且通過一些典型詞語,來使得其產出的文章能夠富有情感。
需要說明的是,這依舊並不意味著微軟小冰已經擁有了類似於人類一樣獨立的「情感」。從實現角度來看,它還是依靠模仿人類使用語言的表達規則,來完成抒情這件事情。隻能說,通過微軟小冰發表詩集這件事情,證明了它已經一隻腳踏進了創造階段,並沒有進化完全。
但從目前小冰所取得的成績來看,微軟的這次嚐試非常成功。而且厲害的是,未來通過不斷地學習不同領域知識,不難現象,它將擁有更加強大且豐富的獨立創造能力,也留給了我們更多的想象空間。
當微軟小冰擁有足夠多的知識儲備,配合日趨縝密的邏輯算法,也許就是我們理想中的人工智能。當然,可以預見的是,這個過程是漫長且困難的。但起碼目前證明,微軟選擇的這條路是正確的。