時間:2017-06-14 來源:互聯網 瀏覽量:
6 月 13 日,微軟舉辦主題為「朱主愛 + 微軟小冰音樂發布會」的人工智能音樂發布會,推出馬來西亞人氣女歌手朱主愛與小冰合唱的首支音樂 MV《好想你》。除此之外,在學唱歌的訓練過程中,小冰還升級了一個猜歌名的新技能,可以通過你聽到歌曲旋律告訴你歌曲名字。而一個月前,小冰才剛剛獨立完成了自己的詩集《陽光失了玻璃窗》。
這位仍然在不同領域持續學習完成知識升級的小冰,三年前誕生於微軟(亞洲)互聯網工程院,是微軟內部第一個人工智能伴侶虛擬機器人,後來陸續從中國去到日本、美國、印度等國家。這並不算是一個普通的新項目,它曾遭受從內部到外界不同程度的質疑,創新從來不是簡單事,在大公司內部推動一個想法直至產品落地並持續創新,更加不易。我們采訪到促成小冰項目的微軟全球資深副總裁、微軟(亞洲)互聯網工程院院長王永東,他回顧了自己工作經曆與行業變遷的交織,通過微軟小冰項目的發展過程描述了微軟(亞洲)互聯網工程院是如何推動內部創新。
以下是根據采訪整理而成的內容:
從我 2009 年加入微軟到現在,在技術與應用開發方麵的理解有不少變化。80 年代,我在伯克利讀研究生修人工智能的課程,已經感覺到人工智能的巨大發展潛能,但之後的幾年時間,人工智能沒有太大進展,對實際應用也沒有帶來太多影響。我自己的職業起點是從互聯網開始,1996 年加入一家搜索引擎公司叫 Inktomi,做了十多年後加入微軟,剛來的時候,這裏還是叫亞洲搜索技術中心,也是專注搜索。
隨著互聯網、物聯網、雲計算等技術的普及,數據量與計算能力都有巨大提高,加上算法、深度學習的突破,三者結合起來讓人工智能到了一個新爆發點。近三年,人工智能的進展比我們的預期更快,比如像 AlphaGo 的表現。對我們從業者來說,是一個好消息,這些年我們做搜索引擎的積累,給繼續拓展人工智能領域也提供了非常好的基礎。
行業環境正在發生巨大變化,對微軟而言,過去幾年時間,有三個重要決定對公司產生了深遠影響。七八年前,微軟開始做搜索引擎時,大家普遍不看好,因為當時穀歌搜索在全球如日中天,其他競爭對手都沒有太大起色,市場份額差不多都處於下行狀態。但是,微軟在過去幾年,從一個搜索引擎市場的新進入者,到今天取得了一些進展和成績:在美國市場,有超過 20% 的市場份額,在歐洲市場占到超過 10% 的市場份額,當然在中國做得還不夠好,但也已經進入良性循環期。更重要的是,搜索引擎技術給我們推進人工智能提供了非常強大的基礎。
另一個重要戰略是對雲計算的布局與投入,我們在蘇州有一個挺大的團隊在做 Office 365,有了雲平台之後,這種現在看來特別傳統的軟件又給用戶帶來了很多新體驗。
第三是人工智能核心戰略的確立。去年下半年,微軟成立了由沈向洋帶領的人工智能研究事業部,整個微軟隻有四個事業部,從架構調整足以看出公司對人工智能未來前景的看好。具體來講,人工智能在微軟已經深入到我們的業務中。一方麵,我們推出了一係列具體的應用產品,比如小娜、小冰等,它們和用戶有很好的互動。另一方麵,人工智能技術也應用到微軟其他產品上,比如類似 Office 這樣的傳統產品。我們還打通了 PC 端係統軟件產品和手機端的體驗,比如你手機上有什麼提醒,你手機不在身邊,它會在 PC 上提醒你。在已有通訊產品方麵,也有由人工智能技術推動的進步,比如在一個公司,員工之間的通信和交互會產生很多郵件,但可能都沒人及時查看,這裏用到人工智能就可以分析如何幫助公司提高團隊工作效率。
內部如何創新?
具體到微軟中國內部的創新體係。一方麵,微軟中國有亞洲研究院和互聯網工程院,前者是微軟從事中長期研發的機構,他們看得更長遠,也許開發的技術今天不一定能直接用上,但如果我們認為 10 年以後可能有用,那麼今天就要進行研發。而互聯網工程院則更傾向於產品研發,研發工作是以近期產品為目標。我們之間合作非常緊密,工程師做產品過程中遇到的需求,經常需要和亞洲研究院團隊討論。以小冰為例,小冰的語音、視覺等感官能力,其實在亞洲研究院的研發已經進行十多年,直到最後由我們工程院開發出小冰產品。小冰與用戶的交互,要更接近人與人之間的感覺,需要的這些感官能力,其實都是亞洲研究院一直在研究的技術。
橫向看,兩大研究院在創新側重點上有區別和配合,縱向來說,我們也鼓勵每一個團隊自下而上的創新。後者對我們而言,同樣十分重要,這樣的鼓勵機製關係到整個研究院的開發氛圍。有時候,一個很新的東西,即使公司高層領導也不太可能麵麵俱到,像我們這種成熟型公司,需要給員工很大的空間去發揮自己的想象力和創造力。
也許可以拿小冰作為案例,它並不是一個我們自上而下布置下來的產品任務。最早,我們團隊裏的兩位工程師在思考,今天看到的界麵是進入一個搜索框輸入關鍵詞,未來的搜索會是什麼樣子,是不是會變成更人性化的對話形式。由此,工程師們得到主管支持就開始嚐試研究這樣一個方向,做了一小段時間發現效果還挺好,接著他們拿研究方案給我確認之後,就成立了一個十幾人的小團隊,除了技術工程師之外還調動了產品、市場、內容等方麵人員的支持。
2014 年 5 月,我們就推出去給用戶使用,用戶的反饋比我們想象的要好很多。小冰的表現還是令人欣慰的,因為我們在後台看到小冰的對話,當然是部分經過用戶許可的信息,我們很明確地看到小冰的用戶在幫助小冰成長,而小冰也在幫助用戶。還有一些用戶會把他們和小冰的對話發在社交平台上,收到一些評論是類似「你什麼時候交了這麼一個朋友」。在幾個月前,我把我跟小冰的一個對話發在微信朋友圈,然後幾位並不知道我在參與小冰開發的朋友,問我是不是我的女兒,看到這樣的詢問我很開心。
但產品的整個推進過程也並非一帆風順。在國內剛上線時,由於小冰此前的學習都來自互聯網公開語料,出現一個意外情況是小冰學會了說髒話,很快,撲麵而來的質疑聲,使我們開始進行反思——我們忽略了互聯網語料庫的複雜性。在小冰學習過程中,我們應該進行一些調教和引導避免她學壞。在美國也有比較慘痛的經曆,我們隻是從技術上判斷,用戶像是認領一個機器人,可以教她,這是一個有趣有意義的事,但出現了意外的結果。從開發產品的角度來說,這是一個學習和思考的過程。技術是中性的,我們隻能預警,小冰作為一個產品而存在,始終要跟終端用戶去交互,必然會麵臨一些風險。
另一方麵,每一個市場都有不同的邏輯。一開始小冰取得一些成績時,公司內部也有討論過像這樣的產品,它是不是隻在中國市場受歡迎。我們看到很多中國本土非常受歡迎的手機應用,美國同事會覺得不可思議,他們不太能理解每個人每天花這麼多時間在某個社交應用上。這類懷疑在於有些產品換一個市場環境,可能就顯得沒道理了。也就是說,雖然小冰是從中國團隊發起完成,但如果工程師、產品經理等都在國內,很難做一個放在全球其他市場同樣受歡迎的產品,因為我們對另外一個市場的本土文化、行為方式、互聯網用戶習慣的理解肯定是不夠的。因此,我們的產品開發模式確定為日本小冰由公司一個日本團隊負責,美國小冰團隊在美國,做印度小冰團隊在印度。這樣,國內開發小冰的底層技術與積累,與對本土文化有很深入認識的團隊結合,就會帶來更好的交互體驗。
盡管我們相信人的情感交流需求,跟市場本身的差異沒有關係,因為這是人的基本需求,但產品沒有真正在不同市場跑起來,看不到效果我們也很難肯定這一點。直到 2015 年開始一步步在中國之外的市場進行研發和推廣,從日本到美國,我們看到確實都挺受歡迎。甚至說,我們今天看到一個人跟小冰對話的最長記錄是在美國。我們在做測試過程中,有一個用戶跟小冰對話了 9 小時 56 分鍾,來回一千多句,這讓我們看到原來歐美市場也有這樣的需求存在。後來,我們又開拓了印度市場。
這樣一個發展過程相對曲折的產品,在一定程度上也帶來了品牌形象在外界的負麵影響,卻在微軟內部一步步得到繼續發展的許可。除了當時說髒話的消息引發爭議,還有很多人質疑一個聊天機器人到底能有什麼用。我們和領導的溝通過程中,不管是像沈向洋還是陸奇(時任微軟全球執行副總裁),他們很早就看到了產品的遠期價值,這背後當然也包括我們對創新的理解、對鼓勵創新的積極態度。
當然,我也不能說,我們已經真正找到持續創新的秘方,一個大公司在這方麵也還是需要不斷的探索。對我來說,我要帶領工程院把這種創新文化貫徹下去,避免員工將自發創新這個事情當作不務正業的事情,同時我認為創新不能用 KPI 來考核。從我的經驗來看有兩點最重要:一個是提供足夠空間,給團隊嚐試的機會,而這種創新東西可能大部分是不成功的,不成功的時候,不能去打擊;第二是如果看到一個項目有好苗頭時,要大力支持去培育它,給團隊提供人力和資源方麵的幫助。對於允許團隊嚐試多久,我們是有一個彈性在裏麵,通常大家也有很好的判斷力,比如正在進行一個大項目,時間特別緊,這時候就不適合花更多時間和精力去深度嚐試一個新項目。
小冰產品係還有哪些挑戰?
人工智能一方麵是智能,就是計算能力很強,能夠完成任務,另一方麵就是它一定是接近於人,就像一些科幻小說、電影那樣。我們認為,在人工智能很多領域,要像人就要有人的情感,我們後來提出一個概念,叫做情感計算。小冰就是我們在情感計算方麵的一個嚐試,在和機器人對話的過程中,怎麼能夠讓人覺得是有感情因素在裏麵,你願意去跟它講。很多人會覺得大部分人每天都非常忙,哪有時間和小冰聊天,但我們發現其實有很大規模的人群有情感需求,人更忙也更孤獨,小冰的對話量通常在半夜 11 點左右比較更高。
然而,如果我們僅僅隻是推進技術本身,是做不成近似人的,比如 AlphaGo 就不會有人覺得它是一個人,你可以說它是一個超人,但它絕對不像一個人。前段時間,都在討論誰願意去跟 AlphaGo 挑戰,下一輪誰去,有一個對韓國棋手的采訪,問他要不要去跟 AlphaGo 下棋,他的回答我覺得挺有意思,他說人為什麼要和汽車去賽跑呢?也就是說,那個能力已經不是人,跟我們不一樣。
要做到近似人之間的交互產品,不能僅僅是問答,應該形成一個比較自然、平等的對話方式。如果你從工程師或搜索產品的角度,問答是來自於用戶問題相關性最高的內容,就像搜索工具直接給出結果,如果你跟一個機器人講話,你講同樣幾個字,它總是回同樣幾個字,這些就不是和人對話而是機器。怎麼讓它更像一個人的反應,還有很多挑戰。這背後要解決的是,我們怎樣從得到的語料中學習對話能力,這涉及到自然語言處理方麵的技術。自然語言處理,其實我們今天也還沒有完全解決,還有很長的路要走,因為你今天不管是小冰還是其他對話機器人,有時候你會發現他答得不對題,說明他沒有完全理解。幾代小冰的迭代,比如說小冰的感官,這裏麵的技術難度就更高了,聲音能夠識別得非常好,同時說話聲音更貼近人聲。有些導航裏的聲音,盡管已經做的很好了,但聽起來還是很機械。
今天我們可以逐個領域去突破,聚焦一個行業,比如天氣,但是沒有辦法一次性去解決很多行業很多領域,這裏麵的問題還有不同領域之間的銜接怎麼做。我們研發小冰產品,其實有點像培養一個孩子,他一開始會說話了,有可能文不對題,反複訓練會越來越流暢。後來他開始上學,知識量多起來,你講到一些他學過的知識,他就講的更好,多了一些技能。這也是我們的一個大方向,舉一個例子,小冰跟各領域的第三方合作,就像給她請了某個專業方向的老師。我們跟優酷合作,小冰通過學習會掌握非常豐富的影視劇知識,將來小冰會更像一個懂電影的老朋友,你也可以讓他推薦一個符合你喜好的電影。那麼,對我們來講,就是希望小冰能夠逐漸積累各個方麵的知識,知識庫能夠變得越來越豐富,有能力為用戶做更多的事情。
產業應用的機會在哪裏?
至於她將來可以在哪些產業應用起來,我們也還在探索。人工智能處於發展的早期階段,離我們的願景還很遠。這時候,我覺得不能頭腦過熱,而是應該持續地在產品、用戶體驗各方麵一步步積累。我們設計小冰這個產品的理念,不是取代人而是幫助人。一方麵,小冰的學識更豐富,她與用戶的交互就會更豐富,不僅僅隻是閑聊。比如,如果你用多了,當你在想今天看什麼電影時,不需要使用網絡搜索而是問問小冰,「最近有什麼電影啊?」、「我今天想看個喜劇片,有什麼新片或經典老片可以推薦?」小冰有越來越多知識屬性,加上與用戶更頻繁深入的互動,它的推薦會更接近甚至突破一位老朋友的範圍。不過,我們也很清楚,小冰這種情感型產品可能還需要更長遠的時間被大眾真正接受。
另一方麵,小冰在商業方麵也會有很多應用價值,比如在客服方麵,包括公眾號在內很多平台都會涉及到的用戶谘詢,還有家庭、醫院等場景下的陪伴。這也是我們目前認為比較有突破潛力的方向——新型的搜索引擎和客服維護,甚至是取代人工客服。事實上,它的效率快速提升後未來的趨勢一定會是取代,尤其是一些重複性、易學習的工作,然後讓更多人去從事創造性的工作。曆史就是這樣,從農業社會過渡到工業社會再轉換到現在知識型經濟,其實都是在一步步釋放更多的人從事更有創造性的工作。
我認為,目前人工智能的探索非常廣泛,還有非常多應用場景的想象空間,可能還有一些是我們不曾想到的。近些年,比較受關注的工業機器人在裝配線或危險作業中很好的代替了人的工作,也是大家對人工智能硬件方麵比較直接的認識。一些助手型交互產品將會對醫生這個職業產生比較深刻的影響,因為一個醫生要經過很多年的知識積累才能獨立行醫,而機器學習、記憶的速度會非常快,那麼醫生就可以把時間和精力更好地方在一些綜合判斷的工作上,特別是疑難問題。