時間:2018-01-11 來源:互聯網 瀏覽量:
微軟小冰在 2014、15 年的中文互聯網創造了神話。
她是微軟開發的聊天機器人,人設接近女初中生,口氣活潑可愛,和 Siri 等具備聊天機器人屬性的主流產品風格迥異。用戶和小冰每次對話的輪數 (conversations per session, CPS) 高達 32,遠超 Siri 2-3 的平均值。一半用戶根本沒見過聊天機器人,另一半沒想過聊天機器人也可以這麼能扯。
小冰的出現成為了自然語言處理和情感計算技術飛速發展的最佳證明,第一次解放了人們對於人工智能技術的想象力。她席卷了微博和微信,一度被微信屏蔽,還被拿來和著名科幻電影《Her》裏的人工智能「薩曼莎」相提並論。
毫無疑問,小冰的誕生過程中受到了《Her》的影響,因為被稱為「小冰之父」的前微軟亞洲工程院院長簡仁賢,也是這部電影的粉絲。
簡仁賢有多崇拜薩曼莎?因為小冰不夠過癮,他在 2015 年 9 月離開微軟,創辦了自己的新公司竹間智能。公司的英文名是 Emotibot——情感機器人。
所有專注於技術的人都或多或少有技術崇拜,做了 30 年工程的簡仁賢也不例外。他一度認為,通過標記人臉照片並構建一個擁有大量數據的情感數據庫,然後訓練和調試一個神經網絡,就能讓科幻電影中的劇情成真。2016 年 8 月,創業一年之際,簡仁賢告訴,竹間智能正在打造中國第一個真正的人工智能伴侶。
功夫不負有心人,簡仁賢做出了一個名叫小影的人工智能個人助理。在某次交談中,一名用戶和小影完成了超過 1600 句對話,遠超當時小冰在生產環境中 300 多的最高 CPS 記錄。
創業會改變人,至少肯定改變了簡仁賢。他開始覺得,CPS 多高這件事沒那麼重要了,甚至壓根沒什麼意義。作為公司的 CEO,他越來越發現,在大公司微軟做對話機器人的那套方法論,在小公司行不通。
小冰的名字來自於必應搜索,對於她和小娜 Cortana 這樣的聊天機器人/虛擬助理,用戶的每一輪對話其實都是一個搜索請求。微軟對小冰的 CPS 為什麼看得這麼重?答案也在搜索這裏。
「以前我們做搜索的時候,總是希望用戶在同一個 session 裏搜索越多次越好,因為搜的越多,廣告越多,搜索公司越賺錢,」坐在清華大學旁邊的辦公室裏,簡仁賢如是說。
「到了聊天機器人上變成了瞎聊。我們給小影嚐試過一個版本:不管用戶怎麼聊,聊不下去了,我們都可以主動丟一句話出去,讓你再聊。這樣就出問題了,有人說為什麼小影總是亂跳話題……我覺得這其實沒有什麼意義。」
簡仁賢很清楚,大公司以嚐試的態度這樣做沒什麼問題,自己創業,卻是希望做些完全不一樣的事。
MIT 人工智能實驗室創始人馬文·閔斯基 (Marvin Minsky) 曾經提出過一個理念:人是任務/目標導向型 (goal oriented) 的動物。每個人每天都有很多任務,起床、刷牙、出門、工作、吃飯和回家,每個或大或小的行為,其實都是一個任務。完成不同任務需要不同的思維方式、肢體完成不同的動作,久而久之,每個任務在大腦中都生成了一個專門的代理人 (agent)。
而人工智能的最大價值在於成為 agent,幫人們完成這些任務。
閔斯基去世於 2016 年,他的觀點形成也較早。在他的年代,強人工智能,或者說通用人工智能還不是一個可及之物。簡仁賢認同閔斯基的看法,倒不是因為他缺乏想象力和進取心,而是在全麵複盤對話式人工智能之後,他發現打造一個有情感,麵向消費者市場的個人助理,所能夠創造的價值遠遜於將對話機器人投入到企業級市場。
翻譯成白話:閑聊浪費生命,對話機器人還是做 To B 好,商業模式簡單、清晰,賺錢才是王道。
誰都不能怪他,畢竟他現在不在市值千億的大公司做技術創新,而是要對自己的公司,對這支 170 人的創業隊伍負責。
簡仁賢
他重新設計了公司的商業模式:簡單來說,利用已經積累了大量數據的情感數據庫,采用深度學習訓練出一個高可定義的神經網絡,作為對話機器人技術的底子;再結合符號語言學知識訓練垂直行業的「人工智能培訓師」,用垂直行業的專業知識對神經網絡進行二次調校,形成一個麵向行業優化的對話機器人模型;最後把這個模型的使用權賣給企業客戶。這個產品叫做 Bot Factory,目前的版本號是 2.0。
照著客戶已有的 FAQ 進行自動回複已經過時了。竹間智能在對話機器人模型中整合了任務向的多輪對話、上下文記憶、情緒引擎、意圖引擎、知識圖譜等多種技術。如果應用到客服領域,這些技術使對話機器人更接近一名經驗豐富、服務迅速且服務態度良好的真人客服,能夠根據多輪對話記錄準確地回答問題,判斷用戶意圖,在用戶表達出不滿情緒時是當地做出安撫。
確定了商業模式,簡仁賢帶著他的工程師、科學家、架構師和 BD 們,勾兌上了唯品會、興業基金和優必選,從頭開始驗證對話機器人的各項技術,在垂直行業的場景裏能否,以及如何為企業創造價值。
返回的結果令人欣慰。在電商場景中,基於用戶畫像生成的導購推薦,讓客服機器人的谘詢活躍度提升了兩倍。在電話投訴場景中,由於同時采用了強化學習 (reinforcement learning) 和遷移學習 (transfer learning) 這兩種目前比較先進的深度學習技術,竹間智能的語義理解技術能夠幫助電話這端的客服,準確判斷消費者的情緒和意圖,進而提高服務質量。
「相較於傳統基於 FAQ 的機器人客服,我們認為對話機器人對客戶帶來了一百倍的價值提升。」簡仁賢說。
他也考慮到了客戶對數據隱私安全的不同需求。麵向普通的非互聯網公司客戶,竹間智能提供完整的 SaaS 服務。與此同時,銀行客戶也看重了對話機器人帶來的價值,想要引進。但這意味著賬務庫——最核心的數據庫需要和對話機器人做整合,安全和隱私是個大問題。好在,竹間智能也提供私有雲部署方案,客戶可以自己部署並通過用戶界麵對模型進行訓練,上手很容易。
機器人工廠 Bot Factory 用戶界麵示例
做企業級市場無異於賣水,To B 公司不擔心沒客戶付費,最大的風險在於客戶種類太單一,就像千禧年科技泡沫,一眾科技公司表現不佳,賣水給它們的公司也連帶遭殃。
好在,竹間智能已經通過幾家金融、電商、消費級硬件和 IoT 客戶實現了營收,並有意繼續在教育、政務等更多的領域進行驗證和拓展,發展更多樣化的客戶,預計 2018 年可以實現損益平衡。
簡仁賢說,過去 20 多年在大公司工作形成了一個信條:技術、產品和收入是一個三角形的閉環,資金用於研發,研發的目的是做出產品,產品存在的意義是賺取更多的資金,繼續投入研發。如果技術沒有人願意付費,如果產品不賺錢,那麼技術研發是沒有價值的。
這是一條通用的原則。而具體到領域裏,簡仁賢認為人工智能初創公司最重要的是將技術商業化,和將業務規模化的能力:
「技術大家都可以做得很好,經由商業驗證過、落地後的技術,才是真正的壁壘。」