時間:2017-11-13 來源:互聯網 瀏覽量:
相比國內外的科技巨頭,微軟在這場號稱“百箱大戰”熱潮裏,姍姍來遲。一般來說,遲到的原因無非兩個,一個是動作太慢沒趕上,另一個是在伺機而動等待後發。如果說此前還無從判斷微軟的“遲”是哪種情況,那麼現在則比較清晰了。
兩周前,微軟聯合音箱製造商哈曼卡頓推出智能音箱 Invoke,Cortana 作為語音智能助手內置其中,可供喚醒,執行操作。更早前,微軟與亞馬遜同時宣布,打通 Cortana 與 Alexa,在 Windows 10 設備上對 Cortana 說“call Alexa”,就能夠喚醒後者。
在AI競爭加劇,智能語音助手混戰的背景下,在薩提亞·納德拉“雲+端”的戰略下,從這兩件事其實可以看出微軟對 Cortana 的定位,越來越明晰了:一方麵為硬件合作夥伴提供 AI 技術,另一方麵和同行業夥伴結盟。
這個判斷編輯在微軟(亞洲)互聯網工程院常務副院長、Cortana 負責人幺寶剛處也得到了確證:
Cortana 的定位是無處不在的人工智能,目前專注效率,既要作為一個應用,也要成為一個平台。
從應用角度來看,Cortana 進入了 Windows、iOS、Android 等不同的係統,連通微軟生態中的 Office、Skype 等一同成為效率工具。從平台角度而言,PC、手機之後,Cortana 相繼也將其 AI 能力應用在了家居、音箱、電視、車載、lOT 等場景中,未來將會隨著微軟的業務繼續進行擴張。
整體來說,智能語音助手這條賽道似乎出現了“奇怪”的盤麵,一方麵是競爭的加劇,無論是巨頭之間還是創業公司的湧進都能說明;另一方麵則是“結盟開放”的趨勢越來越明朗。
以下為專訪幺寶剛的Q&A;部分,在不改變原意的基礎上做了增刪:
關於產品
:微軟和哈曼卡頓合作的音箱 Invoke 有什麼亮點?
幺寶剛:產品的亮點包括幾個。
第一個是優秀的產品自然會吸引最優秀的合作者,哈曼卡頓這樣的高端音箱品牌與我們合作,我們也一直希望 Cortana 對外傳達一種高端調性,因此最突出的一點就是聲音,包括兩部分,一部分是音質非常好,另一部分是 Cortana 的聲音——計算機自動生成聲音的自然度也是最好的,這個是第一個亮點。
第二個亮點是,用戶可以通過音箱,直接跟 Skype 連通接打電話,也有一些智能音響可以打電話,但 Skype 除了能夠打電話之外,還跟你的 Skype 聯係人直接做對話。
第三是跨平台。用戶不光可以在音箱上呼喚小娜,也可以跨平台通過 PC,手機等任何操作平台上聯動使用Cortana。
作為人工智能助理, Cortana 對用戶提出的知識性問題給予準確的回答,這主要依托了 Bing 的後台,除了語音識別、自然語言理解,對知識圖譜的建立,都是智能音箱的亮點。其實我們非常高興,雖然我們正式進入這個市場,來的慢一點,但是我們有明晰的定位,並且獲得非常正麵的用戶反饋。
Cortana現在定位變的更清晰,現在更多專注在效率方麵,高效生活高效工作。
在音箱設置的時候,如果用戶擁有 Office365 的帳號,就可以直接連接Cortana,並且使用 Cortana 進行管理會議、日程和提醒,因為小娜的跨平台屬性,用戶可以輕鬆同步手機和 電腦 ,這樣專注於高效的例子,未來將會在我們產品的特性、功能上不斷加強、優化和展現。
小娜的技術正在不斷的迭代過程中,現在可能越來越多的人工智能同行也都了解到,這需要很大的投入和基礎力量,微軟深耕人工智能領域,其技術投入和研發力量不言而喻,例如就在今年8月,我們的對話語音識別技術達到了人類專業水平,錯誤率由5.9%進一步降低到5.1%。雖然數字感覺很小,但到後麵的提高也會越來越困難,這個就是技術的進步。
:除了賦能硬件廠商外,內容上也很重要,微軟在這方麵有什麼進展?
幺寶剛:想要成為無處不在的人工智能助理,小娜還有很長的路要走,我們現在所專注的是以下幾點:
第一點,打鐵自身要硬,我個人對於微軟自身的技術非常自信,特別在基礎的科學研究和技術,例如語音識別,語意理解,微軟多年的積累和沉澱帶來相當大的優勢。
第二點,除了技術之外,還要帶給用戶足夠好的體驗。我認為,用戶體驗分為兩部分:一個是加入微軟生態,與微軟的生產力工具 Office、Skype 等結合;另外一個,是小娜的IQ方麵的發力,她需要非常聰明,具備足夠的知識儲備,從 Cortana 上可以看到,當時微軟在 Bing 上麵做投入是有道理的,如果我們不做搜索引擎,那麼現在搭建一個完備的知識圖譜是很困難的事情,而幸運的是,微軟目前既有高效的生產力工具,又有搜索引擎,搭建知識圖譜,讓人工智能擁有足夠的知識。。
第三點,就是技能的開發平台。我們希望開發者、第三方用戶、廠商,都可以利用這個技能平台進行開發,提供內容,加到 Cortana 裏,網易雲音樂就是個例子。這個平台已經在美國推出了,晚一點時間,會在中國繼續大力推廣,這也是我們希望與合作方構建科技生態的一部分。
:讓用戶覺得體驗好的標準是什麼?
幺寶剛:最基本的層麵,是語音的識別率,我剛才也提到,目前我們的我們的對話語音識別技術達到了人類專業水平;再往上升一層,是我們希望用戶的問題能獲得最直接有效的幫助。對於同一個問題,有很多智能助理,哪個回答的最接近於用戶希望得到的,我們是請了專業的人來評測的。但我覺得最關鍵的,更多用戶使用所產生的大數據有足夠多的用戶,使用黏性、使用頻度實際上證明了這個事情對他有多重要。如果他每天都會來用幾次,說明這個有用,不然的話自然而然就不用了,就會選擇別的了。所以我覺得我們既有技術層麵的,也有應用層麵的,還有用戶層麵的一些度量。
:未來微軟有沒有可能推出自己的智能音箱?
幺寶剛:小娜未來的發展自然會跟隨公司戰略,作為微軟生態的一部分,像微軟內部已有硬件,例如Xbox,小娜已經在進行整合,所以我們也將會配合公司的戰略發展。
:目前對 Cortana 在營收上有什麼期待嗎?或者KPI。
幺寶剛:像剛才我也提到,在商業模式方麵,我們第一年的專著點會是先專著於用戶數量和用戶體驗上,所以至少在我們這個財年這不是一個目標。
關於競爭
:你覺得智能語音助手,在未來競爭中可能會勝出的因素有什麼?
幺寶剛:我們也在思考這樣的事情。我覺得有幾點:
第一,一定要有自己專業核心的投入,人工智能這個概念已經不陌生了,曆史上也經曆過遇冷,因為本身就很難,核心的東西,需要長期不懈的努力,才可能有突破。我認為關鍵點在於公司是否願意在基礎研究方麵做持續不斷的投入。不然,你的核心技術將來會依賴於別人。而微軟在這方麵,擁有多年積累的技術、同樣在人才方麵,我們也投入很多。
第二,要有基礎應用。人工智能助理必須有自己的內容,需要足夠聰明,並且擁有足夠的知識,那這個從哪裏來?微軟之所以有知識圖譜,是因為我們投資了多年的 Bing 。同樣,我們之所以能夠專注在效率方麵,也是因為有 Office 多年的積累,以及對用戶需求的了解。
第三,足夠多的數據。目前有兩種人工智能的應用場景,一種是比較通用的,還有一種是在垂直領域的應用。我認為,要獲得足夠的數據首先要有多年的技術積累,其次要對行業非常了解,微軟認知服務集合多種智能API以及知識API,目前我們已發布包括視覺,語音,還有翻譯語言,語義理解等29款工具,我們也希望能和更多合作夥伴一同探索人工智能的更多應用和可能。
:微軟整體的戰略,是雲為先移動為先,Cortana 在這個戰略裏扮演著什麼樣的角色?
幺寶剛:微軟 CEO 薩提亞提出智能雲+智能邊緣計算的概念,也就是Cloud+AI的模式,我們認為,未來的世界是由智能雲和智能端,用人工智能將所有東西連接在一起。我覺得的 Cortana 是一個非常典型的體現,原因在於,首先我們對 Cortana 的定位,是一個無處不在的智能助理,所謂無處不在是指, Cortana 既可以獨立作為一個應用存在,也可以存在在微軟的應用或者合作夥伴的應用、甚至存在於定製的設備裏,當然做到這一點的前提是,小娜必須生活在雲端,隻有這樣的話,才能夠同時為這麼多的終端服務。
另外,Cortana 後台的很多技術,其實應用的都是雲服務,Cortana 可以通過智能助理的使用,把語音做的更好,做更好的語音,我們還通過微軟的認知服務提供給那些暫時不需要 Cortana,但是需要微軟語音服務的開發者使用。
:小冰那邊會講一些數據,比如說對話輪次達到多少輪,小娜好像不太強調這些數據。
幺寶剛:對,因為小冰是一個情感機器人,那她陪伴用戶的時間長,對她來說是一個很重要的指標。我先不說小娜先說搜索引擎,那搜索引擎最理想的對話次數是多少?
:一輪。
幺寶剛:就是我馬上就告訴你答案。但是對於智能助理,理想狀態到底應該是多少?這個其實說實在的,我們也沒有把這個問題規定下來,是一輪或者多輪。我覺得可能最後還是要看客戶的問題是什麼?比如用戶提出一個問題,是對智能助理說,幫我定一班去上海的火車,我下午有個會,那這個智能助理就應該很聰明的知道,用戶下午幾點開會,用戶的火車應該在下午兩點就要出發,那他就給你定好了兩點的火車。但如果你的問題是你給我講一個笑話吧,或者給我唱首歌。那你是隻唱一首歌就完了嗎?所以這個其實還是要看場景來定的。所以我覺得根據場景會有不同測量的指標,可以分享的是,從小娜推出之後到現在,用戶問過的問題已經超過了一百億。
:在和其他硬件係統整合的時候,會不會出現權限上的差異?比如說 iOS 給 Siri 的權限大一點?
幺寶剛:每個平台其實都有限製,即使像 Siri 在 iOS 也不可能所有事情都做,因為有時候用戶或者APP本身會有授權,關鍵是說你了解這個限製,然後看怎麼樣讓用戶獲得最好的體驗。
:某種程度上來說 Cortana 也算一個 OS,隻是沒有提這樣的概念,微軟如何來麵對類似百度這樣的廠商的競爭?
幺寶剛:一方麵是微軟對技術的多年投入;另外一方麵就是不可能全麵出擊,而要找到專注點。我們的專注點在於生產效率;第三是微軟還是作為一個平台的公司,我們希望變成一個開放的係統,與更多的合作夥伴進行合作。此外,因為很多人都想做開放平台,但不是所有的開放平台大家都去用的,所以我覺得微軟作為一家國際性、擁有全球領先科技和具備信賴感的科技企業我為此充滿信心。