時間:2017-12-03 來源:互聯網 瀏覽量:
做 PPT,是許多人很頭疼的事情。
如果你也有同樣的煩惱,不如試試「微軟小蜜」小程序。有了它,你隻需上傳幾張圖片,就能輕鬆製作好看的 PPT。
這款看似簡單的小程序的背後,隱藏著微軟在人工智能和深度學習領域內的大量積累和經驗。可以說,「微軟小蜜」製作的每一份 PPT 背後,都含有微軟工程師的研究成果。
本期「曉組織」,知曉程序邀請到微軟 Office 365 中國團隊資深產品經理張鵬,希望他可以為我們揭秘在「微軟小蜜」背後的「黑科技」。
為什麼會選擇微信,做一個 PPT 小程序?
張鵬介紹,他所在的是微軟 Office 365 創新團隊,主要麵向中國市場進行工作。他們的目標之一就是將 Office 365 產品在 PC 端的強大生產力,集成到移動端。
在中國,幾乎所有移動互聯網用戶都會使用微信,所以,微信自然就成為了這個團隊的目標之一。
我們內部的項目開發代號叫「龍門計劃」,從名字看你就能明白,這個項目完全是中國創造的。
這個團隊對新平台的敏感程度不亞於任何創業團隊。在 1 月 9 日微信正式開放小程序平台後不久,「微軟小蜜」就成為首批推出的小程序之一。
張鵬告訴我們,之所以這麼早進入微信小程序領域,原因有兩個。首先是微信平台得天獨厚的用戶量優勢。
有數據統計說明,用戶每天在微信裏的時間要占總手機使用時間的 35%,也就是說,平均一個用戶每天有超過三分之一的時間都在微信裏麵。你的聯係人早就從親人朋友擴展到公司同事和合作夥伴,群聊已經是不單單是家人之前的溝通,很多群已經是用於辦公協作等工作場景。
而小程序天生的優勢就是不用下載,可以快速進入應用,並且可以進入微信群聊便於更快更高效的協作。
巨大的用戶量和粘性,以及小程序平台的「無需下載」特性,都讓 Office 365 進入小程序變得再正常不過。
利用 Office 365 生產力平台,通過微信小程序完成一件工作,再直接進入群聊進行必要的溝通和協作,對用戶來說是一件非常自然的方式。這也是我們第一時間試水小程序的初衷。
除此之外,張鵬還認為,小程序開發成本和獲客成本相對較低,便於類似人工智能等新技術的快速試錯和驗證。
對於微軟內部的創新團隊,我們除了 Office 365 這個強大生產力平台之外,還有對人工智能應用的研究。
從目前整個行業來看都麵臨一個難點:技術走的很靠前,但是很零散。如何把人工智能技術推進到產品化這條道路上來,形成一個端到端的產品,需要快速驗證和迭代。
決定做小程序之後,「要做什麼小程序」也成為了張鵬所在團隊需要關心的事情。那為什麼會選擇做「圖片識別文字轉 PPT」這種小程序呢?
張鵬給出的答案是:
我們是想探索一下未來移動端文檔的生成方式。
在 PC 端大家習慣於鍵盤、鼠標和打印機的文檔生成方式,然而在手機端這些就都不靈了,在手機上,我們可以利用的是攝像頭、語音輸入和多點觸控屏幕。
另一方麵,張鵬和他的團隊認為,大部分對用戶有價值的資源,都是在手機端被發現的,類似現場 PPT、創意海報、畫在黑板上的流程圖,或是微信公眾號文章,等等。
用戶將這些信息「縫合」進 Office 文檔中,往往是比較困難的,也很耗時費力。如果小蜜可以幫助用戶快速完成這個動作,用很短的時間提取有價值內容,這本身對用戶就是有價值的,因為幫用戶節省了時間。
那為什麼是「縫合」,而不是「收藏」呢?
就是因為我們希望這些內容,不管是在移動端還是 PC 端,都是可以編輯的。隻有隨時可編輯的可加工的內容,才是屬於你的知識或者觀點。
目前看來,整個團隊的投入是非常值得的。張鵬告訴我們,現在,「微軟小蜜」累計訪問量已經超過了 500 萬,並有累計超過 100 萬張圖片處理量和超過 40 萬份 PPT 製作量。
讓我們感到高興的是,我們看到小程序有很多忠實用戶。小蜜每天有超過 70% 都是老用戶,也收到了他們很多好的建議,這對產品初期是非常重要的。
「微軟小蜜」小程序使用鏈接
https://minapp.com/miniapp/1957/
在「微軟小蜜」背後,有微軟這些技術支持
作為一款以 OCR(即類似識別圖片中文字)功能為主的小程序,裏麵當然有微軟自家的技術存在。
在采訪中,張鵬就向我們介紹微軟在計算機視覺領域的研究成果。
微軟在研究計算機視覺這個領域還是非常給力的,在我們前不久的計算機視覺方麵的大賽也得了很多一等獎,不管是能夠識別出來的物體的種類,還是坐標值、位置等等,精確率都非常高。
光有研究成果當然不行。如何在實際中,利用好這些技術成果,也是讓科技走進千家萬戶的重要步驟。
我們的產品相對來講是屬於從技術上比較成熟,也比較適用一些實際的場景,我們會逐步通過產品給大家分享。
比如,計算機圖像識別要對圖像裏麵的基本特征值的抽取。例如,我們剛剛增加了對圖像裏麵的物體識別,打標簽的功能,目前可以識別 2000 多種物體,我們識圖接口在你的圖片裏看到一種物體,就會標注一種物體。
張鵬還介紹,目前微軟的光學識別技術,可以識別來自全球跨商界、體育界、文娛界等超過幾十萬人的名人。
而「微軟小蜜」小程序,也是利用了微軟計算機視覺方麵的研究成果,這也是計算機視覺實際應用的一個例子。
張鵬介紹,計算機視覺能夠實際被應用,離不開最近熱門的「深度學習」。
深度學習是機器學習研究中的一個新的領域,其動機在於建立、模擬人腦進行分析學習的神經網絡,它模仿人腦的機製來解釋數據,例如圖像,聲音和文本。深度神經網絡是按層排布的,每一層都運行著不同的數學運算(算法)。
舉個例子,一個針對圖像識別的深度神經網絡,其中有一個層用於搜索圖像中的一組特征(如:圖片的邊緣,形狀等),後麵的運算層用於搜索其他特征,那麼這個神經網絡的深度越深,他的學習能力越強,對圖片的表達越清晰和智能。
微軟在深度學習領域的研究,也有非常好的成果。
目前典型的神經網絡設計一般包含 6~7 層,部分可以達到 20 到 30 層,而微軟亞洲研究院一種被稱為「深度殘差網絡」(deep residual network)的新技術,可以進行多達 152 層的複雜數學運算。
這意味著,在不遠的將來,微軟可以使用 GPU 和其他專用芯片的龐大集群,提升人工智能的各式各樣服務能力,其中就包括今天介紹的「微軟小蜜」小程序。
未來,微軟還打算這樣做小程序
在采訪中,張鵬也向我們透露,他們團隊接下來的計劃。首要之事,就是為小蜜增加新功能。
小蜜有一雙眼睛,他現在可以看懂圖片中的文字和表格,下一步我們會讓他看到更多的東西,比如流程圖,信息圖表,圖標等等。
除了「看見」,我們還希望小蜜能「聽到」,即用戶可以直接通過自然語言讓小蜜產生內容。最後,我們希望小蜜可以去設計,用戶隻要關心內容輸入就可以了,將演示效果交給小蜜來完成。
我們前一段時間為「微軟小蜜」小程序增加了表格識別功能,你用手機拍照一張表格圖片,我們可以識別圖片中的表格坐標,在 PPT 中將表格還原出來,你可以很輕鬆的對表格進行各種操作。從識別效果上,我認為在市場上還是領先的。
當然,這個小程序還有很多要改進的地方,如剛才提到的,如何更好的將微軟在計算機視覺和深度學習領域的研究產品化,我們還有一段路要走。
當被問及是否還有其他小程序推出,張鵬的回答是「當然」,而且方向也是以生產力為主。然後對我們賣了個關子,「這裏先不透露太多,希望早點兒和用戶見麵。」
我們也期待「微軟小蜜」和微軟 Office 365 團隊,能夠用新技術,幫助我們更快、更好地完成工作。