當前位置：係統粉 > IT資訊 > 微軟資訊 > 微軟AI：你我都能感知、能使用的AI

微軟AI：你我都能感知、能使用的AI

時間：2018-05-30 來源：互聯網瀏覽量：

當微軟全球執行副總裁、微軟人工智能及微軟研究事業部負責人沈向洋博士與來自南京理工大學的碩士研究生宋昊旻站在2018微軟AI人工智能大會現場，借助微軟語音翻譯服務順利進行中英文對話時，會議現場響起了熱烈的掌聲。

這個掌聲是給特殊來賓宋昊旻的，宋昊旻在一歲時失去了聽力，被醫生判定將終生成為聾啞人，但在媽媽的鼓勵下，他堅持訓練發聲，並成功考上了南京理工大學的本科和碩士研究生，一路走來非常艱辛。這個掌聲同樣也是給微軟的，微軟語音服務根據宋昊旻聲音定製的語音識別模型能夠準確地、近乎實時地將他略顯吃力的語音轉換為更加流暢的普通話，還能同步翻譯成英語或其它語種，讓宋昊旻能夠和外界無障礙溝通。

宋昊旻隻是眾多微軟AI技術中受益者之一，今天微軟的AI技術正在各個領域服務於我們，其中有像宋昊旻這樣的特殊人群，也有各種專業人士，而更多的是普普通通的你我。實際上，普通人觸手可及的AI正是微軟AI的一個鮮明特點，而這也很好的印證了微軟的願景：予力全球每個人、每個組織，成就不凡。

微軟全球執行副總裁、微軟人工智能及微軟研究事業部負責人沈向洋博士與南京理工大學研究生宋昊旻

讓更多人從AI中受益

“微軟作為一個技術平台的公司，我們希望通過領先業界的雲計算和人工智能服務與工具，能夠予力全球每一人、每一組織，成就不凡。”微軟全球執行副總裁、微軟人工智能及微軟研究事業部負責人沈向洋博士在大會演講中表示。

基於這一願景，微軟致力於普及人工智能，讓眾多普通人從中受益。微軟小冰就是一個很好的例子。小冰誕生於四年前，是一個麵向情商（EQ）維度發展的人工智能係統，目前已在中、日等多個國家落地。經過這幾年持續不斷的技術迭代，現在的小冰功能越來越強大，從初期的簡單人機對話發展到今天不僅可以作詩、寫文章，還能唱歌，而最新應用的全雙工語音技術讓小冰的技能又上一層樓，讓小冰與人的對話更類似人與人的交流。

據悉，全雙工語音是微軟小冰身上最新的技術突破之一。這項新技術的作用在於可以實時預測人類即將說出的內容，實時生成回應，並控製對話節奏，從而使長程語音交互成為可能。它的實現需要同時具備文本、語音兩種能力，並要求兩種能力均達到更高的質量標準。目前，小米生態鏈企業億聯客開發的Yeelight語音助手中就是搭載了微軟技術的全雙工語音交互感官的智能設備，其硬件產品已開始進入千家萬戶。

“全雙工語音技術能夠使得人機交互進化為人機交流，一字之差，差之萬裏。微軟小冰通過這項技術能和人類進行更長程、更自然流暢的對話。”沈向洋博士在演講時表示。

微軟全球執行副總裁、微軟人工智能及微軟研究事業部負責人沈向洋博士

在大會上，沈向洋還宣布微軟將基於小冰推出一項造福孩子的人工智能內容創造的全新技能：為每個孩子定製專屬於他們的有聲童話故事，讓每個家庭的孩子都可以擁有一位專屬於自己的故事主播。家長可以設置童話故事的主人公和故事傾向，如更偏教育意義等，然後安排微軟小冰完成創作。這項功能將於“六一”兒童節正式上線。

有必要指出的是，微軟研發小冰要做的不僅僅隻是聊天機器人，小冰的背後是“對話機器人”市場，在銷售、市場、客戶都需要這種更智能的對話機器人服務。針對這個市場，微軟推出了“對話機器人”服務Azure Bot Services和對應的開發平台，至今已經有超過30萬人用這樣一個開發平台去開發這樣對話機器人，如中國移動的智能客服就基於微軟的對話機器人技術實現。

實際上，在這些明顯貼有AI標簽的產品之外，微軟的AI技術早已隨著微軟的產品進入千家萬戶，比如最為我們熟悉的Windows 10桌麵上的Cortana、幾乎人人都在用的Office 365和搜索引擎Bing，這些簡單易用的產品和服務背後都是微軟AI技術在支撐。

值得一提的是，在普及AI的道路上，微軟不僅致力於讓更多的普通人用上AI，還在努力讓類似宋昊旻這樣的非普通人從AI受益。在不久前的微軟Build大會上，微軟曾宣布推出“人工智能無障礙計劃”，將在未來五年內投入2500萬美元，用於研發能夠增強人類能力的人工智能技術，以造福全球各地超過10億殘障人士。

讓AI應用可以很簡單

除了讓AI更多地為人類服務外，微軟還在大力降低AI的使用門檻，讓每個開發者都有機會打造屬於自己的AI應用，並讓AI更簡單易用。比如，微軟在Azure上推出了24項認知服務，它們以API的形式為開發者提供簡單易用的人工智能技術，這些認知服務覆蓋了語音、視覺、語言、機器翻譯等，目前已經有超過100萬開發者使用認知服務。

Azure Batch AI服務是微軟智能雲上的一項托管服務，允許數據科學家和人工智能開發者以非常簡單的方式利用包括GPU在內的Azure雲計算資源對人工智能模型進行訓練。數據科學家隻需明確任務需求，設定輸入、存儲、輸出等設置，其它所有與基礎設施管理、規模縮放、批量工作任務相關的繁雜的後台工作都能由Azure Batch AI自動完成。

如果Azure上的這些認知服務不能滿足用戶需求，微軟還提供了定製化的AI服務，而且這種定製非常簡單。

“我們在預製化的AI人工智能服務上做了很多工作，讓它們很容易上手，開發者並不太需要知道這些東西如何工作。比如說，定製計算機視覺、定製語音或者定製自然語言，都可以很輕易地使用。”微軟全球資深副總裁、雲計算與人工智能事業部郭昱廷在接受采訪時表示。

微軟全球資深副總裁、雲計算與人工智能事業部郭昱廷

另外，微軟還把這些服務跟Visual Studio結合，推出了Visual Studio Tools for AI。“微軟希望能把這些事情做得盡可能簡單，盡量幫助開發者以最簡單的方式使用人工智能。比如，讓定製視覺服務可以部署在各種手機上，並根據不同的手機自動優化數據模型，而無需使用者去操心這些事情。”郭昱廷說。

打通雲+邊緣的AI

今天微軟談到AI往往是與Azure聯係到一起的。實際上，Azure已經越來越成為微軟AI戰略的一個不可分割的重要組成部分，而微軟雲計算與人工智能事業部的成立就是一個體現。

郭昱廷介紹說，“成立雲計算與人工智能事業部，就體現了微軟對雲計算和AI的決心。微軟將雲計算與AI結合，能更好地讓這兩種技術落地。這樣我們給客戶的就不隻是一般的計算、存儲或者是基礎設施服務，而是有更高價值的服務，是具有人工智能的價值服務。”

而交付這些高價值的AI服務就離不開的Azure。應該說，微軟Azure也的確為微軟AI提供了很好的製程，比如， Azure現已覆蓋全球50多個區域，並且獲得了不同地區的超過70項安全合規認證，遠高於其它任何公有雲服務。Azure上彙聚了微軟在人工智能領域的全部投入與技術積累，是開發、部署、運行人工智能的最佳雲平台，包括微軟現在提供的24項認知服務都運行在Azure上。

還有，在不久前舉行的微軟Build開發者大會微軟發布了的Project Brainwave（預覽版）也可以運行在Azure上。Project Brainwave是一個旨在加速實時AI計算的硬件架構，可以滿足數據密集型AI應用的計算需求（比如圖像識別）。它能夠部署在Azure雲端以及邊緣設備上，幫助用戶實現低成本的實時AI計算。

而且，Azure還是微軟將智能雲與智能邊緣融會貫通的關鍵環節。郭昱廷在接受采訪時表示，智能邊緣現在也是微軟AI戰略的一部分，微軟不但要把AI放到雲上，還要放到邊緣物聯網環境中。為此，微軟推出了Azure IoT Edge物聯網服務，同時，Azure 上的認知服務也可以擴展到Azure IoT Edge。目前微軟已經推出了定製視覺服務，可以讓無人機或其他工業裝備無需連接到雲。另外，為了給邊緣設備提供更好的安全保護，微軟發布了Azure Sphere預覽， Azure Sphere方案將提供經過特殊設計的安全芯片、安全操作係統和能夠守護每台設備的雲端安全，是一個能夠為聯網微控製器（MCU）提供工業級安全保障的完整平台級解決方案。

在打通微軟Azure雲與邊緣的連接上，Azure Stack也是一個非常重要的組成部分。Azure Stack是微軟推出的一個可以獨立部署的軟硬一體化混合雲解決方案，由於采用與Azure雲同樣的架構，使得很多Azure雲上的應用，包括認知服務、前麵提到的Project Brainwave等都可以運行直接在Azure Stack，非常適合於那些邊緣計算的AI場景。

微軟AI的強大後台

目前，在AI技術上微軟的領先性有目共睹，而微軟在AI領域有此地位與微軟在AI領域長期持久的投入不有關係，特別時與微軟研究院有直接關係。其實，微軟對AI的研究就發端於微軟研究院。在27年前，微軟研究院創立的時候，最早成立的三個研究組都是圍繞人工智能展開的：自然語言、語音與計算機視覺。

如今，微軟研究院在人工智能研究上成果卓著、令人矚目。沈向洋博士在大會上介紹了部分研究成果，包括：兩年前，在ResNet測試上以152層、96%的準確率拔得頭籌；一年前，在Switchboard語音識別基準測試中的錯誤率已經降低至5.1%，達到了媲美人類專業速記員的水平；今年1月，微軟第一個在斯坦福大學發起的SQuAD文本理解挑戰賽上獲得超越人類的分數；兩個月前，微軟在對新聞報道測試集的英中、中英機器翻譯上實現了比肩人工翻譯的水平。

另外，微軟亞洲研究院開發的OCR (Optical Character Recognition光學字符識別）技術，將為各種人工智能應用增加圖形文字識別功能，目前支持從Office到Skype、Bing、HoloLens的微軟應用，能識別打印字體、美術字、手寫字體，可以滿足從智能雲到邊緣計算的各種場景。目前手寫識別OCR引擎V3.0版本的精度達到了70.5%，已經部署於微軟認知服務，可供開發者用於自己開發的智能應用。

展望未來，人工智能的研究還將是一條慢慢長路。正如微軟語言技術的創世人、微軟全球資深技術院士、微軟雲與人工智能事業部黃學東博士所總結的，目前所看到的人工智能技術的主要是“感知”方麵，包括計算機視覺和語音識別等進步都很大。然而，在“認知”方麵進步還是有限的，也就是至今我們還沒辦法真正讓機器理解我們人類的語言和思想，真正的自然語言理解還有很長的路要走。在這條道路上，微軟機器翻譯有了一個好的開端，但未來還有很多工作要做。

我要分享：

上一篇：MacBook 將和 iPad 結合？蘋果新專利讓人聯想微軟的二合一計算機 下一篇：坑了英特爾卻造福廣大玩家，微軟終於幹了件大好事