時間:2017-04-28 來源:互聯網 瀏覽量:
近期,高盛公司發布了一份《人工智能》報告,探討人工智能的的發展和生態體係。首先,該報告定義了何為人工智能:人工智能是製造智能機器、可學習計算程序和需要人類智慧解決問題的科學和工程。它包括自然語言處理和翻譯、視覺感知、模式識別,但應用數量和複雜性在快速增長。
實際上,目前人工智能的主要領導者都是一些國際巨頭,比如微軟、穀歌、IBM等。這些科技巨頭對人工智能已有十幾年的研究,並且部分研究成果已經進行商業應用。同時,我們看到國內的大公司,比如BAT都在大力推進人工智能研發。
今天,筆者摘取報告一部分,盤點一下穀歌、亞馬遜、蘋果、微軟、Facebook、英偉達、英特爾、Uber、IBM和百度十大人工智能巨頭都在做什麼。
1.穀歌
過去二十年,穀歌的搜索算法已經快速發展。從1998 年的 PageRank 到 2015 年的 RankBrain,該公司已經從基於鏈接的網站排名轉變為采用 AI 驅動的查詢匹配係統,後者能夠不斷適應那些獨特的搜索(占穀歌所有搜索的 15%)。
在雲技術方麵,公司五月份公布了針對平台的定製化硬件加速器方麵取得的進展,一種定製化的 ASIC,亦即 TPU,這一進展對 2015 年開源的機器學習軟件庫 TensorFlow 進行了補充。
過去三年中,在與人工智能相關的收購戰中,公司也是當仁不讓。被收購的公司中,最知名的當屬 DeepMind,它提升了 Alphabet 的神經網絡功能並已經將其應用於各種人工智能驅動的項目中。
利用人工智能,穀歌將強化自己的搜索能力,加強公司在該領域的競爭優勢。而使用TensorFlow,該公司的開源應用程序為其他基於雲的平台創建了先例,並允許研究團體利用公司的資源來推進 AI 的集成。
2.亞馬遜
據悉,亞馬遜正在內部和雲端使用機器學習技術。2015年4月,公司發布Amazon ML,這款機器學習服務能夠為對雲數據的使用提供機器學習功能(無需之前的客戶經驗)。而後,亞馬遜緊隨穀歌的開源步伐,今年5月開源了DSSTNE——一個針對推薦深度學習模型的的庫。
通過改善搜索、定製化產品推薦以及語音識別、增加有質量的產品評價,亞馬遜內部也在使用機器學習來改善端到端的用戶體驗。
借助AWS,亞馬遜已經成為全球最大的雲服務商,可能也是最成熟的人工智能平台。在雲服務中加入人工智能,AWS用戶無需基於定製的複雜應用,可以直接使用機器學習訓練模型、評估以及優化潛力。
而在電商網站中,亞馬遜的推薦係統使用機器學習,在匹配用戶意圖和推薦結果上欲取得競爭優勢。利用收集到惡數據,公司正在讓用戶購物體驗更加合理化,也讓電子商務體驗更具互動性。
3.蘋果
過去一年,蘋果公司是人工智能領域最活躍的收購者之一,收購了諸如Vocal IQ,、Perceptio、Emotient、 Turi以及 Tuplejump,幾乎是同時收購了Vocal IQ 和 Perceptio公司。
同時,蘋果公司挖來了Johnathan Cohen,他當時是英偉達CUD庫及GPU加速軟件項目的負責人。據報道,公司近期請來Ruslan Salakhutdinov 擔任人工智能研究總監,這也標誌著公司人工智能戰略的轉型。
在此之前,公司最初的人工智能成果之一是 Siri ,它是第一款嵌入移動技術的虛擬助手。在2014 年,其語音識別技術被移入神經網絡係統。
在人工智能領域,我們看到蘋果之前的行動並不活躍。2015年10月,《彭博商業周刊》報道,在大眾消費方麵,蘋果研究人員還沒發過一篇與人工智能有關的論文。現在,蘋果已經成為AI領域的激進者,不僅大肆收購AI初創公司,而且到處挖人。
特別是,公司收購 Turi 公司,突出了它要按規模推進非結構數據和推論,以及開放給更為廣泛的人工智能研究社區。這次收購,配以基於收購公司技術的較小應用,反映出蘋果致力於用這些新技術創新公司產品。
4.微軟
作為人工智能領域的長期研究者,微軟正在將人工智能進行大眾化。該公司的人工智能和研究團隊大概有5000多人,他們聚焦於用AI改變人類與機器的互動體驗。
微軟積極地將新的、融合人工智能的功能嵌入公司核心服務中,並在對話計算(比如Cortana)、自然語言處理(SwfitKey)等方麵取得進展。微軟正進一步打造基於 GPU 和 FPGA的雲(Azure),簡稱“微軟智能雲”。在所謂更高水平的人工智能服務方麵,比如語音識別、圖片識別以及自然語言處理當中,為機器學習提供動力和速度。
將人工智能大眾化,這是微軟發明的術語,用來解釋許多領先的人工智能創新者的舉動。去年,微軟在人工智能領域頗為活躍,正式發布了產品以及研究計劃,並宣布了一個新的人工智能和研究小組(2016 年 9 月下旬)。
而微軟的FPGA則表現出人工智能的潛力,不到十分之一秒,它就翻譯完了整個維基百科(30億個單詞和500萬條條款)。而且伴隨著虛擬助理Cortana、Siri和Alexa以及其他助理之間的競爭,將進一步把人工智能研發融入到廣泛使用的產品中,通過產品進步吸引客戶是必須的。
5.Facebook
Facebook 人工智能研究部門(FAIR,2013 年)的策略是在更廣泛的研究社區背景下研發技術。這個團隊以推進無監督表征學習的進步而為眾人所知,比如觀察世界而不是借助人類算法幹預。
該公司的應用機器學習部門(AML)在 FAIR 之後成立,聚焦於將研究應用到公司產品中,以月或季度為時間限製。目前,Facebook正將機器學習功能應用到各種垂直領域中,比如麵部識別,機器翻譯以及深度文本(DeepText)語言或文本學習。
目前,公司已經發布了多個無監督學習方麵的研究成果,隨著機器學習開始聚焦於獨立的模式識別,無監督學習已成為一個重要的焦點領域。無監督學習有望去除更多的、與大數據有關的人類成分,公司在Yann Lecun的帶領下,正引領該領域的研究。
今年五月,公司發布了FBLearner FLow 合理化了端到端 UI,從研究到工作流程、實驗管理以及視覺化和比較輸出。
6.英偉達
英偉達已經從之前的電子遊戲GPU生產商轉型為機器學習應用硬件廠商。2015年年底,英偉達表示,相比使用傳統的CPU,使用了GPU神經網絡訓練速度提升了10到20倍。
盡管英特爾重金投入的 FPGA(作為 GPU 的替代產品)加入硬件市場角逐,但是,GPU 的機器學習應用能實現更加密集的訓練。
相對而言,FPGA 可以提供更快、計算密集程度更低的推理和任務;這說明市場會根據實際應用案例區分對待。過去五年,到 2016 年 6 月為止,英偉達所占 GPU 市場份額已經從二分之一上升到近四分之三。
在人工智能創新公司和學術機構中,GPU加速的深度學習一直位於大型項目的前沿。根據該公司的市場份額來看,隨著人工智能越來越成為未來幾年大型商務的中心議題,公司可以從中獲益。
舉一個例子,俄羅斯的NTechLab使用GPU加速的深度學習框架來訓練麵部識別模型,識別密集集會中的個人,並在AWS中利用這些GPU進行推理。作為一種選擇,許多大學也使用英偉達的Tesla加速器來模擬可能產生的抗體突變,這種變異可能會擊敗進化中的伊波拉病毒,將來研究會進一步關注流感病毒。
7.英特爾
在人工智能領域,英特爾的戰略比較獨特,其使用的案例多種多樣。2016年年中,公司發布了第二代Xeon Phi 產品係列,該係列產品以高性能計算(HPC)能力著稱,它可以讓人工智能擴展到更加大型的服務器網絡和雲端。
在硬件不斷進步的同時,公司也下重金投資FPGA,這主要歸功於其推理速度和靈活的可編程性。英特爾令人矚目的收購,包括Nervana以及Altera。
實際上,英特爾對FPGA的創新彌補了英偉達對GPU的關注,當處理大型數據庫(微軟等許多大公司用來測試大數據分析的邊界),FPGA能夠提供更加快速的推理速度。
而在物聯網方麵,英特爾也宣布了一個計劃,旨在將學習技術融入可穿戴微芯片中(顯然是通過 Xeon Quark)。物聯網和人工智能的結合有助於為公司和個人日常使用案例的數據搜集機製提供機器學習解決方案。
8.Uber
作為共享經濟的鼻祖之一,Uber正在利用機器學習來優化UberX ETA以及接送地點的準確性。為實現該目標,Uber需要數百萬之前搭乘記錄的數據點來探測常規交通模式,從而可以相應調整 ETA/接送地點。
今年 9 月,Uber 展開了一個自動駕駛試點項目,地點位於匹茲堡,由來自 CMU 的研究人員(受雇於 Uber)負責該項目,很多大型汽車製造商業參與了進來。該公司還和沃爾沃達成了一項合作(金額 300 萬美元),研發協作也為這個試點項目提供了機遇。
不過,公司並不止步於小轎車。公司收購了一家自動卡車創業公司 Otto,今年十月在科羅拉多,公司試點快遞了 5 萬瓶啤酒。
據Uber 的機器學習負責人 Danny Lange 在接受 GeekWire 的采訪中提及,他們的團隊正在將這種技術無縫供給公司的其他團隊,這些團隊無需具備機器學習背景就可以使用 APIs。這也能讓公司不同部門能高效利用機器學習基礎架構,例如,UberX、UberPool、UberEats 以及自動駕駛工具都使用到了公司的人工智能技術。
9.IBM
據悉,IBM在全球擁有3000多名研究人員,過去十年,IBM在認知計算上遊超過1400項專利,下一代雲上有1200項,在矽/納米科學上有7200項專利。
IBM最出名的人工智能要數“沃森”,“沃森”可利用自然語言處理機器學習技術識別模式,並提供在非結構數據上的洞見,據該公司表示這代表如今所有數據的80%。沃森的其他產品,包括Virtual Agent,一個響應分析的自動消費者服務體驗;Explorer,這是一個分析並連接大量不同數據集的工具。
IBM一直是該領域的先驅,有著極大的成就,包括上世紀90年代的“深藍”和2011年的“沃森”。沃森的應用包括醫療中的病人治療分析,基於推特數據的股票推薦,零售中的消費者行為分析,以及對抗網絡安全威脅。
據《財富》雜誌報道,GM將沃森加入到了汽車中,在OnStar係統上結合的Watson的能力。
10.百度
在2016年9月1日,百度推出了它的研究成果——百度大腦,它由三個元素組成:第一,AI 算法模擬人類神經網絡,用數百數十億樣品的大量訓練;第二,對數十萬服務器和許多 GPU 集群進行操作的計算能力(圖形處理單元)用於高性能計算(HPC),HPC 允許更多可擴展的深度學習算法。
百度是第一個宣布這個架構的組織,正在與 UCLA 合作;第三,標簽數據,百度已經收集了數萬億頁的網頁,包括幾百億個視頻/音頻/圖像內容,數十億次的搜索查詢以及數百億次的位置查詢。訓練特定型號的機器要求非常高的計算能力和 4T 數據。
目前,人工智能正在提升百度全線產品的用戶體驗和用戶粘性,也在推動針對每一用戶的定製化高質量內容。建立一個內部平台來運行從網頁搜索到廣告投放的帶有標簽數據的深度學習實驗,能夠預測點擊率(CTR),這會直接影響百度的廣告投放,因此也是它們目前的主要收益。此外,基於人工智能的技術也能帶來更高的 CTR,而且每點擊成本的降低也能促進變現。