時間:2017-06-02 來源:互聯網 瀏覽量:
近日,微軟在其官方博客上撰文宣布全麵開源 Microsoft Cognitive Toolkit 2.0,該版本版本包含了 beta 版本以來的數百個新功能,簡化了深度學習流程,可在更廣泛的人工智能生態係統之中實現無縫整合;此外它還支持 Keras、Java API、英偉達最新版本的深度學習 SDK 和高級 GPU 架構(比如英偉達 Volta)。機器之心對該文進行了編譯,原文鏈接請見文末。
美國切薩皮克州保護協會(The Chesapeake Conservancy)正在使用微軟的 Cognitive Toolkit 來定義和訓練一個神經網絡,加速創建用於監督恢複與保護的這個切薩皮克灣土地覆蓋的數據集。
今天,一支微軟的研究者與軟件工程師團隊聲稱,微軟開源了其用來取得人工智能重大突破的一個工具包。
在開發「Microsoft Cognitive Toolkit」(也被稱作 CNTK)中扮演重要角色的合夥人工程經理(partner engineering manager)Chris Basoglu 說:「該工具包的 2.0 完整版本現已全麵發行。」其有五大重要更新:1、支持 Keras;2、極快的 Halide 二進製卷曲;3、支持 Java API;4、新的 NuGet 軟件包集;5、多漏洞修複。(鏈接:https://github.com/microsoft/cntk)
用於產品級和企業級工作負載的微軟 Cognitive Toolkit 2.0 的完整版本包含了 beta 版本以來的數百個新功能,簡化了深度學習流程,確保該工具包在更廣泛的人工智能生態係統之中無縫整合。
此外,Cognitive Toolkit 的完整版本還將支持 Keras,一個用戶友好的開源神經網絡庫,它在深度學習應用開發者之間廣受歡迎。Basoglu 解釋道,為 Keras 編寫的代碼現在可以利用 Cognitive Toolkit 的性能與速度而無需改變任何代碼。目前對 Keras 的支持正在公開預覽之中。
通過支持最新版本的英偉達深度學習 SDK 和高級 GPU 架構(比如英偉達 Volta),Cognitive Toolkit 將會繼續加速訓練能力。
自 2016 年 10 月 Cognitive Toolkit 的 beta 版本發行以來,就受到了需要定義和訓練神經網絡的大量公司和組織的歡迎,這些神經網絡能夠以科學家認為的類似於人腦學習的方式學習執行具體任務。
楠蒂柯克河(The Nanticoke River)是 Demlarva 半島上流入的切薩皮克灣的最大支流。楠蒂柯克流域大約占地 53 萬英畝,包括了超過 5 萬英畝的潮汐濕地。切薩皮克州保護協會正努力借助人工智能保護這片濕地。
例如,位於美國馬裏蘭州首府安納波利斯(Annapolis)的切薩皮克州保護協會正和微軟研究者一起合作使用該工具包定義和訓練一個神經網絡,加速創建當下最新的一米分辨率的土地覆蓋數據集,可優先處理整個切薩皮克灣(跨越 6 個州和 華盛頓特區的 64000 平方英裏的土地)的恢複和保護倡議。
這些新數據集的信息量是現有的 30 米分辨率數據集的 900 倍;但是如果沒有人工智能,這需要人力數月的數據輸入和圖像處理才能完成。新的神經網絡把工作流程壓縮為單一算法,可在一小部分時間內生成相似的映射。據項目合夥人講,這種人工智能技術應該擴展開來,幫助全美和全球性的保護組織。
在中國,人工智能醫療創業公司 Airdoc 正使用微軟的 Azure 雲服務、認知服務和 Cognitive Toolkit 來研發其技術,該技術可以快速準確地探測糖尿病性視網膜病變的發作(糖尿病的一種並發症,可導致失明如果沒有正確對待)。
Cognitive Toolkit 的開發最開始是為了微軟研究者和工程師加速訓練深度神經網絡和其他機器學習模型,開發諸如必應視頻搜索和語音識別係統等應用,其中後者是微軟一個突破性進展,它可以像人一樣識別對話中的字詞。
微軟研究員們意識到,相同的工具可以滿足人工智能應用日益增長的需求,比如語音理解和圖像識別就從小型初創公司到大型科技公司、政府機構、非營利組織和學術機構等都在使用。
Basoglu 及其團隊調整了該工具以滿足有基本編程技巧和筆記本電腦的愛好者,同時其還允許高技能開發者對搜索工具進行全麵定製,從而加速在多個服務器和最新 GPU 上有大量數據集的深度神經網絡訓練。
除了支持 Keras 外,今天發布的其他新特性還包括添加了用於模型評估的 Java 捆綁包,還有壓縮已訓練的模型以在資源受限的設備上實時運行的新工具,進而將圖像識別等應用加載到這種設備中(如智能手機)。
該工具是微軟「人工智能技術民主化」這一倡議的一部分。除了 Cognitive Toolkit 之外,開發者可以通過微軟 Azure 訪問一套雲計算應用,就如同通過微軟認知服務容易地使用和部署機器學習應用程序接口或 API 那樣。
Basoglu 說:「最初,人們手寫他們的數學函數,用個人代碼創建他們自己的神經網絡,並獨自計算出如何提供數據;但是現在,麵對海量的數據,複雜的算法和多 GPU、CPU 和機器之間令人生畏的優化,個人式的自我編寫就變得不合時宜了。他們需要的是新工具。」