當前位置:係統粉 >   IT資訊 >   微軟資訊 >  NVIDIA聯手Arm開啟HPC新生態!微軟Azure啟動GPU超算實例

NVIDIA聯手Arm開啟HPC新生態!微軟Azure啟動GPU超算實例

時間:2019-11-20 來源:互聯網 瀏覽量:

芯潮(ID:aichip001)文 | 韋世瑋

芯潮11月20日消息,昨天,英偉達在2019國際超級計算大會(SC19)上推出用於構建GPU加速Arm服務器的參考設計,以及用於優化網絡和存儲數據處理的Magnum IO軟件套件。

與此同時,英偉達創始人兼CEO黃仁勳宣布,微軟已在Azure雲計算平台上構建了NDv2超大型實例,專為AI和HPC應用而構建,是全球最大的GPU加速的雲端超級計算機之一 。

值得一提的是,Magnum IO軟件套件主要針對當下市場的數據處理需求,能夠幫助研究人員在數分鍾內處理大量複雜的數據,數據遷移速度比以往提升20倍。

此外,黃仁勳還在現場發表演講,針對AI、圖像和高性能計算等技術的行業現狀,以及目前業內的最新發展動態,闡釋了他對HPC領域未來廣闊的發展前景。

“高性能計算領域正在同時朝各個方向擴展。實際上,高性能計算已無處不在,比如超級計算中心、雲和邊緣等。”他說到。

NVIDIA聯手Arm開啟HPC新生態!微軟Azure啟動GPU超算實例(1)

一、GPU加速Arm服務器參考設計,滿足多樣化HPC需求

黃仁勳在會上預測,如今Arm已擁有超過1000億台計算設備,而在未來幾年,該數字將超過1萬億台。

隨著AI和機器學習等領域的技術研發不斷創新與突破,從雲端到邊緣端、從高性能存儲到百萬兆級超算等方麵的高性能計算需求正在持續增長。

而英偉達此次聯合Arm等科技企業推出GPU加速Arm服務器的參考設計,由英偉達和Arm、Marvell和富士通等高科技企業共同開發,能滿足從雲端到邊緣端等多樣化的高性能計算需求。

同時,該設計還將硬件和軟件基礎模塊相結合,讓超級計算中心、超大型雲運營商和企業,能通過使用英偉達加速計算平台和Arm服務器平台,來進一步滿足自身的技術研發和工業應用等需求。

在黃仁勳看來,英偉達和Arm等企業的合作將會形成一個優質的生態,幾乎所有在高性能計算中運行的工作,都應該能夠在任何CPU上運行,並且目前已有30個應用已開始啟動並運行。

NVIDIA聯手Arm開啟HPC新生態!微軟Azure啟動GPU超算實例(2)

同時,許多高性能計算軟件公司也開始使用英偉達CUDA-X庫,以構建能在Arm服務器上運行,並可通過GPU實現的管理和監控工具。

此外,英偉達還與GROMACS、LAMMPS和Relion等領先的高性能計算應用開發商進一步合作,為Arm提供GPU加速的應用程序。

截至目前,英偉達已提供Arm兼容軟件開發套件的預覽版本,其包括英偉達CUDA-X庫和加速計算開發工具。

NVIDIA聯手Arm開啟HPC新生態!微軟Azure啟動GPU超算實例(3)

二、微軟Azure雲計算平台構建NDv2實例

Azure NDv2實例是專為處理要求苛刻的AI和HPC應用而構建,能夠在一個Mellanox InfiniBand後端網絡上,提供多達800個互聯的英偉達V100 Tensor Core GPU,進一步解決當下複雜AI、機器學習和高性能計算的工作負載。

黃仁勳談到,NDv2作為全球最快的超級計算機之一,能夠使高性能計算研究者和其他人員實時獲得前所未有的GPU算力。

在他看來,這是英偉達有史以來首次讓用戶可依據自身需求,來租用整台AI超級計算機,並且性能還可與需要長達數月部署時間的大型本地超級計算機相匹配。

此外,NDv2與其他基於CPU的傳統計算機相比,其性能和性價比也有了一定的提升。

一方麵,它可迅速啟動多個NDv2實例,在短短幾小時內完成複雜的會話式AI模型訓練。例如,微軟和英偉達研發人員曾使用64個NDv2實例,在三小時左右完成了BERT會話式AI模型的訓練。

另一方麵,它可幫助客戶使用多個NDv2實例,以運行複雜的高性能計算工作負載。同時,相比專用於深度學習等特定應用程序,或未使用GPU的高性能計算節點而言,單個NDv2實例就可實現高達一個數量級的速度提升。

目前,NDv2已推出預覽版本,其中一個實例包含了8個英偉達V100 GPU,以根據不同的工作負載需求進行擴展。

NVIDIA聯手Arm開啟HPC新生態!微軟Azure啟動GPU超算實例(4)

三、Magnum IO軟件套件:大量數據遷移速度提升20倍

近年來,隨著AI等數據驅動型應用的愈加發展和成熟,大數據正在迎來爆發式增長,如何優化數據的傳輸和處理,已然成為數據中心所需麵臨的巨大挑戰。

基於此,英偉達推出的Magnum IO軟件套件,能將多服務器、多GPU計算節點的數據處理速度提升至20倍,幫助AI研究者和數據科學家將數據移動時間從數小時縮短至幾分鍾。

“Mangum IO能夠為I/O與存儲帶來具有革命性計算性能的英偉達GPU加速。”針對Magnum IO軟件套件對網絡和存儲領域進行的數據處理優化,黃仁勳說到。

與此同時,英偉達GPUDirect Storage是Magnum IO的一項關鍵功能,能為數據提供一條連通GPU內存和存儲的直接數據路徑,讓研發人員在訪問存儲時繞過CPU,以快速訪問用於模擬、分析和可視化的數據文件。

此外,GPUDirect可兼容多種通信互聯產品與API,由點對點和RDMA組件組成。

值得注意的是,雖然Magnum IO軟件套件已上市,但GPUDirect Storage暫時隻為部分用戶提供早期訪問權限。

黃仁勳表示,英偉達計劃在2020年上半年向所有客戶提供GPUDirect Storage。

NVIDIA聯手Arm開啟HPC新生態!微軟Azure啟動GPU超算實例(5)

結語:英偉達聯手科技企業為HPC領域注入新活力

不難看出,隨著AI、5G和自動駕駛等技術的進一步發展與成熟,超算技術已然成為驅動大數據、雲計算和深度學習算法等融合創新的重要力量之一。

而作為全球領先的GPU巨頭,英偉達在持續提高產品多樣化、進行市場全方位部署的同時,也在持續打入各大領域的生態係統,進一步為這些生態提供各類高性能的計算工具。

未來,隨著HPC領域的愈發成熟,以及超算技術與AI和雲計算等各類領域的深度結合,英偉達又將會聯合科技企業為行業帶來那些驚喜,十分值得我們期待。

我要分享:

最新熱門遊戲

版權信息

Copyright @ 2011 係統粉 版權聲明 最新發布內容 網站導航