時間:2017-11-02 來源:互聯網 瀏覽量:
GTX 1070 Ti顯卡緊急登場後,NVIDIA 16nm Pascal帕斯卡家族已經徹底完成曆史使命,接下來的一代將是12nm Volta伏特。雖然遊戲卡還要等到明年春,但在高性能計算領域,新架構新核心的Tesla V100早已經登場,並逐漸打開局麵。
在此之前,Google部署了帕斯卡架構的計算卡Tesla P100,而現在, 亞馬遜則擁抱了新的Tesla V100,用於自家AWS雲服務。
Tesla V100擁有5120個CUDA核心、640個Tensor輔助核心,麵積達815平方毫米,集成了210億個晶體管,浮點性能半精度30TFlops、單精度15TFlops、雙精度7.5TFlops,Tensor深度學習性能則有120TFlops,搭配16GB HBM2高帶寬顯存。
相比之下, Tesla P100內置3584個流處理器,單精度浮點性能剛剛接近10TFlops,而且沒有專長神經網絡訓練、推理的Tensor核心。
亞馬遜采用了三種不同的方式部署Tesla V100,分別為單路、四路、八路(後兩者采用NVLink總線互連),各搭配64GB、256GB、512GB係統內存。