|
|
Pascal 架構(gòu)帶來巨大的性能飛躍
NVIDIA Pascal 架構(gòu)使 Tesla P100 能為 HPC 和超大規(guī)模工作負載提供性能。憑借每秒超過 21 萬億次的 16 位浮點 (FP16) 運算性能,經(jīng)過優(yōu)化的 Pascal 為深度學(xué)習(xí)應(yīng)用程序帶來了令人興奮的新可能。Pascal 還可為 HPC 工作負載提供超過 5 萬億次的雙精度浮點運算和 10 萬億次的單精度浮點運算能力。
通過采用 HBM2 的 CoWoS 技術(shù)實現(xiàn)更高效率
通過加入采用 HBM2 的晶圓基底芯片 (CoWoS) 技術(shù),Tesla P100 將計算性能和數(shù)據(jù)緊密集成在同一個程序包內(nèi),提供的內(nèi)存性能是 NVIDIA Maxwell™ 架構(gòu)的三倍以上。這大幅縮短了為數(shù)據(jù)密集型應(yīng)用程序算出解決方案的時間。
頁面遷移引擎使編程更簡單
頁面遷移引擎可使開發(fā)人員從管理數(shù)據(jù)移動的工作中騰出時間,將精力更多地放在計算性能的調(diào)整上。應(yīng)用程序現(xiàn)在可以突破 GPU 物理顯存的容量限制,達到幾乎無限量的顯存。
適用于混合型工作負載 HPC 的 NVIDIA Tesla P100
適用于 PCIe 的 Tesla P100 使混合型工作負載 HPC 數(shù)據(jù)中心能在節(jié)省資金的同時大幅提升吞吐量。例如,一個由四個與 PCIe 互聯(lián)的 Tesla P100 驅(qū)動的 GPU 加速節(jié)點,可以替代各種應(yīng)用程序的多達 32 個通用 CPU 節(jié)點。利用數(shù)量大幅減少而性能強大的節(jié)點完成各種作業(yè),意味著客戶可以節(jié)省多達 70% 的整體數(shù)據(jù)中心成本。
|