|
|
Pascal 架構(gòu)帶來(lái)巨大的性能飛躍
NVIDIA Pascal 架構(gòu)使 Tesla P100 能為 HPC 和超大規(guī)模工作負(fù)載提供性能。憑借每秒超過(guò) 21 萬(wàn)億次的 16 位浮點(diǎn) (FP16) 運(yùn)算性能,經(jīng)過(guò)優(yōu)化的 Pascal 為深度學(xué)習(xí)應(yīng)用程序帶來(lái)了令人興奮的新可能。Pascal 還可為 HPC 工作負(fù)載提供超過(guò) 5 萬(wàn)億次的雙精度浮點(diǎn)運(yùn)算和 10 萬(wàn)億次的單精度浮點(diǎn)運(yùn)算能力。
通過(guò)采用 HBM2 的 CoWoS 技術(shù)實(shí)現(xiàn)更高效率
通過(guò)加入采用 HBM2 的晶圓基底芯片 (CoWoS) 技術(shù),Tesla P100 將計(jì)算性能和數(shù)據(jù)緊密集成在同一個(gè)程序包內(nèi),提供的內(nèi)存性能是 NVIDIA Maxwell™ 架構(gòu)的三倍以上。這大幅縮短了為數(shù)據(jù)密集型應(yīng)用程序算出解決方案的時(shí)間。
頁(yè)面遷移引擎使編程更簡(jiǎn)單
頁(yè)面遷移引擎可使開發(fā)人員從管理數(shù)據(jù)移動(dòng)的工作中騰出時(shí)間,將精力更多地放在計(jì)算性能的調(diào)整上。應(yīng)用程序現(xiàn)在可以突破 GPU 物理顯存的容量限制,達(dá)到幾乎無(wú)限量的顯存。
適用于混合型工作負(fù)載 HPC 的 NVIDIA Tesla P100
適用于 PCIe 的 Tesla P100 使混合型工作負(fù)載 HPC 數(shù)據(jù)中心能在節(jié)省資金的同時(shí)大幅提升吞吐量。例如,一個(gè)由四個(gè)與 PCIe 互聯(lián)的 Tesla P100 驅(qū)動(dòng)的 GPU 加速節(jié)點(diǎn),可以替代各種應(yīng)用程序的多達(dá) 32 個(gè)通用 CPU 節(jié)點(diǎn)。利用數(shù)量大幅減少而性能強(qiáng)大的節(jié)點(diǎn)完成各種作業(yè),意味著客戶可以節(jié)省多達(dá) 70% 的整體數(shù)據(jù)中心成本。
|