NV帕斯卡架構(gòu)白皮書:GP100規(guī)格曝光
關(guān)于下代架構(gòu)“帕斯卡”(Pascal)的產(chǎn)品,NVIDIA目前只宣布了一款大核心的高性能計算卡Tesla P100,其他各種GeForce游戲卡都還得等一段時間,不過近日,NVIDIA很慷慨地公布了一份帕斯卡架構(gòu)白皮書,幾乎完全公開了GP100核心與Tesla P100的各種規(guī)格。

GP100是帕斯卡家族的旗艦核心,預(yù)計桌面上的GTX 1080 Ti、新版GTX Titan X也會使用它。

它采用臺積電16nm FinFET工藝制造,集成了153億個晶體管,比麥克斯韋GM200多了超過90%,核心面積達610平方毫米,只比28nm工藝的GM200大了區(qū)區(qū)9平方毫米。
完整的GP100核心擁有60個SM(流式多處理器)單元,Tesla P100只開啟了其中的56個。每個SM單元內(nèi)有64個FP32單精度CUDA核心(麥克斯韋、開普勒架構(gòu)分別有128個、192個),總計3840個。

每個SM單元分為兩部分,每部分有32個FP32 CUDA核心、一個指令緩沖器、一個Warp調(diào)度器、兩個分派單元。
GP100核心每個SM單元的CUDA核心數(shù)量雖然只有麥克斯韋架構(gòu)的一半,但是擁有相同的寄存器文件尺寸(256KB),支持類似的Warp和線程模塊。
GP100核心的每個SM單元內(nèi)還有32個FP64雙精度CUDA核心,總計1920個,是單精度的1/2,這種比例可以更好地配合GP100核心新的數(shù)據(jù)路徑配置,更高效地處理雙精度負載。
GP100核心還有統(tǒng)一的4096KB二級緩存,超過開普勒GK110 1536KB、麥克GM200 3702KB,可以減少對GPU DRAM的請求,從而降低整體功耗、內(nèi)存帶寬,提升性能。
整個核心還配備了240個紋理單元。
Tesla P100計算卡擁有3584個FP32單精度、1792個FP64雙精度CUDA核心,核心基礎(chǔ)頻率1328MHz,加速頻率高達1480MHz,峰值單精度性能10600GFlops,比起上代提升了足足55%,而雙精度性能也達到了5300GFlops,是開普勒架構(gòu)的3.2倍,更是麥克斯韋架構(gòu)的25.2倍。
它搭配了4096-bit HBM2高帶寬顯存,容量16GB,熱設(shè)計功耗300W?!?/p>
關(guān)注我們


