泰坦的孿生兄弟!NVIDIA GTX 780首測(cè)
Kepler GK110的新SMX引入幾個(gè)架構(gòu)創(chuàng)新,使其不僅成為有史以來(lái)最強(qiáng)大的多處理器,而且更具編程性,更節(jié)能。
SMX: 192個(gè)單精度CUDA核、64個(gè)雙精度單元、32個(gè)特殊功能單元(SFU)和32 個(gè)加載/存儲(chǔ)單元(LD/ST)。
SMX 處理核架構(gòu)
每個(gè)Kepler GK110 SMX單元具有192單精度CUDA核,每個(gè)核完全由浮點(diǎn)和整數(shù)算術(shù)邏輯單元組成。Kepler完全保留Fermi引入的IEEE 754-2008 標(biāo)準(zhǔn)的單精度和雙精度算術(shù),包括積和熔加(FMA)運(yùn)算。
Kepler GK110 SMX 的設(shè)計(jì)目標(biāo)之一是大大提高GPU的雙精度性能,因?yàn)殡p精度算術(shù)是許多HPC應(yīng)用的核心。Kepler GK110 的SMX還保留了特殊功能單元 (SFU)以達(dá)到和上一代GPU類似的快速超越運(yùn)算,所提供的SFU數(shù)量是Fermi GF110 SM的8倍。
與GK104 SMX單元類似,GK110 SMX單元內(nèi)的核使用主GPU頻率而不是2倍的著色頻率。2x著色頻率在 G80 Tesla 架構(gòu)的 GPU 中引入,并用于之后所有的 Tesla 和 Fermi‐架構(gòu)的GPU。在更高時(shí)鐘頻率上運(yùn)行執(zhí)行單元使芯片使用較少量的執(zhí)行單元達(dá)到特定目標(biāo)的吞吐量,這實(shí)質(zhì)上是一個(gè)面積優(yōu)化,但速度更快的內(nèi)核的時(shí)鐘邏輯更耗電。對(duì)于Kepler,我們的首要任務(wù)是的性能/功率比。雖然我們做了很多面積和功耗方面的優(yōu)化,但是我們更傾向優(yōu)化功耗,甚至以增
加面積成本為代價(jià)使大量處理核在能耗少、低GPU頻率情況下運(yùn)行。
Quad Warp Scheduler
SMX以32個(gè)并行線程為一組的形式調(diào)度進(jìn)程,這32個(gè)并行線程叫做Warp。而每個(gè)SMX中擁有四組 Warp Scheduler 和八組 Instruction Dispatch 單元,允許四個(gè)Warp同時(shí)發(fā)出執(zhí)行。Kepler 的 Quad Warp Scheduler 選擇四個(gè) Warp,在每個(gè)循環(huán)中可以指派每 Warp 2 個(gè)獨(dú)立的指令。與 Fermi 不同,F(xiàn)ermi 不允許雙精度指令和部分其他指令配對(duì),而 Kepler GK110 允許雙精度指令和其他特定沒(méi)有注冊(cè)文件讀取的指令配對(duì) 例如加載/存儲(chǔ)指令、紋理指令以及一些整數(shù)型指令。
每個(gè)Kepler SMX 包含4組Warp Scheduler,每組Warp Scheduler包含兩組 Instruction Dispatch單元。單個(gè)Warp Scheduler單元如上所示。
我們努力優(yōu)化SMX Warp Scheduler邏輯中的能源。例如,Kepler和Fermi Scheduler 包含類似的硬件單元來(lái)處理調(diào)度功能。其中包括:
a) 記錄長(zhǎng)延遲操作(紋理和加載的寄存器
b) Warp 內(nèi)調(diào)度決定(例如在合格的候選 Warp 中挑選出非常好的 Warp 運(yùn)行)
c) 線程塊級(jí)調(diào)度(例如,GigaThread 引擎)
然而,F(xiàn)ermi的scheduler還包含復(fù)雜的硬件以防止數(shù)據(jù)在其本身數(shù)學(xué)數(shù)據(jù)路徑中的弊端。多端口寄存器記錄板會(huì)紀(jì)錄任何沒(méi)有有效數(shù)據(jù)的寄存器,依賴檢查塊針對(duì)記錄板分析多個(gè)完全解碼的 Warp指令中寄存器的使用情況過(guò),確定哪個(gè)有資格發(fā)出。
對(duì)于 Kepler ,我們認(rèn)識(shí)到這一信息是確定性的(數(shù)學(xué)管道延遲是不變量),因此,編譯器可以提前確定指令何時(shí)準(zhǔn)備發(fā)出,并在指令中提供此信息。這樣一來(lái),我們就可以用硬件塊替換幾個(gè)復(fù)雜、耗電的塊,其中硬件塊提取出之前確定的延遲信息并將其用于在 Warp 間調(diào)度階段屏蔽Warp,使其失去資格。
關(guān)注我們
