成人影片麻豆国产影片免费观看,姑娘视频在线观看免费完整版高清

泡泡網(wǎng)顯卡頻道 PCPOP首頁(yè) / 顯卡 / 評(píng)測(cè) / 正文

泰坦的孿生兄弟！NVIDIA GTX 780首測(cè)

2013年05月23日 21:00作者：蔣尚文編輯：蔣尚文文章出處：泡泡網(wǎng)原創(chuàng)

Kepler GK110的新SMX引入幾個(gè)架構(gòu)創(chuàng)新，使其不僅成為有史以來(lái)最強(qiáng)大的多處理器，而且更具編程性，更節(jié)能。

SMX: 192個(gè)單精度CUDA核、64個(gè)雙精度單元、32個(gè)特殊功能單元(SFU)和32 個(gè)加載/存儲(chǔ)單元(LD/ST)。

SMX 處理核架構(gòu)

每個(gè)Kepler GK110 SMX單元具有192單精度CUDA核，每個(gè)核完全由浮點(diǎn)和整數(shù)算術(shù)邏輯單元組成。Kepler完全保留Fermi引入的IEEE 754-2008 標(biāo)準(zhǔn)的單精度和雙精度算術(shù)，包括積和熔加(FMA)運(yùn)算。

Kepler GK110 SMX 的設(shè)計(jì)目標(biāo)之一是大大提高GPU的雙精度性能，因?yàn)殡p精度算術(shù)是許多HPC應(yīng)用的核心。Kepler GK110 的SMX還保留了特殊功能單元 (SFU)以達(dá)到和上一代GPU類似的快速超越運(yùn)算，所提供的SFU數(shù)量是Fermi GF110 SM的8倍。

與GK104 SMX單元類似，GK110 SMX單元內(nèi)的核使用主GPU頻率而不是2倍的著色頻率。2x著色頻率在 G80 Tesla 架構(gòu)的 GPU 中引入，并用于之后所有的 Tesla 和 Fermi‐架構(gòu)的GPU。在更高時(shí)鐘頻率上運(yùn)行執(zhí)行單元使芯片使用較少量的執(zhí)行單元達(dá)到特定目標(biāo)的吞吐量，這實(shí)質(zhì)上是一個(gè)面積優(yōu)化，但速度更快的內(nèi)核的時(shí)鐘邏輯更耗電。對(duì)于Kepler，我們的首要任務(wù)是的性能/功率比。雖然我們做了很多面積和功耗方面的優(yōu)化，但是我們更傾向優(yōu)化功耗，甚至以增
加面積成本為代價(jià)使大量處理核在能耗少、低GPU頻率情況下運(yùn)行。

Quad Warp Scheduler

SMX以32個(gè)并行線程為一組的形式調(diào)度進(jìn)程，這32個(gè)并行線程叫做Warp。而每個(gè)SMX中擁有四組 Warp Scheduler 和八組 Instruction Dispatch 單元，允許四個(gè)Warp同時(shí)發(fā)出執(zhí)行。Kepler 的 Quad Warp Scheduler 選擇四個(gè) Warp，在每個(gè)循環(huán)中可以指派每 Warp 2 個(gè)獨(dú)立的指令。與 Fermi 不同，F(xiàn)ermi 不允許雙精度指令和部分其他指令配對(duì)，而 Kepler GK110 允許雙精度指令和其他特定沒(méi)有注冊(cè)文件讀取的指令配對(duì) 例如加載/存儲(chǔ)指令、紋理指令以及一些整數(shù)型指令。

每個(gè)Kepler SMX 包含4組Warp Scheduler，每組Warp Scheduler包含兩組 Instruction Dispatch單元。單個(gè)Warp Scheduler單元如上所示。

我們努力優(yōu)化SMX Warp Scheduler邏輯中的能源。例如，Kepler和Fermi Scheduler 包含類似的硬件單元來(lái)處理調(diào)度功能。其中包括：

a) 記錄長(zhǎng)延遲操作（紋理和加載的寄存器
b) Warp 內(nèi)調(diào)度決定（例如在合格的候選 Warp 中挑選出非常好的 Warp 運(yùn)行）
c) 線程塊級(jí)調(diào)度（例如，GigaThread 引擎）

然而，F(xiàn)ermi的scheduler還包含復(fù)雜的硬件以防止數(shù)據(jù)在其本身數(shù)學(xué)數(shù)據(jù)路徑中的弊端。多端口寄存器記錄板會(huì)紀(jì)錄任何沒(méi)有有效數(shù)據(jù)的寄存器，依賴檢查塊針對(duì)記錄板分析多個(gè)完全解碼的 Warp指令中寄存器的使用情況過(guò)，確定哪個(gè)有資格發(fā)出。

對(duì)于 Kepler ，我們認(rèn)識(shí)到這一信息是確定性的（數(shù)學(xué)管道延遲是不變量），因此，編譯器可以提前確定指令何時(shí)準(zhǔn)備發(fā)出，并在指令中提供此信息。這樣一來(lái)，我們就可以用硬件塊替換幾個(gè)復(fù)雜、耗電的塊，其中硬件塊提取出之前確定的延遲信息并將其用于在 Warp 間調(diào)度階段屏蔽Warp，使其失去資格。

0人已贊

国产成人福利在线视频播放下载,成人无码www免费视频在线看,放荡的美妇在线播放,大地资源网最新更新,国产成人精品日本亚洲网站

泰坦的孿生兄弟！NVIDIA GTX 780首測(cè)

關(guān)注我們