国产成人福利在线视频播放下载,成人无码www免费视频在线看,放荡的美妇在线播放,大地资源网最新更新,国产成人精品日本亚洲网站

泡泡網(wǎng)顯卡頻道 PCPOP首頁(yè)      /      顯卡     /      評(píng)測(cè)    /    正文

泰坦的孿生兄弟!NVIDIA GTX 780首測(cè)

    Kepler GK110的新SMX引入幾個(gè)架構(gòu)創(chuàng)新,使其不僅成為有史以來(lái)最強(qiáng)大的多處理器,而且更具編程性,更節(jié)能。

1

    SMX: 192個(gè)單精度CUDA核、64個(gè)雙精度單元、32個(gè)特殊功能單元(SFU)和32 個(gè)加載/存儲(chǔ)單元(LD/ST)。

SMX 處理核架構(gòu)

    每個(gè)Kepler GK110 SMX單元具有192單精度CUDA核,每個(gè)核完全由浮點(diǎn)和整數(shù)算術(shù)邏輯單元組成。Kepler完全保留Fermi引入的IEEE 754-2008 標(biāo)準(zhǔn)的單精度和雙精度算術(shù),包括積和熔加(FMA)運(yùn)算。

    Kepler GK110 SMX 的設(shè)計(jì)目標(biāo)之一是大大提高GPU的雙精度性能,因?yàn)殡p精度算術(shù)是許多HPC應(yīng)用的核心。Kepler GK110 的SMX還保留了特殊功能單元 (SFU)以達(dá)到和上一代GPU類似的快速超越運(yùn)算,所提供的SFU數(shù)量是Fermi GF110 SM的8倍。

    與GK104 SMX單元類似,GK110 SMX單元內(nèi)的核使用主GPU頻率而不是2倍的著色頻率。2x著色頻率在 G80 Tesla 架構(gòu)的 GPU 中引入,并用于之后所有的 Tesla 和 Fermi‐架構(gòu)的GPU。在更高時(shí)鐘頻率上運(yùn)行執(zhí)行單元使芯片使用較少量的執(zhí)行單元達(dá)到特定目標(biāo)的吞吐量,這實(shí)質(zhì)上是一個(gè)面積優(yōu)化,但速度更快的內(nèi)核的時(shí)鐘邏輯更耗電。對(duì)于Kepler,我們的首要任務(wù)是的性能/功率比。雖然我們做了很多面積和功耗方面的優(yōu)化,但是我們更傾向優(yōu)化功耗,甚至以增
加面積成本為代價(jià)使大量處理核在能耗少、低GPU頻率情況下運(yùn)行。

Quad Warp Scheduler

    SMX以32個(gè)并行線程為一組的形式調(diào)度進(jìn)程,這32個(gè)并行線程叫做Warp。而每個(gè)SMX中擁有四組 Warp Scheduler 和八組 Instruction Dispatch 單元,允許四個(gè)Warp同時(shí)發(fā)出執(zhí)行。Kepler 的 Quad Warp Scheduler 選擇四個(gè) Warp,在每個(gè)循環(huán)中可以指派每 Warp 2 個(gè)獨(dú)立的指令。與 Fermi 不同,F(xiàn)ermi 不允許雙精度指令和部分其他指令配對(duì),而 Kepler GK110 允許雙精度指令和其他特定沒(méi)有注冊(cè)文件讀取的指令配對(duì) 例如加載/存儲(chǔ)指令、紋理指令以及一些整數(shù)型指令。

1

    每個(gè)Kepler SMX 包含4組Warp Scheduler,每組Warp Scheduler包含兩組 Instruction Dispatch單元。單個(gè)Warp Scheduler單元如上所示。

    我們努力優(yōu)化SMX Warp Scheduler邏輯中的能源。例如,Kepler和Fermi Scheduler 包含類似的硬件單元來(lái)處理調(diào)度功能。其中包括:

a) 記錄長(zhǎng)延遲操作(紋理和加載的寄存器
b) Warp 內(nèi)調(diào)度決定(例如在合格的候選 Warp 中挑選出非常好的 Warp 運(yùn)行)
c) 線程塊級(jí)調(diào)度(例如,GigaThread 引擎)

    然而,F(xiàn)ermi的scheduler還包含復(fù)雜的硬件以防止數(shù)據(jù)在其本身數(shù)學(xué)數(shù)據(jù)路徑中的弊端。多端口寄存器記錄板會(huì)紀(jì)錄任何沒(méi)有有效數(shù)據(jù)的寄存器,依賴檢查塊針對(duì)記錄板分析多個(gè)完全解碼的 Warp指令中寄存器的使用情況過(guò),確定哪個(gè)有資格發(fā)出。

    對(duì)于 Kepler ,我們認(rèn)識(shí)到這一信息是確定性的(數(shù)學(xué)管道延遲是不變量),因此,編譯器可以提前確定指令何時(shí)準(zhǔn)備發(fā)出,并在指令中提供此信息。這樣一來(lái),我們就可以用硬件塊替換幾個(gè)復(fù)雜、耗電的塊,其中硬件塊提取出之前確定的延遲信息并將其用于在 Warp 間調(diào)度階段屏蔽Warp,使其失去資格。

0人已贊
第1頁(yè):TITAN孿生兄弟——GTX 780第2頁(yè):GPU計(jì)算架構(gòu)Kepler GK110概述第3頁(yè):GK110 Kepler框圖和理論性能第4頁(yè):GK110核心流式多處理器(SMX)架構(gòu)第5頁(yè):GK110核心新編碼和指令優(yōu)化第6頁(yè):Kepler 內(nèi)存子系統(tǒng):L1、L2、ECC第7頁(yè):智能細(xì)化運(yùn)算:Dynamic Parallelism第8頁(yè):CPU/GPU之間并發(fā)連接:Hyper‐Q第9頁(yè):智能Grid調(diào)度和GPUDirect神經(jīng)反射第10頁(yè):GTX 780和GTX TITAN做工對(duì)比第11頁(yè):GTX 780和GTX TITAN 設(shè)計(jì)對(duì)比第12頁(yè):首發(fā)顯卡:七彩虹GTX780第13頁(yè):首款非公版產(chǎn)品:映眾GTX780冰龍版第14頁(yè):測(cè)試說(shuō)明和平臺(tái)介紹第15頁(yè):最新3D性能基準(zhǔn):《3DMARK》第16頁(yè):DX11基準(zhǔn)測(cè)試:《3DMark11》第17頁(yè):DX11基準(zhǔn)測(cè)試:《Unigine Valley》第18頁(yè):DX11游戲:《孤島危機(jī)3》第19頁(yè):DX11游戲:《古墓麗影9》第20頁(yè):DX11游戲:《戰(zhàn)地3》第21頁(yè):DX11游戲:《地鐵 2033》第22頁(yè):DX11測(cè)試:《石巨人》第23頁(yè):DX11游戲:《異形大戰(zhàn)鐵血戰(zhàn)士》第24頁(yè):DX11游戲:《光榮使命》第25頁(yè):DX11游戲:《狙擊精英2》第26頁(yè):DX11游戲:《失落星球2》第27頁(yè):智能游戲設(shè)置:GeForce Experlence第28頁(yè):OC潛力尚可!GTX 780超頻測(cè)試第29頁(yè):GTX 780空閑、滿載整機(jī)功耗測(cè)試第30頁(yè):GTX 780空閑、滿載核心溫度測(cè)試第31頁(yè):總結(jié)和展望:NVIDIA的顯卡王朝

關(guān)注我們

泡泡網(wǎng)

手機(jī)掃碼關(guān)注