泰坦的孿生兄弟!NVIDIA GTX 780首測(cè)
Kepler GK110為NVIDIA Tesla打造,其目標(biāo)是成為世界上并行計(jì)算性能最高的微處理器。GK110 不僅大大超過(guò)由 Fermi 提供的原始計(jì)算能力,而且非常節(jié)能,顯著減少電力消耗,同時(shí)產(chǎn)生的熱量更少。完整 Kepler GK110 實(shí)施包括 15 SMX 單元和六個(gè) 64 位內(nèi)存控制器。不同的產(chǎn)品將使用GK110 不同的配置。例如,某些產(chǎn)品可能部署 13 或 14 個(gè) SMX。在下面進(jìn)一步討論的該架構(gòu)的主要功能,包括:
1、新 SMX 處理器架構(gòu)
2、增強(qiáng)的內(nèi)存子系統(tǒng),在每個(gè)層次提供額外的緩存能力,更多的帶寬,且完全進(jìn)行了重新設(shè)計(jì),DRAM I/O 實(shí)施的速度大大加快。
3、貫穿整個(gè)設(shè)計(jì)的硬件支持使其具有新的編程模型功能
GK104框架規(guī)格
Kepler GK110芯片框圖(GTX 780屏蔽了其中的兩組SMX)
Kepler GK110 支持新 CUDA Compute Capability 3.5。(有關(guān) CUDA 的簡(jiǎn)介請(qǐng)參考附錄 A ‐CUDA 快速回顧)。下表對(duì)比了 Fermi 和 Kepler GPU 架構(gòu)的不同計(jì)算能力的參數(shù):
Fermi和Kepler GPU的計(jì)算能力
性能/功率比
Kepler架構(gòu)的一個(gè)主要設(shè)計(jì)目標(biāo)是提高電源效率。設(shè)計(jì)Kepler時(shí),NVIDIA工程師應(yīng)用從Fermi中積累的經(jīng)驗(yàn),以更好地優(yōu)化Kepler、實(shí)現(xiàn)高效運(yùn)行。臺(tái)積電的 28nm 制造工藝在降低功耗方面起著重要的作用,但許多 GPU 架構(gòu)需要修改,以進(jìn)一步降低功耗,同時(shí)保持出色的性能。
Kepler每一個(gè)硬件設(shè)備都經(jīng)過(guò)設(shè)計(jì)和擦洗,以提供卓越的性能/ 功率比。出色性能/功率比的非常好的案例是Kepler GK110新流式多處理器 (SMX) 中的設(shè)計(jì),與最近Kepler GK104引入的 SMX 單元的許多方面類(lèi)似,但計(jì)算算法包括更多雙精度單位。
關(guān)注我們
