黑色散熱鰭片!華碩龍騎士GTX970評測
泡泡網(wǎng)顯卡頻道1月6日 GTX970最新的Maxwell核心架構(gòu)最大優(yōu)點在于能耗比非常優(yōu)異,一舉打破以往高端顯卡高熱高能耗的傳統(tǒng),顛覆了人們對旗艦顯卡高溫大噪音的尷尬印象。
華碩龍騎士GTX970-4GD5京東:直達鏈接>>
性能強悍,功耗發(fā)熱控制出色,GTX 970上市以來已經(jīng)成為NVIDIA高端銷售最火爆的顯卡了,眾多廠商都推出了非公版產(chǎn)品,其中來自華碩的龍騎士GTX970-4GD5在眾多非公版中尤其受追捧,鑒于不少朋友對這款顯卡感興趣,我們專門對它進行了全方位的拆解和性能測試。
在單品測試之前我們首先科普一下GTX970的基本信息。NVIDIA GTX970使用了Maxwell架構(gòu)的GM204 GPU,Maxwell在流式多處理器(SM)方面采用了一種全新設(shè)計,可大幅提高每瓦特性能和每單位面積的性能。雖然Kepler SMX設(shè)計在這一代產(chǎn)品中已經(jīng)相當(dāng)高效,但是隨著它的發(fā)展,NVIDIA的GPU架構(gòu)師再次在能效比利用方面突破了難關(guān)。
Maxwell SM設(shè)計實現(xiàn)證明了這一點,控制邏輯分區(qū)、負(fù)荷均衡、時鐘門控粒度、編譯器調(diào)度、每時鐘周期發(fā)出指令條數(shù)等方面的改進以及其它諸多增強之處讓Maxwell SM(亦稱“SMM”)能夠在效率上遠(yuǎn)超Kepler SMX。全新的Maxwell SM架構(gòu)能夠在GM107中把SM的數(shù)量增至五個(GK107中僅有兩個),而芯片面積僅增加25%。下表提供了高級對比,對比雙方分別為Maxwell以及上一代GK107 Kepler GPU:
具體來說,首先Maxwell采用了容量大增的二級高速緩存設(shè)計,Maxwell核心架構(gòu)中二級高速緩存容量為2048KB,而GK107中的容量僅為256KB。由于片上高速緩存容量更大,因此需要向顯卡DRAM發(fā)送的請求更少,從而降低了整體顯卡功耗、提升了性能。
除了上述變化以外,NVIDIA的工程師還雄心勃勃地在晶體管水平上調(diào)整了Maxwell GPU中每個單元的實現(xiàn)方式,以便最大限度提高節(jié)能性。所有這些努力的最終結(jié)果是,采用相同的28納米制造工藝,Maxwell能夠提供相當(dāng)于Kepler兩倍的每瓦特性能!
雖然說起來簡單,但事實上這些就意味著Maxwell內(nèi)部所有單元和橫梁結(jié)構(gòu)均得到了重新設(shè)計,數(shù)據(jù)流得到了優(yōu)化,功率管理實現(xiàn)了大幅改變。
雖然從圖形特性的視角來看,第一代Maxwell GPU可提供與Kepler GPU相同的API功能,但從深層來上,Maxwell還在單個GPC(圖形處理簇)內(nèi)實現(xiàn)了多個SM單元,每個SM包含一個多形體引擎(Polymorph Engine)和紋理單元,而每個GPC包含一個光柵引擎(Raster Engine)。ROP依然與二級高速緩存片(L2 Cache Slice)以及顯存控制器聯(lián)系在一起。
GM204核心架構(gòu)
GM 204 GPU包含4個GPC、16個Maxwell流式多處理器(SMM)以及4個64位顯存控制器(共256位)。這就是這一芯片的完整實現(xiàn)形式,規(guī)格大約是GeForce GTX 750Ti中的GM107的3倍。
新一代SMM 處理核架構(gòu)解析
而現(xiàn)在每個SM分為四個獨立的處理塊,每個處理塊具備自己的指令緩沖區(qū)、調(diào)度器以及32個CUDA核心。新的劃分方法簡化了設(shè)計與調(diào)度邏輯、節(jié)省了晶體管與功耗、降低了計算延遲。
總體而言,在這一全新設(shè)計上,每個“SM”的尺寸得到大幅縮減,而性能卻能夠達到一個KeplerSM的90%。更小的晶體管消耗讓NVIDIA能夠在每顆GPU中實現(xiàn)更多數(shù)量的SM。通過對比Kepler和Maxwell SM總數(shù)的相關(guān)指標(biāo)可發(fā)現(xiàn),后者的峰值紋理性能比前者高25%,CUDA核心數(shù)量多1.7倍,著色器性能大約高2.3倍。
SMM架構(gòu)顯存系統(tǒng)的改進
對GM204來說,要在顯存位寬與上一代Kepler架構(gòu)核心相同的情況下實現(xiàn)性能大幅提升的目標(biāo),增強顯存系統(tǒng)也同樣重要。內(nèi)部顯存系統(tǒng)帶寬實現(xiàn)了提升,效率也得到了改善。此外,2MB大容量二級高速緩存配置(比之前的任何GPU設(shè)計都大)十分有效地降低了顯存帶寬需求,確保了DRAM帶寬不成為瓶頸。
其他關(guān)于Maxwell架構(gòu)的基本信息,例如通過Giga Thread引擎的主PCI Express接口數(shù)據(jù)流、Polymorph與Raster單元的基本操作等等過于晦澀的知識這里就不再贅述了。
關(guān)注我們
