完美DX10!ATI新王者HD2900XT權(quán)威評(píng)測(cè)
自從ATI在R300(9700)上面首次使用256Bit顯存位寬之后,高端顯卡的顯存控制器已經(jīng)連續(xù)五年停滯不前,顯存帶寬的提升只能依賴于DRAM廠商生產(chǎn)出速度更快的顯存顆粒,從GDDR1一直發(fā)展到GDDR2/3/4,高頻顯存對(duì)顯卡的PCB和散熱設(shè)計(jì)提出了很高要求,顯存在顯卡成本中所占比例也越來越高,顯卡性能一定程度上受到了顯存帶寬的制約。新一代DX10游戲?qū)︼@存帶寬需求變本加厲,所以NVIDIA和ATI不約而同的升級(jí)了顯存控制器,G80支持384Bit,而R600則是翻了一倍達(dá)到512Bit!
512Bit顯存帶來性能飛躍第四章\\第十節(jié) Memory Control(顯存控制器)
G80的顯存控制器很容易理解,與G71相比就是添加了兩組64Bit控制器,每組顯存控制器都與ROP綁定,從而組成了384Bit的位寬,依然是(Crossbar)交叉式結(jié)構(gòu)。之所以不用512Bit,一方面是出于顯存成本方面的考慮,當(dāng)然還有一個(gè)原因就是交叉存取的結(jié)構(gòu)在規(guī)模較大時(shí)管理非常復(fù)雜,PCB布線難度大增,信號(hào)延遲容易增大。
G80的ROP和顯存控制器
這就是ATI引入環(huán)形總線的原因,從R520開始我們就接觸到了Ring Bus這個(gè)詞,R520內(nèi)部顯存總線其實(shí)是512Bit(即兩個(gè)256Bit環(huán)形管道),4個(gè)環(huán)站和8組32Bit顯存組成:
R520的顯存控制器
為什么要這么設(shè)計(jì)呢?主要是在提高帶寬的同時(shí)減緩顯存控制器的壓力。當(dāng)程序指令提出顯存讀取要求時(shí),顯存控制器會(huì)安排數(shù)據(jù)從顯存顆粒中讀取,但數(shù)據(jù)不會(huì)回傳至顯存控制器,而是只把數(shù)據(jù)放在環(huán)形總線之中,然后程序自行通過環(huán)站取回所需數(shù)據(jù)包,從而減輕控制器的壓力。這種方式對(duì)于單個(gè)的存取操作有可能會(huì)使延遲變大,但總體來說能夠降低大多數(shù)操作的延遲,而且提高數(shù)據(jù)命中率!
環(huán)形總線圍繞在控制器的外圍,這樣可以簡(jiǎn)化線路設(shè)計(jì)使連接處于最優(yōu)化狀態(tài)。這意味著任何時(shí)候內(nèi)核各部件都能處于最短的連接線路狀態(tài),這樣在顯存進(jìn)行數(shù)據(jù)寫入操作過程中有效降低延遲及降低信號(hào)品質(zhì)。當(dāng)然環(huán)形總線的另一大優(yōu)勢(shì)就勢(shì)可以輕松達(dá)到高頻率,傳統(tǒng)顯存控制器則由于顯存控制器內(nèi)部線路之間的串?dāng)_等原因很難保證GDDR4這種高頻顯存的效能!
ATI顯存控制器的演化
但是,X1000系列的顯存控制器并非是真正的環(huán)形總線,它只是通過引入兩條環(huán)形管道來分擔(dān)中央控制器的壓力,這可以說是ATI做出的一個(gè)大膽嘗試,X1000系列屬于半分布式的混合型控制器。而在R600上面,ATI真正實(shí)現(xiàn)了全分布式的環(huán)形總線:
R600內(nèi)部1024Bit環(huán)形總線,外部512Bit總線R600的顯存控制器擁有2條512Bit環(huán)形通道和四個(gè)環(huán)站,每個(gè)環(huán)站控制兩個(gè)64Bit顯存通道,可以看到R600不存在中央控制器,所有顯存讀寫操作都由四個(gè)環(huán)站經(jīng)過仲裁器判定后執(zhí)行:
R600顯存控制器之環(huán)站結(jié)構(gòu)可以這么認(rèn)為,如果是傳統(tǒng)交叉式顯存控制器的話,必須統(tǒng)一指揮8個(gè)64Bit通道,而R600的4個(gè)環(huán)站只需各自管轄2個(gè)64Bit通道就可以了,然后四個(gè)環(huán)站通過1024Bit(讀寫各512Bit)內(nèi)部總線連接起來,所有操作都通過仲裁器優(yōu)化和排序后執(zhí)行,比起混亂的交叉操作更加有序和高效!
如此一來,R600的環(huán)形總線可以達(dá)到更低的延遲、更高的頻率、更大的帶寬。同時(shí)也可以一定程度上降低PCB布線難度,將16顆顯存之間的干擾降至最低,穩(wěn)定性更容易保證,對(duì)于GDDR4提供了完美支持。在現(xiàn)有的技術(shù)條件下,R600可以輕松實(shí)現(xiàn)1GB 512Bit和512MB 512Bit兩種實(shí)用的組合方案,今天發(fā)布的HD 2900XT就是512MB 512Bit(16顆8M×32Bit顆粒)的規(guī)格,未來還會(huì)有1GB 512Bit GDDR3/4的XTX版本。
另外,ATI的雙向環(huán)路總線是可編程設(shè)計(jì)的,顯存仲裁操作可以交由驅(qū)動(dòng)程序控制,或者是用戶通過驅(qū)動(dòng)程序的“CATALYST A.I(智能參數(shù)設(shè)定)”功能為特定的應(yīng)用程序設(shè)定仲裁優(yōu)先次序,以便GPU可以優(yōu)先處理最迫切、對(duì)性能影響最明顯的數(shù)據(jù)讀寫請(qǐng)求。
關(guān)注我們


