完美DX10!ATI新王者HD2900XT權(quán)威評(píng)測(cè)
ATI從R520到R580核心,將像素渲染單元翻了三倍之多,但紋理單元的數(shù)量和性能沒(méi)有改進(jìn),因?yàn)锳TI認(rèn)為今后的游戲中紋理操作指令并沒(méi)有增多,而且所占比重逐年下降。到了DX10時(shí)代,ATI為R600設(shè)計(jì)了恐怖的320個(gè)流處理器,那么紋理單元有何變化呢?
第四章\\第七節(jié) Texture Units(紋理單元)
首先來(lái)看看R600的對(duì)手——G80在紋理單元部分有些類似于傳統(tǒng)的管線式架構(gòu),只不過(guò)傳統(tǒng)GPU是每個(gè)ALU綁定TMU,而G80是每組流處理器(16個(gè))陣列綁定一組TMU&L1&L2,這種架構(gòu)非常靈活,也很容易衍生出一系列產(chǎn)品。
G80的8組Shader陣列綁定了紋理單元和L1/L2緩存與G80每組流處理器陣列綁定紋理單元&緩存不同,R600的紋理單元與流處理器部分是分開(kāi)的,都受到Thread Processor的統(tǒng)一調(diào)度,這種架構(gòu)沿用R520/R580的設(shè)計(jì),但在結(jié)構(gòu)部分改動(dòng)特別大。
R600的紋理單元及緩存部分R600擁有4個(gè)紋理單元(R580也是4個(gè),4×4結(jié)構(gòu)),但在每個(gè)紋理單元內(nèi)部包含了8個(gè)紋理尋址單元(黃色,共32個(gè),R580的2倍),20個(gè)32位浮點(diǎn)紋理采樣單元(橘黃色,共80個(gè),R580的5倍),和4個(gè)紋理過(guò)濾單元(深紅色,共16個(gè),與R580相等)。

R600單個(gè)紋理單元的內(nèi)部結(jié)構(gòu)再來(lái)看看細(xì)節(jié)部分,可以看到8個(gè)黃色的紋理尋址單元和20個(gè)FP32紋理采樣單元還要區(qū)分大小,這是因?yàn)轫旤c(diǎn)著色只能使用到其中4個(gè)小紋理尋址單元進(jìn)行紋理采樣,而像素/幾何著色則可以使用全部的8個(gè);頂點(diǎn)著色只能使用其中4個(gè)小FP32紋理采樣單元,而像素/幾何著色則可以使用全部的20個(gè)。
可能很多人都比較奇怪R600怎么會(huì)有這么多的FP32紋理采樣單元,這是因?yàn)镾hader Mode 4.0只能支持128Bit色彩精度(IEEE FP32)紋理采樣,而且Textures和Samplers現(xiàn)在是各自獨(dú)立的,程序會(huì)大量使用Sampler指令,因此獨(dú)立、大規(guī)模的FP32紋理采樣單元可以大幅提升紋理貼圖效率和高分辨率紋理精度。
● 紋理單元特性:
FP16 HDR紋理全速雙線性過(guò)濾(X1000系列的7倍)
FP32浮點(diǎn)紋理半速過(guò)濾
支持所有格式的三線性和各項(xiàng)異型過(guò)濾
驅(qū)動(dòng)默認(rèn)高品質(zhì)各項(xiàng)異型過(guò)濾
軟邊陰影著色性能提高
支持分辨率高達(dá)8192×8192的紋理貼圖
Fetch4紋理樣本過(guò)濾器,采樣速度提升四倍
關(guān)注我們


