完美DX10!ATI新王者HD2900XT權(quán)威評測
● 第二章/第二節(jié)/第三小節(jié):ATI的第一代統(tǒng)一渲染架構(gòu):XENOS
這一節(jié),我們主要回顧下ATI第一代統(tǒng)一渲染架構(gòu):用于XBOX360的XENOS的圖形核心。

XBOX360ATI從2003年9月與MICROSOFT簽訂協(xié)議,為新一代游戲主機(jī)XBOX360開發(fā)圖形核心,由此開始,ATI正式著手研發(fā)第一代基于統(tǒng)一渲染架構(gòu)的圖形核心:XENOS。XENOS(研發(fā)代號C1)的研制工作于2005年底結(jié)束,也成為世界上第一個(gè)的統(tǒng)一渲染架構(gòu)的圖形核心
Xenos一共由兩個(gè)圖形運(yùn)算核心構(gòu)成,主內(nèi)核擁有2億3200萬晶體管,核心頻率為500MHz,擁有48個(gè)Unified Shader。Daughter Die附內(nèi)核擁有1億晶體管,由NEC 90nm工藝制造,負(fù)責(zé)處理所有采樣運(yùn)算,包括色彩讀寫、混合,多重采樣AA,Z軸運(yùn)算等。

Xenos核心Xenos核心的特點(diǎn)如下:
(1)是世界上首個(gè)基于統(tǒng)一渲染架構(gòu)的圖形核心,可以支持更加優(yōu)化、效率更高的圖形算法。
(2)具有硬件線程分派單元,可以充分提高shader單元的利用效率,配合unified shaders使核心的Shader負(fù)載更加平衡。
(3)具有智能的內(nèi)嵌式存儲器,可以提供高到320M/S的帶寬,具有專門的邏輯控制單元以及加速反鋸齒、 alpha blending等操作。
(4)可以和把數(shù)據(jù)直接讀取或?qū)懭氲紺PU的緩存,更加高效的處理流式指令。
(5)Xenos有自己專門的編譯器。
點(diǎn)擊查看大圖
● Xenos的統(tǒng)一渲染架構(gòu):

Xenos的渲染架構(gòu)統(tǒng)一渲染架構(gòu),從硬件的角度來說,就是指不再有Vertex、Pixel Shader單元的劃分,顯示核心不再為Shader類型不同而配置不同類型的Shader單元,在統(tǒng)一渲染架構(gòu)中這兩種Shader單元被統(tǒng)一為Unified Shader,所有的Unified Shader單元都可根據(jù)需要需要進(jìn)行處理,不管和是Pixel Shader類型還是Vertex Shader類型。

Xenos架構(gòu)圖Xenos具備48個(gè)“4D+1D”(矢量+標(biāo)量)的Unified Shader,其ALU單元為SIMD結(jié)構(gòu),每16個(gè)著色單元被合并為一個(gè)著色矩陣,調(diào)配哪幾組Shader單元負(fù)責(zé)處理何種指令或者進(jìn)行什么類型的計(jì)算,則由一個(gè)被稱為thread arbiter(線程仲裁器)的部分來控制。不過,在Xenos中每個(gè)矩陣內(nèi)部同一周期內(nèi)只能執(zhí)行同一類別的指令,要么Pixel Shader要么是Vertex Shader,雖然不太靈活,但還是實(shí)現(xiàn)了統(tǒng)一著色架構(gòu),大大提高了Shader單元的負(fù)載平衡。
shader arrayXenos具備三組線程控制器,最大可以支持64個(gè)并行的線程,可以充分提高shader單元的利用效率,有效掩蓋了著色管線的延遲問題。其統(tǒng)一渲染架構(gòu)具備三組渲染單元(每個(gè)渲染單元具備16個(gè)Shader單元,總共具備16x3=48個(gè)Shader單元),也就是說每一組渲染單元都將具有一組獨(dú)立的線程控制器,而更多的仲裁器顯然可以更加優(yōu)化Shader指令的分派,根據(jù)ATI的測試表明,在通用圖形計(jì)算中,Xenos的shader array可以達(dá)到95%的利用率。
Geometry Tessellation Uni雖然沒有引入Geometry Shader,但是Xenos中增加了一個(gè)Geometry Tessellation Unit鑲嵌處理單元,可以對輸入的三角形,矩形、正方形進(jìn)行分割處理。不過,Xenos的Tessellation單元為固定功能的單元,不具有可編程性,也可看作是Geometry Shader的一個(gè)雛形,而Tessellation后來也成為DirectX 10中引入的Geometry Shader的功能之一。由于沒有Geometry Shader,Xenos自身并不能生成多邊形。不過Xenos中的MEMEXPORT、CPU streaming 技術(shù)可以實(shí)現(xiàn)類似于DirectX 10中的stream-out功能,所以,Xenos可以把數(shù)據(jù)發(fā)送給CPU的cache,然后通過復(fù)用實(shí)現(xiàn)生成多邊形的目的。值得一提是MEMEXPORT可以直接和系統(tǒng)存儲器交換向量數(shù)據(jù),它的引入也提高了Xenos的通用計(jì)算性能以及可編程性(即擴(kuò)展了shader program 的長度)。

同時(shí),Xenos的數(shù)據(jù)流控制效率更高,ATI還為vertex、pixel計(jì)算引入了統(tǒng)一指令集,可以更快速的執(zhí)行一些復(fù)雜的圖形算法,如高次表面和全局照明等等。
紋理拾取單元 Xenos還擁有16個(gè)紋理拾取單元(過濾紋理單元,帶LOD)和16個(gè)頂點(diǎn)拾取單元(無過濾/點(diǎn)取樣單元)。如果需要還可以增加若干的附屬紋理處理單元。所有這些元件都是由紋理處理陣列控制,且每一個(gè)紋理單元都有自己的紋理地址處理器。每一個(gè)過濾紋理單元都具備雙線性取樣能力,并可以支持三線性或更高的排列過濾技術(shù)(如Anisotropic Filtering,各向異性過濾)。由于XBOX36O采用了是UMA控制器類型,因此整個(gè)RAM系統(tǒng)都將支持紋理取樣。為了彌補(bǔ)10MB eDRAM在進(jìn)行反鋸齒的時(shí)候容量不足的問題,Xenos以Tile Rendering 的方式來實(shí)現(xiàn) FSAA。 此外,Xenos也支持Multiple Render Targets (多目標(biāo)渲染)、Hierarchical Stencil Buffer(層次模板緩沖)、Alpha-to-Mask等主流技術(shù)。
關(guān)注我們


