流處理器緣何差6倍!A/N GPU架構(gòu)解析
在大獲成功的RV770基礎(chǔ)上,AMD率先發(fā)布了首顆DX11圖形核心——RV870,當(dāng)然現(xiàn)在AMD已經(jīng)不使用數(shù)字來命名GPU核心的,它的真正代號是Cypress。
● Cypres架構(gòu)的變化
除了顯存位寬維持256bit不變之外,Cypress的其它所有規(guī)格都正好是RV770的兩倍,而且在流處理器部分可以看作是雙核心的設(shè)計,幾乎就是并排放置了兩顆RV770核心:
為什么要使用這種雙核心的設(shè)計呢?因為當(dāng)流處理器擴充至1600個這樣的恐怖規(guī)模時,不僅芯片設(shè)計制造的難度非常高,而且相應(yīng)的緩存和控制模塊難以管理協(xié)調(diào)如此眾多的流處理器,因此一分為二的做法效率將會更高。
Cypress這樣的結(jié)構(gòu)與雙核CPU十分相似,兩顆“核心”各自獨立,獨享L1、共享L2和內(nèi)存控制器等其他總線模塊,而兩顆“核心”之間則通過專用的數(shù)據(jù)共享及請求總線通信。
為了配合這兩顆“核心”眾多流處理器的工作,裝配引擎內(nèi)部設(shè)計有雙倍的Rasterizer(光柵器)和Hierarchial-Z(多級Z緩沖模塊),這是與RV770最大的不同。
在流處理器部分,RV870相對于RV770改進有限,只是加入了DX11新增的位操作類指令,并優(yōu)化了Sum of Absolute Differences(SAD,誤差絕對值求和)算法,指令執(zhí)行速度提升12倍,此項指令可以在OpenCL底層執(zhí)行。SAD算法應(yīng)用最多的就是H.264/AVC編碼的移動向量估算部分(約占整個AVC編碼總時間的80%),如此一來使用RV870做視頻編碼類通用計算時,性能會大幅提升!
基本上,除了新增DirectX 11支持之外,Cypress相對于RV770在架構(gòu)方面的改進非常有限。HD5000系列主要是憑借40nm和新一代GDDR5顯存在功耗控制方面做的非常完美,雖然官方稱抗鋸齒效能大幅改進,但通過我們實際測試來看相對RV770提升非常小,因為RV770做的已經(jīng)非常優(yōu)秀了,另外HD5000系列的Eyefinity多屏顯示器技術(shù)是一大賣點。
關(guān)注我們



