給炎炎夏日降溫 HIS 7950冰酷3GB實測
核心架構對顯卡性能至關重要,可能有些讀者對HD7950的核心還不熟悉,這里我們簡單介紹一下。
我們知道AMD歷代GPU的瓶頸除了曲面細分以外,其實最重要的是5D/4D VLIW架構的效率問題。HD7950和HD7970核心代號Tahiti,采用了全新的GCN架構,流處理器結(jié)構全部重新設計而來。
Tahiti徹底拋棄VLIW架構
通過Tahiti的整體架構圖我們看到,傳統(tǒng)的SIMD流處理器陣列消失了,取而代之的是GCN陣列,Tahiti總計擁有2048個流處理器,這樣每個GCN陣列里面擁有64個流處理器?,F(xiàn)在來看看GCN陣列的微觀結(jié)構。
GCN與GF100的SM何其相似
Tahiti的GCN陣列微觀結(jié)構
GCN陣列里有4組SIMD單元,每組SIMD單元里面包括16個流處理器、或者說是標量運算器。GCN架構已經(jīng)完全拋棄了此前5D/4D流處理器VLIW超長指令架構的限制,不存在5D/4D指令打包-派發(fā)-解包的問題,所有流處理器以16個為一組SIMD陣列完成指令調(diào)度。簡單來說,以往是指令集并行,而現(xiàn)在是線程級并行。
緩存部分
每個SIMD-16單元都擁有64KB向量寄存器
每組GCN陣列擁有64KB的本地數(shù)據(jù)共享緩存,還有16KB的一級緩存
每組GCN陣列有一個標量運算單元,用于執(zhí)行整數(shù)指令、媒體指令和浮點原子操作,這個標量運算單元擁有自己的4KB寄存器
更多的線程調(diào)度
從緩存部分的設計來看,雖然GCN擁有更大的緩存容量,但在并行計算領域經(jīng)營多年的NVIDIA顯然要棋高一手。
從線程級別來看,GCN與SM是不可分割的最小單元,GCN一次可以執(zhí)行64個線程,而SM是48個(其實就是流處理器的數(shù)量)。
從多線程執(zhí)行上來看,GCN可以同時執(zhí)行4個硬件線程,而SM是雙線程調(diào)度器的設計(參見架構圖)。
關注我們



