国产成人福利在线视频播放下载,成人无码www免费视频在线看,放荡的美妇在线播放,大地资源网最新更新,国产成人精品日本亚洲网站

泡泡網顯卡頻道 PCPOP首頁      /      顯卡     /      評測    /    正文

圖形與計算那些事 AMD次世代架構解析

    也許有人會問,如此暴力的擴充流處理器規(guī)模而不更改架構,R600架構會成為AMD的常青樹嗎?難道不會有什么瓶頸嗎?當然會有,AMD也發(fā)現(xiàn)了,所以從HD6000系列開始又進行了一輪架構的微調,透過AMD架構微調這一結果,我們可以了解出現(xiàn)問題原因到底是什么?

    HD6870的一小步:兩個超線程分配處理器

    Barts核心的HD6870率先問世,這顆核心定位中端,所以流處理器從Cypress的1600個精簡到了1120個,流處理器結構依然沒有任何變化,但是前端控制模塊一分為二:

第二代DX11架構!HD6870/6850全面評測

    相信大家應該注意到了,以往AMD的SIMD架構則是整顆GPU共享單一的控制單元,自R600以來都是如此。

Cypress的單一圖形裝配引擎

    但隨著晶體管規(guī)模和流處理器數(shù)量的迅速膨脹,單一的控制單元已經無法滿足大規(guī)模并行指令分配的需要,因此從Cypress開始,AMD采用了“雙核心”的設計,將SIMD陣列一分為二,也就是類似于NVIDIA GPC的設計。與此相對應的,圖形裝配引擎雖然只有一個,內部卻設計了兩個Hierarchical Z(分層消影器)和Rasterizer(光柵器),但是其它的特殊功能模塊均只有一個。

    Barts和Cypress一樣,依然保持了雙核心設計,圖形引擎也只有一個,內部的功能模塊并沒有太多變化。但是Ultra-Treaded Dispatch Processor(超線程分配處理器)卻變成了兩個,相對應的,超線程分配處理器的指令緩存也變成了兩份。

第二代DX11架構!HD6870/6850全面評測

Barts的圖形裝配引擎

    我們知道,Barts的流處理器數(shù)量是Cypress的70%,按理說線程分配壓力有所下降,那么設計兩個線程分配處理器的目的只有一個,那就是提升效率。在DX11時代,幾何著色再加上曲面細分單元引入之后,圖形裝配引擎會產生更多的并行線程及指令轉交SIMD進行處理,因此指令派發(fā)效率成為了新的瓶頸。

    SIMD架構的優(yōu)勢就是可以用較少的晶體管制造成龐大的流處理器規(guī)模,擁有恐怖的理論運算能力;但缺點就是流處理器執(zhí)行效率比MIMD架構低,其效率高低完全依賴于分配單元的派發(fā)效率。因此Barts這種雙線程分配處理器的設計意義重大。

    雙超線程分配處理器的意義:曲面細分性能翻倍

    HD6000系列可以說是半代改進的架構,既然數(shù)量上維持不變,就只能從改進效率的方面考慮了。而改進的內容就是加強線程管理和緩沖,也就是“雙倍的超線程分配處理器和指令緩存”。

第二代DX11架構!HD6870/6850全面評測

    根據(jù)AMD官方提供的數(shù)據(jù)來看,HD6870的曲面細分性能最多可達HD5870的兩倍,這種情況出現(xiàn)在10級左右的中等細分程度,當曲面細分達到20級以上的時候,那么它們的性能就基本上沒有區(qū)別了。

    由此可見,Barts核心當中的Tessellator單元本身在性能方面應該沒有改進,其性能提升主要源于兩顆超線程分配處理器。中等級別的曲面細分在指令分配方面是瓶頸,Barts改進的架構消除了這一瓶頸,所以性能提升十分顯著,但如果細分級別特別高時,Tessellator本身的運算能力將成為瓶頸,此時線程派遣器的效率再高,也無濟于事。

    看起來,AMD迫切的想要改進指令派發(fā)效率,以滿足龐大規(guī)模流處理器的胃口,并且有效的提升備受詬病的曲面細分性能。AMD的做法就是繼續(xù)保持現(xiàn)有架構不變,發(fā)現(xiàn)瓶頸/缺陷然后消除瓶頸/缺陷,這讓筆者想起了一段老話:“新三年舊三年,縫縫補補又三年”。

2人已贊

關注我們

泡泡網

手機掃碼關注