国产成人福利在线视频播放下载,成人无码www免费视频在线看,放荡的美妇在线播放,大地资源网最新更新,国产成人精品日本亚洲网站

泡泡網(wǎng)顯卡頻道 PCPOP首頁      /      顯卡     /      評測    /    正文

GCN再戰(zhàn)開普勒 通用計算能力誰更強?

    這一代GCN架構(gòu)的完整版HD7970擁有2048個流處理器,而開普勒架構(gòu)的完整版GTX680則擁有1536個。兩者的紋理單元、ROP數(shù)量一樣,而顯存位寬方面HD7970為384Bit,GTX680則為256Bit,這造成了兩者顯存帶寬上264GB/s與192GB/s之間的差距。

GCN再戰(zhàn)開普勒 通用計算能力誰更強?

    從GPU外圍模塊來看,AMD的Tahiti和上代Cayman相比變化不大,只是強化了曲面細分單元,加入了雙異步計算引擎而已。最大的改變來自于流處理器部分,原有的SIMD引擎不見了,取而代之的是GCN陣列,那SIMD引擎與GCN陣列有什么本質(zhì)區(qū)別呢?

    代號為Tahiti的HD7970中,每個GCN陣列里面包括4個SIMD單元,每個SIMD單元內(nèi)部包括16個1D標量運算單元。這樣的話Cayman的SIMD引擎是16x4=64個流處理器,而Tahiti的GCN陣列是4x16=64個流處理器,總數(shù)量雖然沒有變化,但架構(gòu)上是截然相反的設計——Tahiti相對于Cayman來說革命性的改變就是把4D矢量運算單元改成了1D標量運算單元!

    但是,GCN架構(gòu)與NVIDIA的CUDA架構(gòu)還是有明顯的區(qū)別,那就是GCN里面包括了4個SIMD-16單元,標量流處理器被硬性拆分為4個小組,而NVIDIA的SM則沒有這種設計,所有流處理器都一視同仁。

GCN再戰(zhàn)開普勒 通用計算能力誰更強?

    而NVIDIA方面,則是不停的對GPU的GPC、SM、CUDA核心等配比進行微調(diào),在微調(diào)的過程中經(jīng)歷了兩次突變:第一次是GT200到GF100,首次引出了GPC(圖形處理器集群)的概念,GPC數(shù)量減少但SM數(shù)以及流處理器數(shù)量增加不少;第二次就是現(xiàn)在了,從GF100到GK104,SM數(shù)量減少,但流處理器數(shù)量暴增!

    改變是為了適應形式的變化,解決此前出現(xiàn)的一些問題,那NVIDIA的架構(gòu)有什么問題呢?此前我們多次提到過,雖然NVIDIA的GPU在效能方面占盡優(yōu)勢,但也不是完美無缺的——NVIDIA最大的劣勢就是流處理器數(shù)量較少,導致理論浮點運算能力較低。當然這只是表面現(xiàn)象,其背后的本質(zhì)則是MIMD(多指令多數(shù)據(jù)流)的架構(gòu),相當一部分比例的晶體管消耗在了指令發(fā)射端和控制邏輯單元上面,所以流處理器數(shù)量始終低于對手。

GCN再戰(zhàn)開普勒 通用計算能力誰更強?

    為了保證GPU性能持續(xù)增長,NVIDIA必須耗費更多的晶體管、制造出更大的GPU核心,而這些都需要先進的、成熟的半導體制造工藝的支持。NVIDIA之所以在GF100(GTX480)時代落敗,并非架構(gòu)或者研發(fā)端出了什么問題(GF110/GTX580的成功可以證明),而是核心太大導致40nm工藝無法支撐,良率低下漏電流難以控制,最終導致核心不完整且功耗巨大。如此一來,NVIDIA原有的架構(gòu)嚴重受制于制造工藝,并非可持續(xù)發(fā)展之路。

    為此,NVIDIA將芯片架構(gòu)逐步轉(zhuǎn)向了SIMT的模式,即Single Instruction Multiple Threads(單指令多線程),SIMT有別與AMD的SIMD,SIMT的好處就是無需開發(fā)者費力把數(shù)據(jù)湊成合適的矢量長度,并且SIMT允許每個線程有不同的分支。 純粹使用SIMD不能并行的執(zhí)行有條件跳轉(zhuǎn)的函數(shù),很顯然條件跳轉(zhuǎn)會根據(jù)輸入數(shù)據(jù)不同在不同的線程中有不同表現(xiàn),這個只有利用SIMT才能做到。

    SIMT在硬件部分的結(jié)構(gòu)還是要比SIMD復雜一些,NVIDIA還是更注重效率一些,所以NVIDIA的流處理器數(shù)量還是要比AMD少,但差距已經(jīng)沒以前那么夸張了。

0人已贊

關(guān)注我們

泡泡網(wǎng)

手機掃碼關(guān)注