国产成人福利在线视频播放下载,成人无码www免费视频在线看,放荡的美妇在线播放,大地资源网最新更新,国产成人精品日本亚洲网站

泡泡網(wǎng)顯卡頻道 PCPOP首頁      /      顯卡     /      評(píng)測(cè)    /    正文

轉(zhuǎn)碼/解密/挖礦!顯卡計(jì)算能力大對(duì)比

    泡泡網(wǎng)顯卡頻道8月27日 現(xiàn)在的顯卡市場(chǎng),同質(zhì)化已經(jīng)嚴(yán)重到了什么地步呢?不僅僅是板卡廠商之間的顯卡性能基本沒區(qū)別,而且同價(jià)位的N卡和A卡在不同游戲中的表現(xiàn)也是難分勝負(fù),讓游戲玩家們難以抉擇。

不談?dòng)螒?!市售顯卡通用計(jì)算能力

    于是NVIDIA和AMD的競(jìng)爭(zhēng)開始逐漸淡化游戲,而強(qiáng)調(diào)功能和應(yīng)用,三屏、3D、PhysX、視頻等開始大行其道。不過這些功能都難以量化,隨著CUDA和Stream的飛速發(fā)展催生了OpenCL和DirectCompute通用計(jì)算標(biāo)準(zhǔn),使得NVIDIA和AMD在另一條道路上展開了新的競(jìng)賽——并行計(jì)算。

    近年來GPU已經(jīng)在科學(xué)研究和超級(jí)計(jì)算領(lǐng)域取得突破性進(jìn)展,隨著數(shù)百萬支持CUDA的GPU已經(jīng)遍布全球計(jì)算機(jī),軟件開發(fā)人員、科學(xué)人士和研究人員正在利用CUDA探測(cè)到更多更廣的領(lǐng)域中,包括圖像和視頻編輯、計(jì)算生物學(xué)和計(jì)算化學(xué)、流體力學(xué)模擬、CT圖像重組、地震分析、光線追蹤以及其它更多。近年來超級(jí)計(jì)算機(jī)的突飛猛進(jìn)很大程度上也是得益于強(qiáng)大的GPU加盟。

性能說話!市售顯卡通用計(jì)算能力亂斗

    對(duì)顯卡感興趣的朋友都知道,通用計(jì)算之所以如此熱門,根本原因在于顯卡核心GPU的多流處理器(相當(dāng)于數(shù)百核心)架構(gòu):GPU強(qiáng)大的并行浮點(diǎn)運(yùn)算能力是僅僅擁有個(gè)位數(shù)核心的中央處理器CPU無法望其項(xiàng)背的。而通用計(jì)算技術(shù)可以發(fā)揮GPU的長(zhǎng)處,讓其電腦運(yùn)算速度飆升,一些應(yīng)用程序的速度可以提高數(shù)倍甚至數(shù)十倍,讓原來因?yàn)檫\(yùn)算量巨大而不可完成的任務(wù)變得可行。

    而在家用、辦公電腦上,借助GPU加速的軟件也越來越多,這些軟件有的可以用來轉(zhuǎn)碼,有的可以用來增強(qiáng)圖像、視頻的畫質(zhì),有的可以將2D電影轉(zhuǎn)換成3D,有的還能智能歸類和編輯照片……

    跟以往的GPGPU概念不同的是,CUDA是一個(gè)完整的解決方案,包含了API、C編譯器等,能夠利用顯卡核心的片內(nèi)L1 Cache共享數(shù)據(jù),使數(shù)據(jù)不必經(jīng)過內(nèi)存-顯存的反復(fù)傳輸,shader之間甚至可以互相通信,對(duì)數(shù)據(jù)的存儲(chǔ)也不再約束于以往GPGPU的紋理方式,存取更加靈活,可以充分利用stream out(流輸出)特性,最典型的例子就是PhysX物理加速特效。PhysX最早是Aegia公司推出的硬件級(jí)物理加速技術(shù),NVIDIA將其收購(gòu)之后便通過CUDA環(huán)境將PhysX軟件化,由顯卡中的shader單元承擔(dān)物理加速特效的運(yùn)算。

性能說話!市售顯卡通用計(jì)算能力亂斗

    對(duì)于Stream技術(shù),AMD宣稱可讓顯卡內(nèi)數(shù)百個(gè)平行串流核心,為各種一般用途的應(yīng)用帶來加速的效果,打造各種優(yōu)異的平臺(tái),并可大幅提升每瓦性能,而實(shí)現(xiàn)這一點(diǎn)的前提就依賴于AMD獨(dú)特的流處理器單元設(shè)計(jì)。

性能說話!市售顯卡通用計(jì)算能力亂斗

    GF100的512個(gè)CUDA核心都符合IEEE 754-2008浮點(diǎn)算法(Cypress也是如此)和完整的32位整數(shù)算法,而后者在過去只是模擬的,事實(shí)上僅能計(jì)算24-bit整數(shù)乘法;同時(shí)全面引入的還有積和熔加運(yùn)算(Fused Multiply-Add/FMA)。此外雙精度浮點(diǎn)(FP64)性能大大提升,峰值執(zhí)行率可以達(dá)到單精度浮點(diǎn)(FP32)的1/2,而過去只有1/8,AMD從R600開始到現(xiàn)在的Cypress核心都是1/5,沒有做任何變化。

    其實(shí)業(yè)界第一款GPU通用計(jì)算軟件就是用戶科學(xué)計(jì)算,它就是由斯坦福大學(xué)主導(dǎo)的Folding @ Home分布式計(jì)算,最早支持ATI顯卡,而NVIDIA后來者居上,目前N卡所貢獻(xiàn)的運(yùn)算能力已經(jīng)超越了所有CPU之和,A卡也不弱!

性能說話!市售顯卡通用計(jì)算能力亂斗

    Folding@home是一個(gè)研究蛋白質(zhì)折疊、誤折、聚合及由此引起的相關(guān)疾病的分布式計(jì)算工程。最開始F@H僅支持CPU,后來加入了對(duì)PS3游戲機(jī)的支持,但同樣是使用內(nèi)置的CELL處理器做運(yùn)算。F@H因ATI的加入為GPU計(jì)算翻開了新的一頁,如今F@H第二代GPU客戶端已經(jīng)能夠支持ATI和NVIDIA的全系列DX10 11 GPU

性能說話!市售顯卡通用計(jì)算能力亂斗

    針對(duì)Fermi核心的平衡運(yùn)算優(yōu)勢(shì),《Folding@Home》最新版本GPU3,專為新一代Fermi系列顯卡而設(shè),進(jìn)一步善用Fermi核心架構(gòu)之優(yōu)勢(shì)。

性能說話!市售顯卡通用計(jì)算能力亂斗

    據(jù)官方介紹,新版的蛋白質(zhì)折疊運(yùn)算速度及穩(wěn)定性已經(jīng)大幅提高,而且加入更加科學(xué)計(jì)算項(xiàng)目,希望能籍Fermi核心的架構(gòu)優(yōu)勢(shì),加快《Folding@Home》內(nèi)的各項(xiàng)復(fù)雜運(yùn)算。Shader的頻率對(duì)影響運(yùn)算效能非常大,所以NVIDIA可以領(lǐng)先AMD很多。

    遺失密碼是一件令人相當(dāng)煩惱的事,尤其因忘記工作文檔密碼所做造成的金錢損失更是十分“杯具”,如何快捷高效地找回密碼是件難事?,F(xiàn)行GPU的發(fā)展越來越強(qiáng)勢(shì),通用運(yùn)行能力已經(jīng)遠(yuǎn)超于CPU,而CPU的運(yùn)行能力卻是有限的,所以能夠發(fā)揮出GPU強(qiáng)大的通用運(yùn)算能力定必會(huì)大大縮短破解密碼的時(shí)間。

    GPU就是顯示卡的“心臟”,也就相當(dāng)于CPU在電腦中的作用,它決定了該顯卡的檔次和大部分性能外,還有著大規(guī)模的并行計(jì)算能力,可以讓開發(fā)人員領(lǐng)先出引人入用的消費(fèi)級(jí)和專業(yè)級(jí)的計(jì)算應(yīng)用程序。無論是NVIDIA的CUDA或者是AMD的Stream運(yùn)算,都是眾多軟件廠商所追捧的。

性能說話!市售顯卡通用計(jì)算能力亂斗

    我們找來了Elcomsoft出品的Advanced Office Password Recovery,是一款同時(shí)支持CPU與GPU的Office密碼恢復(fù)軟件。最多可支持32個(gè)CPU或內(nèi)核和8個(gè)GPU同樣運(yùn)行,也可以指定全部或者是部分CPU/GPU核心進(jìn)行恢復(fù)密碼的工作。

    測(cè)試中我們關(guān)閉所有CPU核心,完全由GPU獨(dú)立工作來破解一個(gè)由6位數(shù)字加密的Word文件。

性能說話!市售顯卡通用計(jì)算能力亂斗

性能說話!市售顯卡通用計(jì)算能力亂斗

    密碼破解對(duì)于流處理器數(shù)量非常敏感。AMD的GPU由于SIMD架構(gòu)的龐大流處理器優(yōu)勢(shì)遙遙領(lǐng)先于NVIDIA GPU。

    Cyberlink(訊連科技)旗下大名鼎鼎PowerDVD相信大家都非常熟悉,作為一家專注視頻與多媒體的軟件開發(fā)商,Cyberlink不久前推出了一款專業(yè)的快速視頻轉(zhuǎn)換軟件——MediaShow Espresso,需要注意的是MediaShow(魅力四射)是一款視頻編輯軟件,而MediaShow Espresso才是視頻轉(zhuǎn)換軟件。

性能說話!市售顯卡通用計(jì)算能力亂斗

    現(xiàn)在編碼解碼軟件滿天飛,但是MediaShow Espresso卻有它的獨(dú)到之處。它是第一款同時(shí)支持CUDA與Stream加速的視頻轉(zhuǎn)換軟件,除此之外它還對(duì)Intel Core i7處理器的超線程及SSE4指令集做了優(yōu)化,因此無論純CPU轉(zhuǎn)碼還是GPU加速,其速度比傳統(tǒng)軟件都要快。

    測(cè)試視頻文件為長(zhǎng)度為3分42秒碼率22M的H.264編碼的M2TS文件。測(cè)試中我們打開GPU解碼與GPU編碼選項(xiàng),將編解碼工作交由GPU來完成。

性能說話!市售顯卡通用計(jì)算能力亂斗

    可以看出,GPU視頻轉(zhuǎn)碼時(shí),CPU和GPU都要參加計(jì)算,而且GPU不需要盡全力,所以高端GPU和中端GPU的性能是差不多的??傮w來看N卡的CUDA性能要優(yōu)于A卡的Stream性能。

    值得注意的是,本次測(cè)試使用的是同時(shí)支持CUDA和Stream的MediaShow Espresso進(jìn)行測(cè)試,如果使用僅支持CUDA的MediaCoder軟件的話,N卡的視頻轉(zhuǎn)碼速度還能更快,這方面A卡無論性能還是軟件支持度都不如N卡。

    ComputeMark由捷克硬件和游戲網(wǎng)站CzechGamer.com的Robert Varga開發(fā)制作,引擎是基于Jan Vlietinck的Fluid3D Demo。軟件能夠使顯卡占用率達(dá)到99%,而CPU占用率僅0-1%,避免由CPU性能造成對(duì)測(cè)試成績(jī)的影響。同時(shí)該軟件還有功耗測(cè)量的功能,測(cè)試時(shí)間可以隨意設(shè)定。

性能說話!市售顯卡通用計(jì)算能力亂斗

    ComputeMark需要在純DX11環(huán)境下運(yùn)行,包括Windows 7 32/64位操作系統(tǒng)、DX11 API和DX11顯卡。

性能說話!市售顯卡通用計(jì)算能力亂斗

    最終結(jié)果很和諧,雖然A卡的理論浮點(diǎn)運(yùn)算能力很高,但在DirectCompute理論測(cè)試當(dāng)中,同級(jí)別的A卡并不比N卡高多少。因?yàn)镈irectCompute現(xiàn)階段主要還是在游戲當(dāng)中使用,因此意義不是很大。

    如果您還不了解比特幣的話,不妨看看前不久我們的評(píng)測(cè)文章《掛機(jī)也能賺錢?教你用顯卡挖礦賺美元》。這里就直接引用測(cè)試數(shù)據(jù):

性能說話!市售顯卡通用計(jì)算能力亂斗

    下面筆者做個(gè)簡(jiǎn)要分析:

1. HD6990擁有兩顆GPU,核心頻率與單核心的HD6970完全相同,所以挖礦性能正好翻倍。事實(shí)上HD6990就是需要開兩個(gè)挖掘器分配給兩顆GPU一起計(jì)算。
2. AMD上代HD5870流處理器稍多于HD6970,但核心頻率稍低,最終兩代旗艦單卡的挖礦性能差不多。要知道VLIW4架構(gòu)的HD6970游戲性能要強(qiáng)于VLIW5架構(gòu)的HD5870,但挖礦性能似乎只取決于理論浮點(diǎn)運(yùn)算能力,跟架構(gòu)和效率毫無關(guān)系。
3. Barts核心的HD6790擁有256Bit顯存位寬,比128Bit的HD6770大一倍。但兩者的挖礦性能完全相同,所以顯存位寬頻率對(duì)性能沒有任何影響,影響性能的唯一因素就是流處理器數(shù)量及頻率。
4. NV優(yōu)異單卡GTX580還不如HD6750,但要比CPU強(qiáng)很多,畢竟它也有數(shù)百顆核心。

    那為什么A卡和N卡的差距如此之大呢?比特幣挖掘器采用的是SHA-256,這是由美國(guó)國(guó)家安全局發(fā)明的一種安全散列函數(shù),一般用于密碼加密與解密。這種算法會(huì)進(jìn)行大量32位整數(shù)循環(huán)右移運(yùn)算,這個(gè)操作在AMD GPU那里可以通過單一硬件指令實(shí)現(xiàn),而在NVIDIA GPU那里需要三次硬件指令來模擬(2移+1加),僅這一條就為AMD帶來額外的1.7倍運(yùn)算效率優(yōu)勢(shì)(大約1900指令來執(zhí)行SHA-256壓縮操作,而不是NVIDIA的大約3250指令)。

    如此一來,AMD較高的浮點(diǎn)運(yùn)算能力再加上算法效率優(yōu)勢(shì),AMD GPU在密碼破解與比特幣挖掘時(shí)的性能,大概是NVIDIA GPU的3倍以上!

    通過前面幾項(xiàng)不同類型的通用計(jì)算應(yīng)用來看,A卡和N卡之間的性能差距是相當(dāng)大的,而且動(dòng)不動(dòng)就是幾倍以上的差距。A卡恐怖的理論性能有時(shí)候確實(shí)有效果,但有時(shí)候還是要大幅落后于N卡,這與雙方在3D游戲中和諧愉快的表現(xiàn)截然相反!

    這種奇怪的現(xiàn)象,一方面是由雙方截然不同的架構(gòu)所造成的,另一方面是不同應(yīng)用的算法不同,可能會(huì)比較“偏愛”某一種架構(gòu)。最終,就要看誰在軟件優(yōu)化方面做得好,誰就能勝出。目前來看CUDA還是占有明顯的上風(fēng),已經(jīng)有很多超級(jí)計(jì)算機(jī)配備了NVIDIA Tesla加速卡,CUDA的應(yīng)用軟件還是要比Stream多很多的。

性能說話!市售顯卡通用計(jì)算能力亂斗

    不管CUDA和Stream孰強(qiáng)孰弱,OpenCL和DirectCompute標(biāo)準(zhǔn)誰能笑到最后,GPU的地位顯然在迅速攀升。超級(jí)計(jì)算機(jī)想要在性能上取得突破,使用GPU+CPU的異構(gòu)架構(gòu)是唯一選擇,未來高性能計(jì)算已經(jīng)離不開GPU的支持了。

    NVIDIA和ATI從3D游戲戰(zhàn)場(chǎng)打到了通用并行計(jì)算領(lǐng)域,到底誰能笑到最后現(xiàn)在還是個(gè)未知數(shù)。

性能說話!市售顯卡通用計(jì)算能力亂斗

    對(duì)于普通用戶來說,顯卡已經(jīng)不再是一塊單純的3D游戲加速卡,以視頻應(yīng)用為代表的高性能計(jì)算軟件率先步入GPU通用計(jì)算的大門,未來將會(huì)有更多計(jì)算軟件使用GPU強(qiáng)大的運(yùn)算能力來加速,CPU和GPU的地位將變得同等重要。現(xiàn)在,玩家們因一兩款特別喜愛的游戲而升級(jí)顯卡;將來,或許很多不玩游戲的人,也會(huì)加入到獨(dú)立顯卡的行列!■<

0人已贊

關(guān)注我們

泡泡網(wǎng)

手機(jī)掃碼關(guān)注