AMD桌面級APU發(fā)布!Llano A8深度評測
第五章 APU加速處理器應用體驗
在上一章,我們通過全方位的測試,以數(shù)據(jù)的方式向大家展示了APU加速處理器在CPU、GPU以及異構計算方面的實際性能。但是理論運算能力再強,也都需要軟件的支持才能發(fā)揮出威力。本章將向大家展示AMD近年來在異構計算方面的努力,這一切都是為APU做準備的。
第五章/第一節(jié) APU粒子模擬加速
首先我們來看一個可以將APU異構計算加速能力發(fā)揮到最大的演示程序,這是AMD官方設計的一個Demo,采用了OpenCL并行計算技術,充分調動了APU內部的CPU和GPU運算單元,通過智能分配任務的方式將GPU和CPU的運算能力都發(fā)揮到最大。
之所以說AMD的APU并不是把CPU和GPU簡單的組合在一起這么簡單,就是因為AMD的CPU和GPU可以通過OpenCL或DirectCompute并行計算技術協(xié)同工作。而Intel的SandyBridge則不行,Intel只有CPU部分支持OpenCL,GPU部分無法支持,不能起到加速效果。
AMD這個演示Demo當中大約有3.2萬個移動的小粒子、400個固定的大粒子。如果小、小粒子碰撞,就交給GPU去利用OpenCL檢測;計算如果是大、小粒子或者大、大粒子碰撞,則交給CPU負責,這樣的任務分配充分發(fā)揮了CPU和GPU的計算能力優(yōu)勢,APU的負載始終處在接近TDP的水平,運算分布均勻。
除了運算量合理分配之外,由于APU內部的CPU和GPU共享系統(tǒng)內存,這樣CPU和GPU之間就實現(xiàn)了零拷貝,無需通過前端總線去進行數(shù)據(jù)交換,執(zhí)行效率大大提高,同時減少了內存帶寬資源的爭搶,減少了內存帶寬壓力。
這款演示Demo還有一些特殊的設計,還應用到了DX11當中的HDAO、Alpha混合透明、軟陰影等,GPU做并行計算時用不到的圖形渲染模塊也被用于增強演示Demo的畫質,也就是說APU一手包辦了CPU和GPU異構計算以及DX11圖形渲染的所有任務,令人嘆為觀止!
可惜這款Demo僅供內部開發(fā)人員以及技術演示,暫時不提供下載。
關注我們
