Phenom VS Penryn 雙雄大戰(zhàn)鎖定年底
● SSE4 :向量、浮點運算專門化 加入串流式負(fù)載指令
據(jù)Intel指出,在應(yīng)用SSE4指令集后,Penryn增加了2個不同的32Bit向量整數(shù)乘法運算支持,引入了8 位無符號 (Unsigned)最小值及最大值運算,以及16Bit 及32Bit 有符號 (Signed) 及無符號運算,并有效地改善編譯器效率及提高向量化整數(shù)及單精度代碼的運算能力。同時,SSE4 改良插入、提取、尋找、離散、跨步負(fù)載及存儲等動作,令向量運算進一步專門化。
SSE4加入了6條浮點型點積運算指令,支持單精度、雙精度浮點運算及浮點產(chǎn)生操作,且IEEE 754指令 (Nearest, -Inf, +Inf, and Truncate) 可立即轉(zhuǎn)換其路徑模式,大大減少延誤,這些改變將對游戲及 3D 內(nèi)容制作應(yīng)用有重要意義。
此外,SSE4加入串流式負(fù)載指令,可提高以圖形幀緩沖區(qū)的讀取數(shù)據(jù)頻寬,理論上可獲取完整的快取緩存行,即每次讀取64Bit而非8Bit,并可保持在臨時緩沖區(qū)內(nèi),讓指令最多可帶來8倍的讀取頻寬效能提升,對于視訊處理、成像以及圖形處理器與中央處理器之間的共享數(shù)據(jù)應(yīng)用,有著明顯的效能提升。
● Penryn :SSE4指令集強化視訊編碼效率
SSE4指令集進一步強訊編碼效果,例如可同時處理8個4-byte寬度的SAD(Sums of Absolute Differences)運算,常用于新一代高清影像編碼如VC.1及H.264等規(guī)格中,令視頻編碼速度進一步提升。
關(guān)注我們
