Phenom VS Penryn 雙雄大戰(zhàn)鎖定年底
● Penryn :新增47條SSE4指令
自Intel Pentium MMX 處理器開始,處理器新增SIMD(Single Instruction Multiple Data)多媒體指令集,可把多個(gè)批次性的指令組變成單一指令,以提升數(shù)據(jù)處理能力,后來(lái)Intel基于MMX指令發(fā)展出SSE(Streaming SIMD Extensions)指令集,直至Penryn處理器已發(fā)展至SSE4指令集。
MMX:1997年發(fā)布,全名為 MultiMedia eXtension,首顆支持MMX產(chǎn)品為 Pentium MMX 處理器,主要用作提升多媒體數(shù)據(jù)的處理能力,共有57條指令。
SSE:1999 年發(fā)布,全名為 Streaming SIMD Extensions,首顆支持SSE產(chǎn)品為 Pentium III處理器,除新增70條指令,進(jìn)一步提升多媒體數(shù)據(jù)的處理能力,最重要的是解決了MMX指令與浮點(diǎn)指令不能同時(shí)處理的問題。
SSE2 :2001年發(fā)布,全名為Streaming SIMD Extensions 2,首顆支持SSE2產(chǎn)品為Pentium 4處理器,新增指令共144條,主要加入 64 位雙精度浮點(diǎn)數(shù)及整型運(yùn)算指令,以及加入處理器對(duì)Cache的控制指令以減低延遲,更重要的是完全解決SSE集指令需要占用浮點(diǎn)數(shù)據(jù)緩存器問題。
SSE3 :2004年發(fā)布,全名為Streaming SIMD Extensions 3,首顆支持的處理器為 Prescott核心的Pentium 4處理器,新增指令僅13條,主要特點(diǎn)是加入水平式緩存器整數(shù)運(yùn)算,可對(duì)多筆數(shù)值同時(shí)進(jìn)行加法或減法運(yùn)算,令處理器能大量執(zhí)行 DSP及3D性質(zhì)的運(yùn)算。浮點(diǎn)數(shù)數(shù)值轉(zhuǎn)換成整數(shù)數(shù)值而不需要進(jìn)行運(yùn)算模式切換,避免模式切換時(shí)導(dǎo)致其它執(zhí)行緒被延誤,減損系統(tǒng)運(yùn)算效能。
此外,SSE3 更針對(duì)多執(zhí)行緒的應(yīng)用程序進(jìn)行執(zhí)行非常好的化,使處理器原有的 Hyper-Theading 功能獲得更佳的發(fā)揮。
SSE3指令集的補(bǔ)充版本,全名為 Supplemental Streaming SIMD Extension 3,首顆支持Intel Core微架構(gòu)處理器,新增指令共16條,進(jìn)一步增強(qiáng) CPU在多媒體、圖形圖像和Internet等方面的處理能力,該16條指令原收錄為 SSE4指令集中,之后決定提早加入至Core微架構(gòu)產(chǎn)品中。
SSE4 :全名為Streaming SIMD Extension 4,被視為繼2001年以來(lái)最重要的媒體指令集架構(gòu)的改進(jìn),除擴(kuò)展Intel 64指令集架構(gòu)外,還加入有關(guān)圖形、視頻編碼及處理、三維成像及游戲應(yīng)用等指令,令涉及音頻、圖像和數(shù)據(jù)壓縮算法的應(yīng)用程序大幅受益。
據(jù)了解,SSE4將分為4.1版本及4.2版本,4.1版本將會(huì)首次出現(xiàn)于Penryn處理器中,共新增47條指令,主要針對(duì)向量繪圖運(yùn)算、3D游戲加速、視像編碼加速及協(xié)同處理加速動(dòng)作,包括:
Penryn SSE4 Instruction summary | ||
Instruction Category | Instructions | Benefits |
Packed DWORD Multiplies | PMULLD, PMULDQ | 提升編譯器矢量運(yùn)算效能 |
Floating Point Dot Product | DPPS, DPPD | 3D立體制作及游戲,支持CG及HLSL等語(yǔ)言 |
Multi-packed sum of absolute diffs& min pos | MPSADBW, PHMINPOSUW | 視頻編碼處理 |
Streaming Load | MOVNTDQA | 視頻編碼處理、繪圖及GPU數(shù)據(jù)分享 |
Floating Point Round | ROUNDPS, ROUNDSS, ROUNDPD, ROUNDSD | 視頻編碼處理 、繪圖、影音處理、2D/3D應(yīng)用、多媒體及游戲等 |
Packed Blending | BLENDPS, BLENDPD, BLENDVPS, BLENDVPD, PBLENDVB, PBLENDDW | 編譯器矢量運(yùn)算及影音處理、多媒體、游戲等應(yīng)用 |
Packed Integer Min and Max | PMINSB, PMAXSB, PMINUW, PMAXUW, PMINUD, PMAXUD, PMINDS, PMAXSD | |
Register Insertion/Extraction | INSERTPS, PINSRB, PINSRD, PINSRQ, EXTRACTPS, PEXTRB, PEXTRD, PEXTRW, PEXTRQ | |
Packed Format Conversion | PMOVSXBW, PMOVZXBW, PMOVSXBD, PMOVZXBD, PMOVSXBQ, PMOVZXBQ, PMOVSXWD, PMOVZXWD, PMOVSXWQ, PMOVZXWQ, PMOVSXDQ, PMOVZXDQ | |
Packed Test & Set | PTEST | |
Packed Compare for Equal | PCMPEQQ | |
Pack DWORD to Unsigned WORD | PACKUSDW |
關(guān)注我們
