英特爾45nm新旗艦四核QX9650解析測(cè)試
首批45nm Penryn分為三個(gè)系列:至尊四核心的Core 2 Extreme QX9050、主流四核心的Core 2 Quad Q9000、雙核心的Core 2 Duo E8000。
而2008年1月,“Core 2 Quad Q9550、Q9450、Q9300”三款主流四核心跟進(jìn),主頻2.83GHz、2.66GHz和2.50GHz,二級(jí)緩存前兩款2×6MB、后一款2×3MB(注意編號(hào)第三位5和0的不同),熱設(shè)計(jì)功耗均為95W。另外,同月發(fā)布的還有“Core 2 Duo E8500、E8400、E8300、E8200”四款主流雙核心面世,主頻3.16GHz、3.00GHz、2.83GHz和2.66GHz,二級(jí)緩存均為2×3MB,熱設(shè)計(jì)功耗都是65W。
這些產(chǎn)品都采用了45nm工藝, 這使得Intel每年推出具增強(qiáng)微架構(gòu)或全新微架構(gòu)處理器產(chǎn)品的承諾順利兌現(xiàn),其不僅僅是單純制程提升,更重要的是,微架構(gòu)設(shè)計(jì)經(jīng)全力改良后,性能更較當(dāng)年Intel P4 Willamette提升至Northwood核心,有過(guò)之而無(wú)不及,同時(shí)使功耗更低。下面我們就來(lái)全面了解45nm的Penryn會(huì)帶給我們?cè)鯓拥捏@喜。
● 45nm出現(xiàn)是晶體管誕生60歲最好的禮物自1947年晶體管發(fā)明迄今,科技進(jìn)步的速度驚人,催生了功能更為先進(jìn)強(qiáng)大,又能兼顧成本效益和耗電量的產(chǎn)品。雖然科技進(jìn)展迅速,但晶體管產(chǎn)生的廢熱和漏電,仍是縮小設(shè)計(jì)及延續(xù)摩爾定律 (Moore''s Law) 的最大障礙,因此業(yè)界必須以新材料取代過(guò)去40年來(lái)制作晶體管的材料。
翻查晶體管歷史,2007年正好是晶體管誕生60周年,首顆晶體管出現(xiàn)于1947年12月16日,貝爾實(shí)驗(yàn)室 (Bell Labs)的William Shockley、John Bardeen和Walter Brattain成功制作第一個(gè)晶體管,改變了人類(lèi)的歷史。那么,在這60周年的今天,Intel公司首次推出45nm工藝處理器,作為晶體管60周歲最好的禮物。
摩爾定律之父——戈登摩爾
這其中我們要感謝一個(gè)人,那就是Intel的創(chuàng)始人戈登摩爾(Gordon Moore),通過(guò)長(zhǎng)期的對(duì)比,研究后發(fā)現(xiàn):CPU中的部件(我們現(xiàn)在所說(shuō)的晶體管)在不斷增加,其價(jià)格也在不斷下降。“隨著單位成本的降低以及單個(gè)集成電路集成的晶體管數(shù)量的增加;到1975年,從經(jīng)濟(jì)學(xué)來(lái)分析,單個(gè)集成電路應(yīng)該集成65000個(gè)晶體管。”Intel此后幾年的發(fā)展都被摩爾提前算在了紙上,使人們大為驚奇,“摩爾定律”也名聲大振。為了讓人們更直觀地了解摩爾定律,摩爾及其同事總結(jié)出一句極為精練的公式 “集成電路所包含的晶體管每18個(gè)月就會(huì)翻一番”。
之后的芯片內(nèi)集成的晶體管數(shù)量也證實(shí)了他的這句話,并且發(fā)展速度還在加快。從芯片制造工藝來(lái)看,在1965年推出的10微米(μm)處理器后,經(jīng)歷了6微米、3微米、1微米、0.5微米、0.35微米、0.25微米、0.18微米、0.13微米、0.09微米、0.065微米,而0.045微米的制造工藝將是目前CPU的最高工藝。以下我們就來(lái)簡(jiǎn)單的見(jiàn)證一下Intel CPU工藝制程一路走來(lái)的風(fēng)雨歷程。
● 90nm的出現(xiàn)是CPU工藝一個(gè)質(zhì)的飛躍奇怪的是每當(dāng)新一代CPU問(wèn)世時(shí),人們都會(huì)熱衷于討論它采用了多少微米或納米制程。的確,每一次制程(或制造工藝)的進(jìn)步都會(huì)對(duì)芯片制造業(yè)產(chǎn)生舉足輕重的影響,并演繹一個(gè)個(gè)經(jīng)典的傳奇。
Pentium讓CPU工藝從微米時(shí)代跨入了納米
按照摩爾老先生在文章中提出,芯片上集成的晶體管數(shù)量大約每18個(gè)月就將翻一番。從1971年Intel發(fā)布第一款處理器4004時(shí),所采用的工藝是10微米,芯片內(nèi)僅包含著2300多個(gè)晶體管,主頻也非常的低。直到1995年奔騰處理器發(fā)布后,CPU的制造工藝才首次采用納米工藝表示,第一代奔騰處理器采用的是800nm工藝,同時(shí)也標(biāo)志著CPU制造工藝從微米時(shí)代跨入了納米時(shí)代。奔騰處理器芯片內(nèi)的晶體管數(shù)量為310萬(wàn)個(gè),主頻也有所提升,此時(shí)CPU的速度也有大幅的提升。
奔騰4E將CPU工藝帶入了90nm時(shí)代
之后CPU工藝就開(kāi)始飛速的發(fā)展,芯片內(nèi)集成的集體管數(shù)量不斷的翻倍。到2004年。CPU制作工藝發(fā)生了質(zhì)的飛躍,推出了核心為Prescott的Pentium 4E處理器,在此次推出的Pentium 4E處理器中,一個(gè)顯著的特點(diǎn)就工藝再次改進(jìn)為90nm,集成了1億個(gè)晶體管。其中首批90nm處理器型號(hào)為3.40E GHz、3.20E GHz、3.00E GHz、2.80E GHz P4(“E”后綴商標(biāo))支持超線程技術(shù),800MHz前端總線和1MB二級(jí)緩存; 但此次工藝的提升,沒(méi)有使得功耗降低,因?yàn)橹黝l的提升,使得Prescott處理器功耗開(kāi)始走高。
此時(shí),Intel推出90nm處理器后,并且在最短的時(shí)間內(nèi)宣布全面進(jìn)入90nm時(shí)代。而AMD在工藝制程方面比英特爾顯然慢了一大步,因此,在2004年,AMD和英特爾在制造工藝上的距離已經(jīng)拉開(kāi)。
● 工藝再提升 勢(shì)不可擋的65nm制作工藝但隨著芯片中晶體管數(shù)量增加,原本僅數(shù)個(gè)原子層厚的二氧化硅絕緣層會(huì)變得更薄進(jìn)而導(dǎo)致泄漏更多電流,隨后泄漏的電流又增加了芯片額外的功耗。此時(shí),由于受“泄漏電流”的影響,導(dǎo)致后續(xù)產(chǎn)品頻率無(wú)法提升,功耗高居不下。為了從當(dāng)前的窘境中逃出來(lái),Intel迅速部署65nm產(chǎn)品計(jì)劃。迅速在2005年推出了Pentium Extreme Edition 955,標(biāo)志著Intel進(jìn)入一個(gè)新的階段,65nm時(shí)代的來(lái)臨。
Pentium Extreme Edition 955處理器基于65nm工藝,是整個(gè)Pentium D 900系列雙核心產(chǎn)品中最高端的一款。
Pentium Extreme Edition 955
盡管新品均采用65nm工藝制造,但其TDP(Thermal Design Power)依然為130W。工作電壓需要從1.2v到1.375V,機(jī)箱內(nèi)部溫度不能夠超過(guò)68.6度。不過(guò),Preslers無(wú)論在制造工藝還是架構(gòu)變革方面都有了非常大改進(jìn),包括獨(dú)立的雙L2 Cache設(shè)計(jì),以及制造工藝較90nm產(chǎn)品有了非常大的改觀。
雖然這一代產(chǎn)品晶體管材質(zhì)較上一代并沒(méi)有太大變化,但是在漏電方面的改進(jìn)還是非常顯著的,起初在90nm工藝下采用的應(yīng)變硅技術(shù),在新一代65nm處理器上得到進(jìn)一步發(fā)展,雖然絕緣層還是停留在1.2nm,但是晶體管扭曲提升了15%,這樣的結(jié)果就是漏電減小了4分之一,這樣也使的晶體管的響應(yīng)速度在沒(méi)有功耗提升的情況下提升了近30%,整體表現(xiàn)還是不錯(cuò)的。
● 新的工藝起點(diǎn)—45nm處理器登場(chǎng)目前Intel兩年一更換工藝,在65nm工藝處理器全面上市后,Intel再次提升了CPU的制作工藝,將在本月16號(hào)推出其首款45nm Penryn處理器。全新45nm Penryn家族共有7名成員,包括雙核心桌面處理器Wolfdate、四核心桌面處理器Yorkfield、雙核心行動(dòng)處理器 Penryn、雙核心Xeon DP處理器 Wolfdate DP、四核心 Xeon DP處理器Harpertown、雙核心 Xeon MP處理器Dunnington DC及四核心Xeon MP處理器Dunnington QC。
Intel首款45nm Penryn處理器QX9650
據(jù)了解,Penryn雙核心版本內(nèi)建 4.1 億個(gè)晶體管,四核心則有8.2億個(gè)晶體管,微架構(gòu)經(jīng)強(qiáng)化后,在相同頻率下較上代Core產(chǎn)品擁有更高性能,同時(shí)L 2 Cache容量提升50%,明顯提高數(shù)據(jù)讀取執(zhí)行的速率。此外,亦加入47條全新Intel SSE4指令,提高媒體性能和實(shí)現(xiàn)高性能運(yùn)算應(yīng)用。
CPU-Z下的QX9650
泡泡網(wǎng)近期有幸拿到首批Intel 45nm處理器Penryn QX9650, 其核心頻率3GHz,12MB二級(jí)緩存,F(xiàn)SB 1333MHz,是的絕對(duì)旗艦。接下來(lái)我們將會(huì)與65nmQX6850進(jìn)行對(duì)比測(cè)試。
◎ 測(cè)試平臺(tái)
硬件系統(tǒng)配置 | |
處理器 | Intel QX9650 Intel QX6850 |
ASUS P5E3 DELUXE | |
希捷 7200.10 160G 16M | |
內(nèi)存 | 芝奇 1GB DDR3 1600×2 |
Nvidia 8800 ULTRA 核心: 8800ULTRA(612MHz) 流處理器:1500MHz 顯存: 768 MB GDDR3(1080MHz) | |
電源 | 海韻 S12 600W |
散熱器 | Cooler Master |
軟件系統(tǒng)配置 | |
操作系統(tǒng) | Windows |
顯卡驅(qū)動(dòng) | 163.71_forceware_winxp_32bit_english_whql.exe |
此次測(cè)試我們將采用技術(shù)與實(shí)際結(jié)合的方式,希望讀者們能更直觀的了解QX9650的特性與性能。
● 45nm采用了High-K金屬柵極技術(shù)
此前我們對(duì)CPU工藝進(jìn)程也有簡(jiǎn)短的回顧,細(xì)心的朋友可能會(huì)發(fā)現(xiàn),從90nm工藝開(kāi)始出現(xiàn)了嚴(yán)重的漏電問(wèn)題,阻礙了芯片和個(gè)人計(jì)算機(jī)的設(shè)計(jì)、大小、耗電量、噪聲與成本開(kāi)發(fā)。因此,在新一代45nm Penryn處理器采用全新材料制作的45nm晶體管絕緣層和開(kāi)關(guān)閘極,減低晶體管漏電情況。
其實(shí)晶體管就是一種簡(jiǎn)單的開(kāi)關(guān)裝置,可處理電子數(shù)據(jù)中的0、1組合。處理器就是含有數(shù)百萬(wàn)此類(lèi)通過(guò)銅線以特定方式連接在一起的晶體管。而晶體管內(nèi)部是由源極、漏極、柵電極、柵介質(zhì)、及硅底層通道。源極是指晶體管中電流產(chǎn)生的部分,它包含涂層硅(doped Si),漏極是指晶體管中電流流向的部分,這部分與源極一樣,都參雜了一些雜質(zhì)以降低電阻。不過(guò)晶體管是絕對(duì)對(duì)稱(chēng)的,則電流可以從源極流向漏極,也可以從漏極流向源極。柵極電極就是晶體管頂端的區(qū)域,其電流的狀態(tài)決定晶體管是打開(kāi)還是閉合,傳統(tǒng)上柵的制作材料是多晶硅或原子隨意排列且不形成網(wǎng)格狀結(jié)構(gòu)的硅。柵極介質(zhì)是位于柵極電極以及溝槽之間一層薄層,目前的數(shù)字芯片中晶體管柵介質(zhì)是由二氧化硅組成,而二氧化硅是絕緣體材料,它的作用是隔絕來(lái)自柵極電極的泄漏電流,但如果這個(gè)柵介質(zhì)層太薄其泄漏電流的電量就越大。
為了降低漏電問(wèn)題,同時(shí)還要提高其性能。Intel采用了High-k的新材料制作晶體管閘極電介質(zhì),而且晶體管閘極的電極也搭配了全新的金屬材料。這樣,經(jīng)過(guò)測(cè)試顯示,不僅晶體管的性能提升了,同時(shí)漏電現(xiàn)象與之前相比也較少了5倍。據(jù)了解,制作閘極電介質(zhì)的材料主要是二氧化硅,因?yàn)樗邆淞撕芎玫囊字菩?,能夠減少厚度保持晶體管的整體性能。
由于High-k閘極電介質(zhì)和現(xiàn)有硅閘極并不兼容,Intel全新45nm晶體管設(shè)計(jì)也必須開(kāi)發(fā)新金屬閘極材料,目前新金屬的細(xì)節(jié)仍未有消息透露,Intel現(xiàn)階段尚未說(shuō)明其金屬材料的組合。另與上一代技術(shù)相較,Intel 45nm制程令晶體管密度提升近2倍,得以增加處理器的晶體管總數(shù)或縮小處理器體積,令產(chǎn)品較對(duì)手更具競(jìng)爭(zhēng)力,此外,晶體管開(kāi)關(guān)動(dòng)作所需電力更低,耗電量減少近30%,內(nèi)部連接線采用銅線搭配low-k電介質(zhì),順利提升效能并降低耗電量,開(kāi)關(guān)動(dòng)作速度約加快20%。
值得注意的是,Intel成功令新一代45nm制程產(chǎn)品的漏電情況降低逾5倍,其中晶體管閘極氧化物漏電量更降低超過(guò)10倍,相較上代65nm制程產(chǎn)品,在同一功耗表現(xiàn)下,頻率下可提升約20%,或是在同一頻率下功耗更低,電池續(xù)航力也明顯大幅提升。
從上面的介紹我們可以看出,工藝的改進(jìn)可以讓處理器功耗更低,發(fā)熱量也會(huì)減低,那么為了驗(yàn)證這一觀點(diǎn),我們就是用45nm的QX9650與65nm QX6850進(jìn)行功耗對(duì)比。
詳細(xì)的測(cè)試平臺(tái)前面已介紹過(guò),再此就不重復(fù)
這次測(cè)試功耗我們選用了具備30年研發(fā)經(jīng)驗(yàn)的臺(tái)灣電源品牌,Seasonic(海韻)出品的電源測(cè)試儀:Power Angel。功耗測(cè)試方法非常簡(jiǎn)單,我們對(duì)整套平臺(tái)的功耗進(jìn)行統(tǒng)計(jì)。測(cè)試儀直接通過(guò)實(shí)時(shí)監(jiān)控輸入電源的電壓和電流計(jì)算出當(dāng)前的功率。這其中的功率包括,CPU、主板、內(nèi)存、硬盤(pán)、顯卡、電源以及線路損耗在內(nèi)的主機(jī)總功率。顯示器功率并不計(jì)算在內(nèi)。
海韻Seasonic出品的Power Angel電源測(cè)試儀
◎ 空閑時(shí)功耗對(duì)比
提示:以下成績(jī)左邊為QX9650、右邊為QX6850
空閑時(shí)CPU功耗對(duì)比(點(diǎn)擊可以放大)
電腦空閑時(shí),在整個(gè)平臺(tái)沒(méi)有換的情況下,兩顆處理器功率相差比較大,QX9650要比QX6850低了18W。
◎ 負(fù)載時(shí)功耗對(duì)比
從負(fù)載時(shí)功耗對(duì)比看出,45nm的QX9650表現(xiàn)非常不錯(cuò),比65nm的QX6850功耗低了68W,就算是對(duì)于個(gè)人來(lái)說(shuō)能節(jié)省不少電費(fèi),減少不必要的能源消耗。不僅如此,功耗低證明其發(fā)熱量就小,那么風(fēng)扇轉(zhuǎn)速也可以相對(duì)的調(diào)慢,使得工作的時(shí)候更安靜。因此,45nm的處理器在降低功耗的消耗確實(shí)有明顯的改進(jìn)。
● 新技術(shù)讓Penryn優(yōu)勢(shì)更明顯
除了采用更先進(jìn)的45奈米制程外,Penryn 亦基于Intel Core微架構(gòu)設(shè)計(jì)作出多項(xiàng)改良,稱(chēng)為Enhanced Intel Core Microarchitecture(加強(qiáng)型 Core微架構(gòu)),同時(shí)采用了新的SSE4指令集,并加入了:
Fast Radix-16 Divider(快速 Radix-16 除法器)
Super Shuffle Engine(超級(jí)洗牌引擎)
Split Load Cache Enhancement(增強(qiáng)型緩存拆分負(fù)載)
Improved Store Forwarding(存儲(chǔ)轉(zhuǎn)發(fā))
Faster OS Primitive Support(高速操作系統(tǒng)同步原始支持)
Virtualization Performance Improvements (增強(qiáng)的Intel 虛擬化技術(shù))
Deep Power Down Technology(深度節(jié)能技術(shù))
Enhanced Dynamic Acceleration Technology(增強(qiáng)型動(dòng)態(tài)加速技術(shù))
據(jù)了解,SSE4將分為4.1版本及4.2版本,4.1版本將會(huì)首次出現(xiàn)于Penryn處理器中,共新增47條指令,主要針對(duì)向量繪圖運(yùn)算、3D游戲加速、視像編碼加速及協(xié)同處理加速動(dòng)作,包括:
Penryn SSE4 Instruction summary | ||
Instruction Category | Instructions | Benefits |
Packed DWORD Multiplies | PMULLD, PMULDQ | 提升編譯器矢量運(yùn)算效能 |
Floating Point Dot Product | DPPS, DPPD | 3D立體制作及游戲,支持CG及HLSL等語(yǔ)言 |
Multi-packed sum of absolute diffs& min pos | MPSADBW, PHMINPOSUW | 視頻編碼處理 |
Streaming Load | MOVNTDQA | 視頻編碼處理、繪圖及GPU數(shù)據(jù)分享 |
Floating Point Round | ROUNDPS, ROUNDSS, ROUNDPD, ROUNDSD | 視頻編碼處理 、繪圖、影音處理、2D/3D應(yīng)用、多媒體及游戲等 |
Packed Blending | BLENDPS, BLENDPD, BLENDVPS, BLENDVPD, PBLENDVB, PBLENDDW | 編譯器矢量運(yùn)算及影音處理、多媒體、游戲等應(yīng)用 |
Packed Integer Min and Max | PMINSB, PMAXSB, PMINUW, PMAXUW, PMINUD, PMAXUD, PMINDS, PMAXSD | |
Register Insertion/Extraction | INSERTPS, PINSRB, PINSRD, PINSRQ, EXTRACTPS, PEXTRB, PEXTRD, PEXTRW, PEXTRQ | |
Packed Format Conversion | PMOVSXBW, PMOVZXBW, PMOVSXBD, PMOVZXBD, PMOVSXBQ, PMOVZXBQ, PMOVSXWD, PMOVZXWD, PMOVSXWQ, PMOVZXWQ, PMOVSXDQ, PMOVZXDQ | |
Packed Test & Set | PTEST | |
Packed Compare for Equal | PCMPEQQ | |
Pack DWORD to Unsigned WORD | PACKUSDW |
而Intel資深工程師兼Penryn微架構(gòu)主管Stephen Fischer表示,與上代處理器產(chǎn)品相比,Penryn處理器在繪圖效能約超過(guò)15%、視訊編碼平均可提高20%、3D內(nèi)容制作可提高逾30%,3D游戲效能更可高達(dá)40%,視乎軟件設(shè)計(jì)而定。
● 技術(shù)測(cè)試結(jié)合:浮點(diǎn)和整數(shù)的除法運(yùn)算速度增加◎ Enhanced Core MA :Fast Radix-16 Divider
Penryn處理器除沿襲Core微架構(gòu)的優(yōu)點(diǎn)外,并進(jìn)一步改良除法器的設(shè)計(jì),在科學(xué)計(jì)算、三維坐標(biāo)轉(zhuǎn)換和其它數(shù)學(xué)運(yùn)算密集型功能中,其帶來(lái)約2倍的除法器速度,所包含的新一代的快速除法技術(shù)稱(chēng)為Radix-16,可加速浮點(diǎn)和整數(shù)的除法運(yùn)算速度。
其實(shí)Intel在Core微架構(gòu)中支持每個(gè)周期可處理多達(dá)4個(gè)指令(對(duì)比舊有處理器最多只能同時(shí)處理3個(gè)指令),且重新采用較高效率的14層Pipeline Stages,為提升分支預(yù)測(cè)的能力及準(zhǔn)確性,Branch Predictor的Bandwitdh提升至20Byte (K8、Banias 為16B,Netburst為4B),令指令執(zhí)行效率大大提高。
此外,Core微架構(gòu)更加入Macro-Fusion技術(shù),可把部份指令組合成單一Micro-Op 指令,令特定情況下每個(gè)周期可執(zhí)行5個(gè)指令,更保留Micro-op Fusion技術(shù),把相同的Macro-ops混合成單一個(gè)Micro-ops 透過(guò)Out-of-order邏輯可減少10% 的Micro-op指令執(zhí)行數(shù),除提升核心的執(zhí)行效率,同時(shí)也保持高能源效益。
據(jù)了解,基數(shù)為4的算法會(huì)在每次迭代運(yùn)算中計(jì)算其2位的商值,當(dāng)提高到基數(shù)為16的算法時(shí),則允許在每次迭代中計(jì)算4位的商值,進(jìn)而使延遲縮減一半。
◎ 實(shí)測(cè)SiSoftware Processor Arithmetic
從實(shí)際的測(cè)試中看出,Dhrystone和Whetstone是Processor(s) Arithmetic測(cè)試項(xiàng)目中的整數(shù)以及浮點(diǎn)運(yùn)算,用最終成績(jī)來(lái)評(píng)定一款處理器性能。新的Penryn QX9650與QX6850相比,在整數(shù)以及浮點(diǎn)運(yùn)算上QX9650分別提高了2.4%與12.6%。
● 技術(shù)測(cè)試結(jié)合:音效、視訊編碼效率得到提高
◎ Penryn :SSE4指令集強(qiáng)化視訊編碼效率
SSE4指令集進(jìn)一步強(qiáng)訊編碼效果,例如可同時(shí)處理8個(gè)4-byte寬度的SAD(Sums of Absolute Differences)運(yùn)算,常用于新一代高清影像編碼如VC.1及H.264等規(guī)格中,令視頻編碼速度進(jìn)一步提升。
◎ Super Shuffle Engine
Intel在Core微架構(gòu)中加入128Bit-SIMD interger arithmetic及128bit SIMD雙倍精準(zhǔn)度Floating-Point Operations單元。舊有的處理器執(zhí)行128Bit的SSE、SSE2及SSE3指令時(shí),需要把指令分拆為2個(gè)64Bit指令,在2個(gè)頻率周期完成,但Core微架構(gòu)則只需要1個(gè)頻率周期便能完成,執(zhí)行效率提升達(dá)1倍,現(xiàn)時(shí)SSE指令集已普遍使用于主流軟件中,包括繪圖、影像、音效、加密、數(shù)學(xué)運(yùn)算等用途,單周期128Bit處理器能力利用頻率以外的方法提升效能。
另一方面,Penryn處理器也有顯著改良,其加入全新Super Shuffle Engine,令SSE 指令運(yùn)算更具效率,以往處理Unpacking、Packing、Align Concatenated Sources、Wide Shifts、Insertion及Horizontal Arithmetic Functions Setup等128Bit寬度的字節(jié)、字及Dword SSE數(shù)據(jù)時(shí),均無(wú)法在單一周期內(nèi)完成,但Super Shuffle Engine設(shè)計(jì)除可讓這些不同性質(zhì)的128Bit SSE指令,在1個(gè)周期內(nèi)便可完成,減低延遲及吞吐量外,更不用在軟件端中作出改良即可實(shí)現(xiàn)。
◎ 音頻、視頻編碼測(cè)試
以上兩款測(cè)試是針對(duì)音頻、視頻的轉(zhuǎn)碼速度測(cè)試,在固定的文件下進(jìn)行轉(zhuǎn)碼,耗時(shí)多少,用的時(shí)間越短證明性能越好。因?yàn)镼X9650新增了多種技術(shù),因此成績(jī)比QX6850高出不少。
據(jù)了解,SSE4將分為4.1版本及4.2版本,4.1版本將會(huì)首次出現(xiàn)于Penryn處理器中,共新增47條指令,主要針對(duì)向量繪圖運(yùn)算、3D游戲加速、視像編碼加速及協(xié)同處理加速動(dòng)作,包括:
Penryn SSE4 Instruction summary | ||
Instruction Category | Instructions | Benefits |
Packed DWORD Multiplies | PMULLD, PMULDQ | 提升編譯器矢量運(yùn)算效能 |
Floating Point Dot Product | DPPS, DPPD | 3D立體制作及游戲,支持CG及HLSL等語(yǔ)言 |
Multi-packed sum of absolute diffs& min pos | MPSADBW, PHMINPOSUW | 視頻編碼處理 |
Streaming Load | MOVNTDQA | 視頻編碼處理、繪圖及GPU數(shù)據(jù)分享 |
Floating Point Round | ROUNDPS, ROUNDSS, ROUNDPD, ROUNDSD | 視頻編碼處理 、繪圖、影音處理、2D/3D應(yīng)用、多媒體及游戲等 |
Packed Blending | BLENDPS, BLENDPD, BLENDVPS, BLENDVPD, PBLENDVB, PBLENDDW | 編譯器矢量運(yùn)算及影音處理、多媒體、游戲等應(yīng)用 |
Packed Integer Min and Max | PMINSB, PMAXSB, PMINUW, PMAXUW, PMINUD, PMAXUD, PMINDS, PMAXSD | |
Register Insertion/Extraction | INSERTPS, PINSRB, PINSRD, PINSRQ, EXTRACTPS, PEXTRB, PEXTRD, PEXTRW, PEXTRQ | |
Packed Format Conversion | PMOVSXBW, PMOVZXBW, PMOVSXBD, PMOVZXBD, PMOVSXBQ, PMOVZXBQ, PMOVSXWD, PMOVZXWD, PMOVSXWQ, PMOVZXWQ, PMOVSXDQ, PMOVZXDQ | |
Packed Test & Set | PTEST | |
Packed Compare for Equal | PCMPEQQ | |
Pack DWORD to Unsigned WORD | PACKUSDW |
● SSE4 :向量、浮點(diǎn)運(yùn)算專(zhuān)門(mén)化 加入串流式負(fù)載指令
在應(yīng)用SSE4指令集后,Penryn增加了2個(gè)不同的32Bit向量整數(shù)乘法運(yùn)算支持,引入了8 位無(wú)符號(hào) (Unsigned)最小值及最大值運(yùn)算,以及16Bit 及32Bit 有符號(hào) (Signed) 及無(wú)符號(hào)運(yùn)算,并有效地改善編譯器效率及提高向量化整數(shù)及單精度代碼的運(yùn)算能力。同時(shí),SSE4 改良插入、提取、尋找、離散、跨步負(fù)載及存儲(chǔ)等動(dòng)作,令向量運(yùn)算進(jìn)一步專(zhuān)門(mén)化。
SSE4加入了6條浮點(diǎn)型點(diǎn)積運(yùn)算指令,支持單精度、雙精度浮點(diǎn)運(yùn)算及浮點(diǎn)產(chǎn)生操作,且IEEE 754指令 (Nearest, -Inf, +Inf, and Truncate) 可立即轉(zhuǎn)換其路徑模式,大大減少延誤,這些改變將對(duì)游戲及 3D 內(nèi)容制作應(yīng)用有重要意義。
此外,SSE4加入串流式負(fù)載指令,可提高以圖形幀緩沖區(qū)的讀取數(shù)據(jù)頻寬,理論上可獲取完整的快取緩存行,即每次讀取64Bit而非8Bit,并可保持在臨時(shí)緩沖區(qū)內(nèi),讓指令最多可帶來(lái)8倍的讀取頻寬效能提升,對(duì)于視訊處理、成像以及圖形處理器與中央處理器之間的共享數(shù)據(jù)應(yīng)用,有著明顯的效能提升。
◎ 實(shí)測(cè)SiSoftware Processor Multi-Media
從測(cè)試結(jié)果看,多媒體運(yùn)算能力上QX9650只比QX6850高出一點(diǎn),優(yōu)勢(shì)不是很明顯,普通消費(fèi)者在使用時(shí)并不能體會(huì)出區(qū)別,只能使用專(zhuān)門(mén)軟件才能區(qū)別開(kāi)。
◎ Cinebench圖形渲染測(cè)試
CINEBENCH RELEASE 10主要考察處理器在進(jìn)行圖形渲染任務(wù)時(shí)的性能,并且支持多線程的軟件。此次測(cè)試中QX9650比QX6850提高9%,顯示出新款45nm處理器擁有超強(qiáng)的圖像處理器能力
◎ CPUMark99測(cè)試
CPUMark 99是最原始的CPU性能測(cè)試軟件,對(duì)主頻、外頻和二級(jí)緩存容量都比較敏感。而在這個(gè)傳統(tǒng)的測(cè)試項(xiàng)目中,QX9650以8分的優(yōu)勢(shì)勝出。
◎ SuperPI 測(cè)試
◎ WinRAR 3.60文件壓縮性能測(cè)試
這次使用目前最流行的WinRAR壓縮軟件來(lái)進(jìn)行數(shù)據(jù)壓縮測(cè)試,其3.60版本之后加入了對(duì)多線程的支持。新款QX9650由于在運(yùn)算能力上的出色表現(xiàn),使其在數(shù)據(jù)壓縮測(cè)試中高出QX6850 14%的壓縮能力。
◎ EVEREST Ultimate Edition
測(cè)試小結(jié):總的來(lái)說(shuō),在實(shí)際應(yīng)用測(cè)試中,各個(gè)項(xiàng)目的成績(jī)變化還是蠻大的。特別是數(shù)據(jù)壓縮與內(nèi)存讀寫(xiě)速度測(cè)試上,QX9650都以較大的優(yōu)勢(shì)勝出。
◎ 3D Mark03:
3DMark03引入了畫(huà)質(zhì)過(guò)濾測(cè)試,并且提供了紋理過(guò)濾的選項(xiàng),提供了并非默認(rèn)的FSAA抗鋸齒選項(xiàng)。3DMark03受到處理器、內(nèi)存和主板的影響更小,并且專(zhuān)注于顯示卡著色能力的測(cè)試,顯示卡的效能高低將成為3DMark03得分的主要瓶頸。
◎ 3D Mark05:
Dmark05一共使用三個(gè)游戲進(jìn)行測(cè)試,Game1測(cè)試的舞臺(tái)是一個(gè)未來(lái)太空基地,主體動(dòng)態(tài)光影采用了高達(dá)2048x2048的紋理,因此對(duì)于顯卡的像素填充率以及顯存帶寬有著很高的要求。
◎ 3D Mark06:
測(cè)試小結(jié):游戲理論性測(cè)試部分,QX9650與QX6850在成績(jī)總分上并沒(méi)有太大的區(qū)別,因?yàn)樗麄冎苯訕?gòu)架都相同,同時(shí)頻率之類(lèi)的區(qū)別也不大,但是由于QX9650加入新的指令集,因此在CPU運(yùn)算成績(jī)上要高出一些。
◎ Crytek
◎ Company of Heros
◎ COJ
◎ Half-Life2——EPISOOE TWO
◎ Farcry
游戲測(cè)試總結(jié):實(shí)際游戲測(cè)試中,我們都把畫(huà)質(zhì)開(kāi)到最高下進(jìn)行測(cè)試。從一些DX10的游戲測(cè)試上看,這兩款處理器的差距并不大,只有1至2幀的差距。而在一些DX9游戲測(cè)試中,差距就很明顯,比如Half-Life2—EPISOOE TWO QX9650比QX6850提升8%。
◎ 45nm新工藝讓處理器功耗降得更低
目前從整個(gè)DIY行業(yè)來(lái)說(shuō),大家都在提倡節(jié)能環(huán)保的原則。那么,對(duì)于電腦中的核心——CPU來(lái)說(shuō)當(dāng)然也不例外,低功耗的CPU將成為未來(lái)處理器市場(chǎng)的主流,因此采用最新工藝,最新架構(gòu)和最新的節(jié)能技術(shù)的CPU,都是廠商追求的目標(biāo),因?yàn)橹挥羞@些新技術(shù)可以確保高性能低能耗技術(shù)的實(shí)現(xiàn)。而Intel 45nm處理器的出現(xiàn)正是順應(yīng)了追求低功耗時(shí)代的產(chǎn)品。
從前面的功耗測(cè)試中我們就有深刻的體會(huì),在平臺(tái)相同、處理器滿負(fù)載的情況下,45nm處理器比65nm處理器的平臺(tái)低了68W,這個(gè)數(shù)值是相當(dāng)可觀的,如果是普通消費(fèi)者使用那么一天就能節(jié)省1.6度電(如果是多人使用,那么節(jié)省的能源就相當(dāng)可觀了)。
◎ 臺(tái)式機(jī):45nm的QX9650打敗市場(chǎng)最高性能產(chǎn)品
PCPOP.COM泡泡網(wǎng)CPU評(píng)測(cè)室 測(cè)試時(shí)間: | ||||
測(cè)試項(xiàng)目 | Intel Core 2 QX 9650 | Intel Core 2 QX 6850 | 提升幅度 | |
8800Ultra 1024x768 | ||||
理論性測(cè)試 | ||||
Processor Arithmetic | Dhrstone | 56013 | 54626 | 2.4% |
Whetstone | 41276 | 36042 | 12.6% | |
Processor Multi-Media | Integer | 332689 | 332229 | 將近0% |
Fioating | 173356 | 173153 | 將近0% | |
Memory Bandwidth | Int AUU | 7264 | 6896 | 5% |
Float FPU | 7118 | 6762 | 5% | |
PCMark | 9652 | 9632 | 將近0% | |
3D理論性測(cè)試 | ||||
3DMark | Overall | 43850 | 42835 | 2.3% |
CPU項(xiàng) | 2345 | 2201 | 6% | |
3DMark | Overall | 18342 | 18192 | 將近0% |
CPU項(xiàng) | 20873 | 19895 | 4.6% | |
3DMark | Overall | 13548 | 13533 | 將近0% |
4428 | 4420 | 將近0% | ||
實(shí)際應(yīng)用測(cè)試 | ||||
SuperPI | 15.37 | 17.67 | 13% | |
WinRAR 3.60文件壓縮性能 | 1937 | 1654 | 14.6% | |
Cinebench圖形渲染 | 11759 | 10676 | 9.2% | |
視頻編碼測(cè)試 | 44秒 | 47秒 | 6.3% | |
音頻編碼測(cè)試 | 單線程 | 171秒 | 183秒 | 6.5% |
多線程 | 108秒 | 117秒 | 7.6% | |
EVEREST Ultimate | 內(nèi)存寫(xiě)入速度 | 8578 | 8388 | 2.2% |
內(nèi)存讀取速度 | 7103 | 6094 | 14.2% | |
實(shí)際游戲測(cè)試 | ||||
Crytek | 26.5 | 25.13 | 5.1% | |
Company of Heros DX10 | 57.6 | 56.2 | 2.4% | |
Half-Life2 EPISOOE TWO | 185.4 | 169.29 | 8.6% | |
COJ | 31 | 30.9 | 將近0% | |
Farcry | 182.8 | 179.86 | 1.6% |
市場(chǎng)上,規(guī)格、性能最高的就屬Q(mào)X6850,但是45nm的QX9650的出現(xiàn)將會(huì)替代其性能第一的霸主地位。從測(cè)試結(jié)果看,不管是功耗、處理器運(yùn)算性能、游戲測(cè)試等方面QX9650都要高于65nm的QX6850??梢哉f(shuō)Intel Penryn處理器的出現(xiàn)將繼續(xù)穩(wěn)坐最高性能處理器的寶座。
◎ 筆記本:性能更高,功耗更低
Penryn移動(dòng)版還會(huì)加入兩項(xiàng)新穎的省電技術(shù)——C6 State和EDAT。C6 State可讓筆記本處理器的功耗在空閑狀態(tài)下降到非常低的水平,核心電壓也會(huì)根據(jù)情況大大降低,同時(shí)緩存徹底轉(zhuǎn)移其中的數(shù)據(jù)并完全關(guān)閉。從這種狀態(tài)中恢復(fù)需要一點(diǎn)點(diǎn)時(shí)間,而且會(huì)對(duì)性能產(chǎn)生一定的影響,但對(duì)筆記本用戶來(lái)說(shuō),電池續(xù)航時(shí)間的重要性顯然更大。EDAT可以單獨(dú)提高某個(gè)處理核心的頻率,并將其他暫時(shí)不使用的核心關(guān)閉,以適應(yīng)單線程任務(wù)或者只能利用一個(gè)核心的多線程任務(wù)。
可以說(shuō)Intel 45nm處理器面對(duì)著AMD全新K10微架構(gòu)來(lái)襲,單純以微架構(gòu)而論或許在效能表現(xiàn)略有不及,但由于擁有更為先進(jìn)制程、核心頻率及成本等優(yōu)勢(shì),整體而言,AMD K10未必能占得上風(fēng),還是讓我們共同把目光聚焦在第四季度,期待這場(chǎng)具有劃時(shí)代意義的大戰(zhàn)。<
關(guān)注我們
