国产成人福利在线视频播放下载,成人无码www免费视频在线看,放荡的美妇在线播放,大地资源网最新更新,国产成人精品日本亚洲网站

泡泡網(wǎng)CPU頻道 PCPOP首頁(yè)      /      CPU     /      評(píng)測(cè)    /    正文

英特爾45nm新旗艦四核QX9650解析測(cè)試

    Intel在去年7月末發(fā)布了酷睿2系列處理器,憑借全新的架構(gòu),酷睿2處理器將系統(tǒng)性能推上了一個(gè)新的高度,并且其優(yōu)秀的超頻性能,也讓無(wú)數(shù)DIY玩家為之瘋狂。酷睿2的發(fā)布使得Intel在中高端處理器部分,占有比較大的優(yōu)勢(shì)。近期,Intel將要再次把這個(gè)優(yōu)勢(shì)延續(xù)下去,本月14號(hào)Intel將要推出其Penryn處理器,這是一款比起Core架構(gòu)有更多的改進(jìn),其高端處理器主頻將大幅提升至3.0GHz以上的產(chǎn)品。

{imageTitle}

    首批45nm Penryn分為三個(gè)系列:至尊四核心的Core 2 Extreme QX9050、主流四核心的Core 2 Quad Q9000、雙核心的Core 2 Duo E8000。

{imageTitle}

    而2008年1月,“Core 2 Quad Q9550、Q9450、Q9300”三款主流四核心跟進(jìn),主頻2.83GHz、2.66GHz和2.50GHz,二級(jí)緩存前兩款2×6MB、后一款2×3MB(注意編號(hào)第三位5和0的不同),熱設(shè)計(jì)功耗均為95W。另外,同月發(fā)布的還有“Core 2 Duo E8500、E8400、E8300、E8200”四款主流雙核心面世,主頻3.16GHz、3.00GHz、2.83GHz和2.66GHz,二級(jí)緩存均為2×3MB,熱設(shè)計(jì)功耗都是65W。

    這些產(chǎn)品都采用了45nm工藝, 這使得Intel每年推出具增強(qiáng)微架構(gòu)或全新微架構(gòu)處理器產(chǎn)品的承諾順利兌現(xiàn),其不僅僅是單純制程提升,更重要的是,微架構(gòu)設(shè)計(jì)經(jīng)全力改良后,性能更較當(dāng)年Intel P4 Willamette提升至Northwood核心,有過(guò)之而無(wú)不及,同時(shí)使功耗更低。下面我們就來(lái)全面了解45nm的Penryn會(huì)帶給我們?cè)鯓拥捏@喜。

● 45nm出現(xiàn)是晶體管誕生60歲最好的禮物

    自1947年晶體管發(fā)明迄今,科技進(jìn)步的速度驚人,催生了功能更為先進(jìn)強(qiáng)大,又能兼顧成本效益和耗電量的產(chǎn)品。雖然科技進(jìn)展迅速,但晶體管產(chǎn)生的廢熱和漏電,仍是縮小設(shè)計(jì)及延續(xù)摩爾定律 (Moore''s Law) 的最大障礙,因此業(yè)界必須以新材料取代過(guò)去40年來(lái)制作晶體管的材料。

{imageTitle}
今年是晶體管誕生60周年

    翻查晶體管歷史,2007年正好是晶體管誕生60周年,首顆晶體管出現(xiàn)于1947年12月16日,貝爾實(shí)驗(yàn)室 (Bell Labs)的William Shockley、John Bardeen和Walter Brattain成功制作第一個(gè)晶體管,改變了人類(lèi)的歷史。那么,在這60周年的今天,Intel公司首次推出45nm工藝處理器,作為晶體管60周歲最好的禮物。

{imageTitle}
摩爾定律之父——戈登摩爾

    這其中我們要感謝一個(gè)人,那就是Intel的創(chuàng)始人戈登摩爾(Gordon Moore),通過(guò)長(zhǎng)期的對(duì)比,研究后發(fā)現(xiàn):CPU中的部件(我們現(xiàn)在所說(shuō)的晶體管)在不斷增加,其價(jià)格也在不斷下降。“隨著單位成本的降低以及單個(gè)集成電路集成的晶體管數(shù)量的增加;到1975年,從經(jīng)濟(jì)學(xué)來(lái)分析,單個(gè)集成電路應(yīng)該集成65000個(gè)晶體管。”Intel此后幾年的發(fā)展都被摩爾提前算在了紙上,使人們大為驚奇,“摩爾定律”也名聲大振。為了讓人們更直觀地了解摩爾定律,摩爾及其同事總結(jié)出一句極為精練的公式 “集成電路所包含的晶體管每18個(gè)月就會(huì)翻一番”。

    之后的芯片內(nèi)集成的晶體管數(shù)量也證實(shí)了他的這句話,并且發(fā)展速度還在加快。從芯片制造工藝來(lái)看,在1965年推出的10微米(μm)處理器后,經(jīng)歷了6微米、3微米、1微米、0.5微米、0.35微米、0.25微米、0.18微米、0.13微米、0.09微米、0.065微米,而0.045微米的制造工藝將是目前CPU的最高工藝。以下我們就來(lái)簡(jiǎn)單的見(jiàn)證一下Intel CPU工藝制程一路走來(lái)的風(fēng)雨歷程。

● 90nm的出現(xiàn)是CPU工藝一個(gè)質(zhì)的飛躍

    奇怪的是每當(dāng)新一代CPU問(wèn)世時(shí),人們都會(huì)熱衷于討論它采用了多少微米或納米制程。的確,每一次制程(或制造工藝)的進(jìn)步都會(huì)對(duì)芯片制造業(yè)產(chǎn)生舉足輕重的影響,并演繹一個(gè)個(gè)經(jīng)典的傳奇。


Pentium讓CPU工藝從微米時(shí)代跨入了納米

    按照摩爾老先生在文章中提出,芯片上集成的晶體管數(shù)量大約每18個(gè)月就將翻一番。從1971年Intel發(fā)布第一款處理器4004時(shí),所采用的工藝是10微米,芯片內(nèi)僅包含著2300多個(gè)晶體管,主頻也非常的低。直到1995年奔騰處理器發(fā)布后,CPU的制造工藝才首次采用納米工藝表示,第一代奔騰處理器采用的是800nm工藝,同時(shí)也標(biāo)志著CPU制造工藝從微米時(shí)代跨入了納米時(shí)代。奔騰處理器芯片內(nèi)的晶體管數(shù)量為310萬(wàn)個(gè),主頻也有所提升,此時(shí)CPU的速度也有大幅的提升。


奔騰4E將CPU工藝帶入了90nm時(shí)代

    之后CPU工藝就開(kāi)始飛速的發(fā)展,芯片內(nèi)集成的集體管數(shù)量不斷的翻倍。到2004年。CPU制作工藝發(fā)生了質(zhì)的飛躍,推出了核心為Prescott的Pentium 4E處理器,在此次推出的Pentium 4E處理器中,一個(gè)顯著的特點(diǎn)就工藝再次改進(jìn)為90nm,集成了1億個(gè)晶體管。其中首批90nm處理器型號(hào)為3.40E GHz、3.20E GHz、3.00E GHz、2.80E GHz P4(“E”后綴商標(biāo))支持超線程技術(shù),800MHz前端總線和1MB二級(jí)緩存; 但此次工藝的提升,沒(méi)有使得功耗降低,因?yàn)橹黝l的提升,使得Prescott處理器功耗開(kāi)始走高。

    此時(shí),Intel推出90nm處理器后,并且在最短的時(shí)間內(nèi)宣布全面進(jìn)入90nm時(shí)代。而AMD在工藝制程方面比英特爾顯然慢了一大步,因此,在2004年,AMD和英特爾在制造工藝上的距離已經(jīng)拉開(kāi)。

● 工藝再提升 勢(shì)不可擋的65nm制作工藝

    但隨著芯片中晶體管數(shù)量增加,原本僅數(shù)個(gè)原子層厚的二氧化硅絕緣層會(huì)變得更薄進(jìn)而導(dǎo)致泄漏更多電流,隨后泄漏的電流又增加了芯片額外的功耗。此時(shí),由于受“泄漏電流”的影響,導(dǎo)致后續(xù)產(chǎn)品頻率無(wú)法提升,功耗高居不下。為了從當(dāng)前的窘境中逃出來(lái),Intel迅速部署65nm產(chǎn)品計(jì)劃。迅速在2005年推出了Pentium Extreme Edition 955,標(biāo)志著Intel進(jìn)入一個(gè)新的階段,65nm時(shí)代的來(lái)臨。

    Pentium Extreme Edition 955處理器基于65nm工藝,是整個(gè)Pentium D 900系列雙核心產(chǎn)品中最高端的一款。

The Intel Pentium Extreme Edition 955 with 376 million transistors.

 Pentium Extreme Edition 955

    盡管新品均采用65nm工藝制造,但其TDP(Thermal Design Power)依然為130W。工作電壓需要從1.2v到1.375V,機(jī)箱內(nèi)部溫度不能夠超過(guò)68.6度。不過(guò),Preslers無(wú)論在制造工藝還是架構(gòu)變革方面都有了非常大改進(jìn),包括獨(dú)立的雙L2 Cache設(shè)計(jì),以及制造工藝較90nm產(chǎn)品有了非常大的改觀。

  雖然這一代產(chǎn)品晶體管材質(zhì)較上一代并沒(méi)有太大變化,但是在漏電方面的改進(jìn)還是非常顯著的,起初在90nm工藝下采用的應(yīng)變硅技術(shù),在新一代65nm處理器上得到進(jìn)一步發(fā)展,雖然絕緣層還是停留在1.2nm,但是晶體管扭曲提升了15%,這樣的結(jié)果就是漏電減小了4分之一,這樣也使的晶體管的響應(yīng)速度在沒(méi)有功耗提升的情況下提升了近30%,整體表現(xiàn)還是不錯(cuò)的。

● 新的工藝起點(diǎn)—45nm處理器登場(chǎng)

    目前Intel兩年一更換工藝,在65nm工藝處理器全面上市后,Intel再次提升了CPU的制作工藝,將在本月16號(hào)推出其首款45nm Penryn處理器。全新45nm Penryn家族共有7名成員,包括雙核心桌面處理器Wolfdate、四核心桌面處理器Yorkfield、雙核心行動(dòng)處理器 Penryn、雙核心Xeon DP處理器 Wolfdate DP、四核心 Xeon DP處理器Harpertown、雙核心 Xeon MP處理器Dunnington DC及四核心Xeon MP處理器Dunnington QC。

45nm Penryn樣品全面勝于65nm Conroe
Intel首款45nm Penryn處理器QX9650

    據(jù)了解,Penryn雙核心版本內(nèi)建 4.1 億個(gè)晶體管,四核心則有8.2億個(gè)晶體管,微架構(gòu)經(jīng)強(qiáng)化后,在相同頻率下較上代Core產(chǎn)品擁有更高性能,同時(shí)L 2 Cache容量提升50%,明顯提高數(shù)據(jù)讀取執(zhí)行的速率。此外,亦加入47條全新Intel SSE4指令,提高媒體性能和實(shí)現(xiàn)高性能運(yùn)算應(yīng)用。

{imageTitle}
CPU-Z下的QX9650

    泡泡網(wǎng)近期有幸拿到首批Intel 45nm處理器Penryn QX9650,  其核心頻率3GHz,12MB二級(jí)緩存,F(xiàn)SB 1333MHz,是的絕對(duì)旗艦。接下來(lái)我們將會(huì)與65nmQX6850進(jìn)行對(duì)比測(cè)試。

{imageTitle}
左邊為QX9650,右邊為QX6850

◎ 測(cè)試平臺(tái)

硬件系統(tǒng)配置

處理器

Intel QX9650

Intel QX6850

主板

ASUS P5E3 DELUXE

硬盤(pán)

希捷 7200.10  160G 16M

內(nèi)存

芝奇 1GB DDR3 1600×2

顯卡

Nvidia 8800 ULTRA

核心: 8800ULTRA612MHz

流處理器:1500MHz

顯存: 768 MB GDDR31080MHz

電源

海韻 S12 600W

散熱器

Cooler Master

軟件系統(tǒng)配置

操作系統(tǒng)

Windows Vista Ultimate Edition

顯卡驅(qū)動(dòng)

163.71_forceware_winxp_32bit_english_whql.exe

    此次測(cè)試我們將采用技術(shù)與實(shí)際結(jié)合的方式,希望讀者們能更直觀的了解QX9650的特性與性能。

● 45nm采用了High-K金屬柵極技術(shù)

    此前我們對(duì)CPU工藝進(jìn)程也有簡(jiǎn)短的回顧,細(xì)心的朋友可能會(huì)發(fā)現(xiàn),從90nm工藝開(kāi)始出現(xiàn)了嚴(yán)重的漏電問(wèn)題,阻礙了芯片和個(gè)人計(jì)算機(jī)的設(shè)計(jì)、大小、耗電量、噪聲與成本開(kāi)發(fā)。因此,在新一代45nm Penryn處理器采用全新材料制作的45nm晶體管絕緣層和開(kāi)關(guān)閘極,減低晶體管漏電情況。

{imageTitle}

    其實(shí)晶體管就是一種簡(jiǎn)單的開(kāi)關(guān)裝置,可處理電子數(shù)據(jù)中的0、1組合。處理器就是含有數(shù)百萬(wàn)此類(lèi)通過(guò)銅線以特定方式連接在一起的晶體管。而晶體管內(nèi)部是由源極、漏極、柵電極、柵介質(zhì)、及硅底層通道。源極是指晶體管中電流產(chǎn)生的部分,它包含涂層硅(doped Si),漏極是指晶體管中電流流向的部分,這部分與源極一樣,都參雜了一些雜質(zhì)以降低電阻。不過(guò)晶體管是絕對(duì)對(duì)稱(chēng)的,則電流可以從源極流向漏極,也可以從漏極流向源極。柵極電極就是晶體管頂端的區(qū)域,其電流的狀態(tài)決定晶體管是打開(kāi)還是閉合,傳統(tǒng)上柵的制作材料是多晶硅或原子隨意排列且不形成網(wǎng)格狀結(jié)構(gòu)的硅。柵極介質(zhì)是位于柵極電極以及溝槽之間一層薄層,目前的數(shù)字芯片中晶體管柵介質(zhì)是由二氧化硅組成,而二氧化硅是絕緣體材料,它的作用是隔絕來(lái)自柵極電極的泄漏電流,但如果這個(gè)柵介質(zhì)層太薄其泄漏電流的電量就越大。

{imageTitle}

    為了降低漏電問(wèn)題,同時(shí)還要提高其性能。Intel采用了High-k的新材料制作晶體管閘極電介質(zhì),而且晶體管閘極的電極也搭配了全新的金屬材料。這樣,經(jīng)過(guò)測(cè)試顯示,不僅晶體管的性能提升了,同時(shí)漏電現(xiàn)象與之前相比也較少了5倍。據(jù)了解,制作閘極電介質(zhì)的材料主要是二氧化硅,因?yàn)樗邆淞撕芎玫囊字菩?,能夠減少厚度保持晶體管的整體性能。

    由于High-k閘極電介質(zhì)和現(xiàn)有硅閘極并不兼容,Intel全新45nm晶體管設(shè)計(jì)也必須開(kāi)發(fā)新金屬閘極材料,目前新金屬的細(xì)節(jié)仍未有消息透露,Intel現(xiàn)階段尚未說(shuō)明其金屬材料的組合。另與上一代技術(shù)相較,Intel 45nm制程令晶體管密度提升近2倍,得以增加處理器的晶體管總數(shù)或縮小處理器體積,令產(chǎn)品較對(duì)手更具競(jìng)爭(zhēng)力,此外,晶體管開(kāi)關(guān)動(dòng)作所需電力更低,耗電量減少近30%,內(nèi)部連接線采用銅線搭配low-k電介質(zhì),順利提升效能并降低耗電量,開(kāi)關(guān)動(dòng)作速度約加快20%。

    值得注意的是,Intel成功令新一代45nm制程產(chǎn)品的漏電情況降低逾5倍,其中晶體管閘極氧化物漏電量更降低超過(guò)10倍,相較上代65nm制程產(chǎn)品,在同一功耗表現(xiàn)下,頻率下可提升約20%,或是在同一頻率下功耗更低,電池續(xù)航力也明顯大幅提升。

   從上面的介紹我們可以看出,工藝的改進(jìn)可以讓處理器功耗更低,發(fā)熱量也會(huì)減低,那么為了驗(yàn)證這一觀點(diǎn),我們就是用45nm的QX9650與65nm QX6850進(jìn)行功耗對(duì)比。

{imageTitle}
詳細(xì)的測(cè)試平臺(tái)前面已介紹過(guò),再此就不重復(fù)

    這次測(cè)試功耗我們選用了具備30年研發(fā)經(jīng)驗(yàn)的臺(tái)灣電源品牌,Seasonic(海韻)出品的電源測(cè)試儀:Power Angel。功耗測(cè)試方法非常簡(jiǎn)單,我們對(duì)整套平臺(tái)的功耗進(jìn)行統(tǒng)計(jì)。測(cè)試儀直接通過(guò)實(shí)時(shí)監(jiān)控輸入電源的電壓和電流計(jì)算出當(dāng)前的功率。這其中的功率包括,CPU、主板、內(nèi)存、硬盤(pán)、顯卡、電源以及線路損耗在內(nèi)的主機(jī)總功率。顯示器功率并不計(jì)算在內(nèi)。

{imageTitle}
海韻Seasonic出品的Power Angel電源測(cè)試儀

◎ 空閑時(shí)功耗對(duì)比

提示:以下成績(jī)左邊為QX9650、右邊為QX6850

{imageTitle}    {imageTitle}
空閑時(shí)CPU功耗對(duì)比(點(diǎn)擊可以放大)

    電腦空閑時(shí),在整個(gè)平臺(tái)沒(méi)有換的情況下,兩顆處理器功率相差比較大,QX9650要比QX6850低了18W。

◎ 負(fù)載時(shí)功耗對(duì)比

{imageTitle}    {imageTitle}
負(fù)載時(shí)功耗對(duì)比

    從負(fù)載時(shí)功耗對(duì)比看出,45nm的QX9650表現(xiàn)非常不錯(cuò),比65nm的QX6850功耗低了68W,就算是對(duì)于個(gè)人來(lái)說(shuō)能節(jié)省不少電費(fèi),減少不必要的能源消耗。不僅如此,功耗低證明其發(fā)熱量就小,那么風(fēng)扇轉(zhuǎn)速也可以相對(duì)的調(diào)慢,使得工作的時(shí)候更安靜。因此,45nm的處理器在降低功耗的消耗確實(shí)有明顯的改進(jìn)。

● 新技術(shù)讓Penryn優(yōu)勢(shì)更明顯

     除了采用更先進(jìn)的45奈米制程外,Penryn 亦基于Intel Core微架構(gòu)設(shè)計(jì)作出多項(xiàng)改良,稱(chēng)為Enhanced Intel Core Microarchitecture(加強(qiáng)型 Core微架構(gòu)),同時(shí)采用了新的SSE4指令集,并加入了:

    Fast Radix-16 Divider(快速 Radix-16 除法器)
    Super Shuffle Engine(超級(jí)洗牌引擎)
    Split Load Cache Enhancement(增強(qiáng)型緩存拆分負(fù)載)
    Improved Store Forwarding(存儲(chǔ)轉(zhuǎn)發(fā))
    Faster OS Primitive Support(高速操作系統(tǒng)同步原始支持)
    Virtualization Performance Improvements (增強(qiáng)的Intel 虛擬化技術(shù))
    Deep Power Down Technology(深度節(jié)能技術(shù))
    Enhanced Dynamic Acceleration Technology(增強(qiáng)型動(dòng)態(tài)加速技術(shù))

    據(jù)了解,SSE4將分為4.1版本及4.2版本,4.1版本將會(huì)首次出現(xiàn)于Penryn處理器中,共新增47條指令,主要針對(duì)向量繪圖運(yùn)算、3D游戲加速、視像編碼加速及協(xié)同處理加速動(dòng)作,包括:

Penryn SSE4 Instruction summary

Instruction Category

Instructions

Benefits

Packed DWORD Multiplies

PMULLD, PMULDQ

提升編譯器矢量運(yùn)算效能

Floating Point Dot Product

DPPS, DPPD

3D立體制作及游戲,支持CGHLSL等語(yǔ)言

Multi-packed sum of absolute diffs& min pos

MPSADBW, PHMINPOSUW

視頻編碼處理

Streaming Load

MOVNTDQA

視頻編碼處理、繪圖及GPU數(shù)據(jù)分享

Floating Point Round

ROUNDPS, ROUNDSS, ROUNDPD, ROUNDSD

視頻編碼處理 、繪圖、影音處理、2D/3D應(yīng)用、多媒體及游戲等

Packed Blending

BLENDPS, BLENDPD, BLENDVPS, BLENDVPD, PBLENDVB, PBLENDDW

編譯器矢量運(yùn)算及影音處理、多媒體、游戲等應(yīng)用

Packed Integer Min and Max

PMINSB, PMAXSB, PMINUW, PMAXUW, PMINUD, PMAXUD, PMINDS, PMAXSD

Register Insertion/Extraction

INSERTPS, PINSRB, PINSRD, PINSRQ, EXTRACTPS, PEXTRB, PEXTRD, PEXTRW, PEXTRQ

Packed Format Conversion

PMOVSXBW, PMOVZXBW, PMOVSXBD, PMOVZXBD, PMOVSXBQ, PMOVZXBQ, PMOVSXWD, PMOVZXWD, PMOVSXWQ, PMOVZXWQ, PMOVSXDQ, PMOVZXDQ

Packed Test & Set

PTEST

Packed Compare for Equal

PCMPEQQ

Pack DWORD to Unsigned WORD

PACKUSDW

    而Intel資深工程師兼Penryn微架構(gòu)主管Stephen Fischer表示,與上代處理器產(chǎn)品相比,Penryn處理器在繪圖效能約超過(guò)15%、視訊編碼平均可提高20%、3D內(nèi)容制作可提高逾30%,3D游戲效能更可高達(dá)40%,視乎軟件設(shè)計(jì)而定。

● 技術(shù)測(cè)試結(jié)合:浮點(diǎn)和整數(shù)的除法運(yùn)算速度增加

◎ Enhanced Core MA :Fast Radix-16 Divider

    Penryn處理器除沿襲Core微架構(gòu)的優(yōu)點(diǎn)外,并進(jìn)一步改良除法器的設(shè)計(jì),在科學(xué)計(jì)算、三維坐標(biāo)轉(zhuǎn)換和其它數(shù)學(xué)運(yùn)算密集型功能中,其帶來(lái)約2倍的除法器速度,所包含的新一代的快速除法技術(shù)稱(chēng)為Radix-16,可加速浮點(diǎn)和整數(shù)的除法運(yùn)算速度。

    其實(shí)Intel在Core微架構(gòu)中支持每個(gè)周期可處理多達(dá)4個(gè)指令(對(duì)比舊有處理器最多只能同時(shí)處理3個(gè)指令),且重新采用較高效率的14層Pipeline Stages,為提升分支預(yù)測(cè)的能力及準(zhǔn)確性,Branch Predictor的Bandwitdh提升至20Byte (K8、Banias 為16B,Netburst為4B),令指令執(zhí)行效率大大提高。

45nm Penryn樣品全面勝于65nm Conroe

    此外,Core微架構(gòu)更加入Macro-Fusion技術(shù),可把部份指令組合成單一Micro-Op 指令,令特定情況下每個(gè)周期可執(zhí)行5個(gè)指令,更保留Micro-op Fusion技術(shù),把相同的Macro-ops混合成單一個(gè)Micro-ops 透過(guò)Out-of-order邏輯可減少10% 的Micro-op指令執(zhí)行數(shù),除提升核心的執(zhí)行效率,同時(shí)也保持高能源效益。

    據(jù)了解,基數(shù)為4的算法會(huì)在每次迭代運(yùn)算中計(jì)算其2位的商值,當(dāng)提高到基數(shù)為16的算法時(shí),則允許在每次迭代中計(jì)算4位的商值,進(jìn)而使延遲縮減一半。

◎ 實(shí)測(cè)SiSoftware Processor Arithmetic

{imageTitle}

    從實(shí)際的測(cè)試中看出,Dhrystone和Whetstone是Processor(s) Arithmetic測(cè)試項(xiàng)目中的整數(shù)以及浮點(diǎn)運(yùn)算,用最終成績(jī)來(lái)評(píng)定一款處理器性能。新的Penryn QX9650與QX6850相比,在整數(shù)以及浮點(diǎn)運(yùn)算上QX9650分別提高了2.4%與12.6%。

● 技術(shù)測(cè)試結(jié)合:音效、視訊編碼效率得到提高

◎ Penryn :SSE4指令集強(qiáng)化視訊編碼效率

45nm Penryn樣品全面勝于65nm Conroe

    SSE4指令集進(jìn)一步強(qiáng)訊編碼效果,例如可同時(shí)處理8個(gè)4-byte寬度的SAD(Sums of Absolute Differences)運(yùn)算,常用于新一代高清影像編碼如VC.1及H.264等規(guī)格中,令視頻編碼速度進(jìn)一步提升。

◎ Super Shuffle Engine 

    Intel在Core微架構(gòu)中加入128Bit-SIMD interger arithmetic及128bit SIMD雙倍精準(zhǔn)度Floating-Point Operations單元。舊有的處理器執(zhí)行128Bit的SSE、SSE2及SSE3指令時(shí),需要把指令分拆為2個(gè)64Bit指令,在2個(gè)頻率周期完成,但Core微架構(gòu)則只需要1個(gè)頻率周期便能完成,執(zhí)行效率提升達(dá)1倍,現(xiàn)時(shí)SSE指令集已普遍使用于主流軟件中,包括繪圖、影像、音效、加密、數(shù)學(xué)運(yùn)算等用途,單周期128Bit處理器能力利用頻率以外的方法提升效能。

45nm Penryn樣品全面勝于65nm Conroe

    另一方面,Penryn處理器也有顯著改良,其加入全新Super Shuffle Engine,令SSE 指令運(yùn)算更具效率,以往處理Unpacking、Packing、Align Concatenated Sources、Wide Shifts、Insertion及Horizontal Arithmetic Functions Setup等128Bit寬度的字節(jié)、字及Dword SSE數(shù)據(jù)時(shí),均無(wú)法在單一周期內(nèi)完成,但Super Shuffle Engine設(shè)計(jì)除可讓這些不同性質(zhì)的128Bit SSE指令,在1個(gè)周期內(nèi)便可完成,減低延遲及吞吐量外,更不用在軟件端中作出改良即可實(shí)現(xiàn)。

◎ 音頻、視頻編碼測(cè)試

{imageTitle}

{imageTitle}

{imageTitle}

    以上兩款測(cè)試是針對(duì)音頻、視頻的轉(zhuǎn)碼速度測(cè)試,在固定的文件下進(jìn)行轉(zhuǎn)碼,耗時(shí)多少,用的時(shí)間越短證明性能越好。因?yàn)镼X9650新增了多種技術(shù),因此成績(jī)比QX6850高出不少。

    據(jù)了解,SSE4將分為4.1版本及4.2版本,4.1版本將會(huì)首次出現(xiàn)于Penryn處理器中,共新增47條指令,主要針對(duì)向量繪圖運(yùn)算、3D游戲加速、視像編碼加速及協(xié)同處理加速動(dòng)作,包括:

Penryn SSE4 Instruction summary

Instruction Category

Instructions

Benefits

Packed DWORD Multiplies

PMULLD, PMULDQ

提升編譯器矢量運(yùn)算效能

Floating Point Dot Product

DPPS, DPPD

3D立體制作及游戲,支持CGHLSL等語(yǔ)言

Multi-packed sum of absolute diffs& min pos

MPSADBW, PHMINPOSUW

視頻編碼處理

Streaming Load

MOVNTDQA

視頻編碼處理、繪圖及GPU數(shù)據(jù)分享

Floating Point Round

ROUNDPS, ROUNDSS, ROUNDPD, ROUNDSD

視頻編碼處理 、繪圖、影音處理、2D/3D應(yīng)用、多媒體及游戲等

Packed Blending

BLENDPS, BLENDPD, BLENDVPS, BLENDVPD, PBLENDVB, PBLENDDW

編譯器矢量運(yùn)算及影音處理、多媒體、游戲等應(yīng)用

Packed Integer Min and Max

PMINSB, PMAXSB, PMINUW, PMAXUW, PMINUD, PMAXUD, PMINDS, PMAXSD

Register Insertion/Extraction

INSERTPS, PINSRB, PINSRD, PINSRQ, EXTRACTPS, PEXTRB, PEXTRD, PEXTRW, PEXTRQ

Packed Format Conversion

PMOVSXBW, PMOVZXBW, PMOVSXBD, PMOVZXBD, PMOVSXBQ, PMOVZXBQ, PMOVSXWD, PMOVZXWD, PMOVSXWQ, PMOVZXWQ, PMOVSXDQ, PMOVZXDQ

Packed Test & Set

PTEST

Packed Compare for Equal

PCMPEQQ

Pack DWORD to Unsigned WORD

PACKUSDW

SSE4 :向量、浮點(diǎn)運(yùn)算專(zhuān)門(mén)化 加入串流式負(fù)載指令

    在應(yīng)用SSE4指令集后,Penryn增加了2個(gè)不同的32Bit向量整數(shù)乘法運(yùn)算支持,引入了8 位無(wú)符號(hào) (Unsigned)最小值及最大值運(yùn)算,以及16Bit 及32Bit 有符號(hào) (Signed) 及無(wú)符號(hào)運(yùn)算,并有效地改善編譯器效率及提高向量化整數(shù)及單精度代碼的運(yùn)算能力。同時(shí),SSE4 改良插入、提取、尋找、離散、跨步負(fù)載及存儲(chǔ)等動(dòng)作,令向量運(yùn)算進(jìn)一步專(zhuān)門(mén)化。

    SSE4加入了6條浮點(diǎn)型點(diǎn)積運(yùn)算指令,支持單精度、雙精度浮點(diǎn)運(yùn)算及浮點(diǎn)產(chǎn)生操作,且IEEE 754指令 (Nearest, -Inf, +Inf, and Truncate) 可立即轉(zhuǎn)換其路徑模式,大大減少延誤,這些改變將對(duì)游戲及 3D 內(nèi)容制作應(yīng)用有重要意義。

    此外,SSE4加入串流式負(fù)載指令,可提高以圖形幀緩沖區(qū)的讀取數(shù)據(jù)頻寬,理論上可獲取完整的快取緩存行,即每次讀取64Bit而非8Bit,并可保持在臨時(shí)緩沖區(qū)內(nèi),讓指令最多可帶來(lái)8倍的讀取頻寬效能提升,對(duì)于視訊處理、成像以及圖形處理器與中央處理器之間的共享數(shù)據(jù)應(yīng)用,有著明顯的效能提升。

◎ 實(shí)測(cè)SiSoftware Processor Multi-Media

{imageTitle}

   從測(cè)試結(jié)果看,多媒體運(yùn)算能力上QX9650只比QX6850高出一點(diǎn),優(yōu)勢(shì)不是很明顯,普通消費(fèi)者在使用時(shí)并不能體會(huì)出區(qū)別,只能使用專(zhuān)門(mén)軟件才能區(qū)別開(kāi)。

◎ Cinebench圖形渲染測(cè)試

{imageTitle}

    CINEBENCH RELEASE 10主要考察處理器在進(jìn)行圖形渲染任務(wù)時(shí)的性能,并且支持多線程的軟件。此次測(cè)試中QX9650比QX6850提高9%,顯示出新款45nm處理器擁有超強(qiáng)的圖像處理器能力

◎ CPUMark99測(cè)試

{imageTitle}

    CPUMark 99是最原始的CPU性能測(cè)試軟件,對(duì)主頻、外頻和二級(jí)緩存容量都比較敏感。而在這個(gè)傳統(tǒng)的測(cè)試項(xiàng)目中,QX9650以8分的優(yōu)勢(shì)勝出。

 ◎ SuperPI 測(cè)試

{imageTitle}

  著名的SuperPI測(cè)試,主要考察處理器浮點(diǎn)運(yùn)算性能,我們選擇了常見(jiàn)的1M位運(yùn)算模式。QX9650由于在技術(shù)與工藝上比QX6850先進(jìn),在跑PI上要快2秒左右。

◎ WinRAR 3.60文件壓縮性能測(cè)試

{imageTitle}

    這次使用目前最流行的WinRAR壓縮軟件來(lái)進(jìn)行數(shù)據(jù)壓縮測(cè)試,其3.60版本之后加入了對(duì)多線程的支持。新款QX9650由于在運(yùn)算能力上的出色表現(xiàn),使其在數(shù)據(jù)壓縮測(cè)試中高出QX6850 14%的壓縮能力。

◎ EVEREST Ultimate Edition

{imageTitle}

    測(cè)試小結(jié):總的來(lái)說(shuō),在實(shí)際應(yīng)用測(cè)試中,各個(gè)項(xiàng)目的成績(jī)變化還是蠻大的。特別是數(shù)據(jù)壓縮與內(nèi)存讀寫(xiě)速度測(cè)試上,QX9650都以較大的優(yōu)勢(shì)勝出。

◎ 3D Mark03:

{imageTitle}

{imageTitle}

    3DMark03引入了畫(huà)質(zhì)過(guò)濾測(cè)試,并且提供了紋理過(guò)濾的選項(xiàng),提供了并非默認(rèn)的FSAA抗鋸齒選項(xiàng)。3DMark03受到處理器、內(nèi)存和主板的影響更小,并且專(zhuān)注于顯示卡著色能力的測(cè)試,顯示卡的效能高低將成為3DMark03得分的主要瓶頸。

◎ 3D Mark05:

{imageTitle}

{imageTitle}

    Dmark05一共使用三個(gè)游戲進(jìn)行測(cè)試,Game1測(cè)試的舞臺(tái)是一個(gè)未來(lái)太空基地,主體動(dòng)態(tài)光影采用了高達(dá)2048x2048的紋理,因此對(duì)于顯卡的像素填充率以及顯存帶寬有著很高的要求。

◎ 3D Mark06:

{imageTitle}

{imageTitle}

    測(cè)試小結(jié):游戲理論性測(cè)試部分,QX9650與QX6850在成績(jī)總分上并沒(méi)有太大的區(qū)別,因?yàn)樗麄冎苯訕?gòu)架都相同,同時(shí)頻率之類(lèi)的區(qū)別也不大,但是由于QX9650加入新的指令集,因此在CPU運(yùn)算成績(jī)上要高出一些。

◎ Crytek

{imageTitle}

◎ Company of Heros

{imageTitle}

◎ COJ

{imageTitle}

◎ Half-Life2——EPISOOE TWO

{imageTitle}

◎ Farcry

{imageTitle}

    游戲測(cè)試總結(jié):實(shí)際游戲測(cè)試中,我們都把畫(huà)質(zhì)開(kāi)到最高下進(jìn)行測(cè)試。從一些DX10的游戲測(cè)試上看,這兩款處理器的差距并不大,只有1至2幀的差距。而在一些DX9游戲測(cè)試中,差距就很明顯,比如Half-Life2—EPISOOE TWO QX9650比QX6850提升8%。

◎ 45nm新工藝讓處理器功耗降得更低

    目前從整個(gè)DIY行業(yè)來(lái)說(shuō),大家都在提倡節(jié)能環(huán)保的原則。那么,對(duì)于電腦中的核心——CPU來(lái)說(shuō)當(dāng)然也不例外,低功耗的CPU將成為未來(lái)處理器市場(chǎng)的主流,因此采用最新工藝,最新架構(gòu)和最新的節(jié)能技術(shù)的CPU,都是廠商追求的目標(biāo),因?yàn)橹挥羞@些新技術(shù)可以確保高性能低能耗技術(shù)的實(shí)現(xiàn)。而Intel 45nm處理器的出現(xiàn)正是順應(yīng)了追求低功耗時(shí)代的產(chǎn)品。

{imageTitle}
節(jié)能就是省錢(qián)

    從前面的功耗測(cè)試中我們就有深刻的體會(huì),在平臺(tái)相同、處理器滿負(fù)載的情況下,45nm處理器比65nm處理器的平臺(tái)低了68W,這個(gè)數(shù)值是相當(dāng)可觀的,如果是普通消費(fèi)者使用那么一天就能節(jié)省1.6度電(如果是多人使用,那么節(jié)省的能源就相當(dāng)可觀了)。

◎ 臺(tái)式機(jī):45nm的QX9650打敗市場(chǎng)最高性能產(chǎn)品

PCPOP.COM泡泡網(wǎng)CPU評(píng)測(cè)室  測(cè)試時(shí)間:2007.11.9

測(cè)試項(xiàng)目

Intel Core 2 QX 9650

Intel Core 2 QX 6850

提升幅度

8800Ultra 1024x768

理論性測(cè)試

Processor

Arithmetic

Dhrstone

56013

54626

2.4

Whetstone

41276

36042

12.6

Processor

Multi-Media

Integer

332689

332229

將近0

Fioating

173356

173153

將近0

Memory Bandwidth

Int AUU

7264

6896

5

Float FPU

7118

6762

5

PCMark 2005 CPU

9652

9632

將近0

3D理論性測(cè)試

3DMark 2003

Overall

43850

42835

2.3

CPU項(xiàng)

2345

2201

6

3DMark 2005

Overall

18342

18192

將近0

CPU項(xiàng)

20873

19895

4.6

3DMark 2006

Overall

13548

13533

將近0

CPU

4428

4420

將近0

實(shí)際應(yīng)用測(cè)試

SuperPI

15.37

17.67

13

WinRAR 3.60文件壓縮性能

1937

1654

14.6

Cinebench圖形渲染

11759

10676

9.2

視頻編碼測(cè)試

44

47

6.3

音頻編碼測(cè)試

單線程

171

183

6.5

多線程

108

117

7.6

EVEREST Ultimate

內(nèi)存寫(xiě)入速度

8578

8388

2.2

內(nèi)存讀取速度

7103

6094

14.2

實(shí)際游戲測(cè)試

Crytek

26.5

25.13

5.1

Company of Heros DX10

57.6

56.2

2.4

Half-Life2 EPISOOE TWO

185.4

169.29

8.6

COJ

31

30.9

將近0

Farcry

182.8

179.86

1.6

    市場(chǎng)上,規(guī)格、性能最高的就屬Q(mào)X6850,但是45nm的QX9650的出現(xiàn)將會(huì)替代其性能第一的霸主地位。從測(cè)試結(jié)果看,不管是功耗、處理器運(yùn)算性能、游戲測(cè)試等方面QX9650都要高于65nm的QX6850??梢哉f(shuō)Intel Penryn處理器的出現(xiàn)將繼續(xù)穩(wěn)坐最高性能處理器的寶座。

◎ 筆記本:性能更高,功耗更低

    Penryn移動(dòng)版還會(huì)加入兩項(xiàng)新穎的省電技術(shù)——C6 State和EDAT。C6 State可讓筆記本處理器的功耗在空閑狀態(tài)下降到非常低的水平,核心電壓也會(huì)根據(jù)情況大大降低,同時(shí)緩存徹底轉(zhuǎn)移其中的數(shù)據(jù)并完全關(guān)閉。從這種狀態(tài)中恢復(fù)需要一點(diǎn)點(diǎn)時(shí)間,而且會(huì)對(duì)性能產(chǎn)生一定的影響,但對(duì)筆記本用戶來(lái)說(shuō),電池續(xù)航時(shí)間的重要性顯然更大。EDAT可以單獨(dú)提高某個(gè)處理核心的頻率,并將其他暫時(shí)不使用的核心關(guān)閉,以適應(yīng)單線程任務(wù)或者只能利用一個(gè)核心的多線程任務(wù)。

    可以說(shuō)Intel 45nm處理器面對(duì)著AMD全新K10微架構(gòu)來(lái)襲,單純以微架構(gòu)而論或許在效能表現(xiàn)略有不及,但由于擁有更為先進(jìn)制程、核心頻率及成本等優(yōu)勢(shì),整體而言,AMD K10未必能占得上風(fēng),還是讓我們共同把目光聚焦在第四季度,期待這場(chǎng)具有劃時(shí)代意義的大戰(zhàn)。<

2人已贊

關(guān)注我們

泡泡網(wǎng)

手機(jī)掃碼關(guān)注