絕對渲染利器!英特爾32nm六核CPU評測
[泡泡網(wǎng)CPU頻道8月13日] 通過之前的新聞,我們對Intel最新的32nm六核處理器性能有了一定的了解(參考:超強(qiáng)24線程! Intel 32nm六核性能曝光),不過上面文章中的測試環(huán)境為服務(wù)器主板,并采用雙顆六核對比Xeon,測試項目較少,對我們玩家而言沒有任何意義,不過今天文章中所測試的為單顆六核Gulftown搭配X58來進(jìn)行比較完整的測試,讓我們可以近距離的了解下代Intel最強(qiáng)處理器的威力。之前一直有消息表明:這顆最新32nm六核處理器Gulftown將會命名為Core i9,但現(xiàn)在看來可能依舊沿用i7系列,預(yù)計將會在明年第二季度發(fā)布。
目前,這款核心代號為「Gulftown」基于全新32nm的Intel處理器已經(jīng)準(zhǔn)備就緒,盡管在微架構(gòu)上沒有大幅改動,但在32nm工藝的輔助下,憑著工藝上的進(jìn)步,在相同的芯片大小下能容納更多的物理核心,而且核心頻率提升空間又進(jìn)一步擴(kuò)大,同時功耗表現(xiàn)也得到改善。Intel計劃于2010年第二季中推出首款六核心DT處理器,香港著名IT網(wǎng)站HKEPC首先搶先找來了號稱全港首顆Gulftown六核心工程樣本,并與Bloodfield四核處理器作了詳細(xì)的對比測試:
1、回顧Nehalem架構(gòu)處理器的技術(shù)進(jìn)步
為拉開與對手之間的技術(shù)距離,2006年下半年Intel宣布推出全新規(guī)則律動工藝年與架構(gòu)年(Tick-Tock)的發(fā)展戰(zhàn)略,于每年推出新處理器技術(shù)時,皆具備改良微架構(gòu)的全新制程,全新或大幅改良的微架構(gòu)設(shè)計,以迎合未來十年甚至更遠(yuǎn)的處理器市場。每個代表推出具有增強(qiáng)微架構(gòu)的新一代矽制程技術(shù),與代表推出全新微架構(gòu),而每個工藝年/架構(gòu)年周期大約為2年。
按照Tick-Tock規(guī)劃,Intel在去年第四季發(fā)布了代號為Nehalem全新微架構(gòu)處理器,這名字來自美國俄勒岡州波特蘭市的一個小小的衛(wèi)星城,它是基于Core 微架構(gòu)作出大幅改良,加入了更多有關(guān)提高性能,節(jié)能控制,多處理器擴(kuò)展能力以及效能均衡的設(shè)計,主要分為運(yùn)算內(nèi)核及非運(yùn)算內(nèi)核部份:
運(yùn)算內(nèi)核改動方面:
1.再次加入HT技術(shù),第三代超線程技術(shù),可讓四核多達(dá)8個線程。
2.支持VT虛擬化技術(shù),增加虛擬化輸入/輸出設(shè)備,并提高虛擬機(jī)效率。
3.加入Turbo Mode ,在相同功耗下,提升較簡單線任務(wù)的執(zhí)行效率。
4.新增SSE 4.2指令集,提升XML 、字串及文本處理能力。
非運(yùn)算核心改動方面:
1.采用了三級緩存設(shè)計,二緩采用了超低延遲設(shè)計,而三緩采用共享設(shè)計。
2.內(nèi)建內(nèi)存控制器,3通道設(shè)計并支持DDR3規(guī)格,頻率提升最高達(dá)3倍。
3.全新QPI取代傳統(tǒng)的FSB,最高可達(dá)25.6GB/s帶寬。
4.模塊化設(shè)計,可按需要新增及減少核心元件,以迎合不同市場。
2、改良Nehalem架構(gòu),全新32nm處理器
Nehalem微架構(gòu)是最近的一次架構(gòu)年改變,當(dāng)然緊接著即將登場的是下一代工藝年的改變 ,具備改良的微架構(gòu)的全新制程,代號為Westmere的32nm處理器,基本上它的架構(gòu)沿自Nehalem處理器并加入了7條全新的指令,但改用了入第二代high-k的32nm制程,采用全新的193浸沒式微影技術(shù)于重要的金屬層并配搭193nm或248nm干式微影技術(shù)于非重要的金屬層,處理器采用9層內(nèi)部連結(jié)層,并輔以無鉛和無鹵素封裝,而芯片尺寸將約為45nm產(chǎn)品的70%而已。
據(jù)Intel總裁Paul Otellini指出,全新32nm不僅有效降低所需功耗,同時也能提升核心頻率,而且也縮小處理器核心面積,令處理器能容納更多的運(yùn)算核心或者內(nèi)置GPU核心、PCI-E接口及內(nèi)存控制器,并且令芯片組簡化為單芯片,可進(jìn)一步縮小PC體積,可切換GPU支持功能,能在內(nèi)置顯示核心及獨(dú)立顯卡之間作出實(shí)時切換,達(dá)至節(jié)能省電效果。
為迎接32nm工藝的來臨,Intel將會把美國制造設(shè)施升級,采用新一代32nm芯片技術(shù),2009至2010年間,預(yù)計投入約70億美元于32nm工藝技術(shù)上,美國境內(nèi)32nm工藝投資總額,在該期間內(nèi)將達(dá)到約80億美元,并可提供7000個工作崗位?,F(xiàn)時位于Oregon的Fab D1D已經(jīng)在試產(chǎn)32nm處理器,同樣位于Oregon的Fab D1C將會于2009年第四季正式投產(chǎn)32nm制程,緊接位于Arizona的Fab 32及New Maxcico的Fab 11X ,將會于2010年完成32nm制造設(shè)施升級,預(yù)計將會于2010年下半年進(jìn)行制程世代交換。
根據(jù)Intel處理器最新規(guī)劃,32nm Westmere處理器將會于2009年第四季開始量產(chǎn),核心代號為Clarkdale的32nm入門至主流級處理器,將會于2010年第1季初出貨,緊接2010年第二季中推出代號為Gulftown的32nm高端六核處理器,2010年第四季將會再推出全新微架構(gòu)的32nm處理器代號Sandy Bridge,延續(xù)工藝年發(fā)展戰(zhàn)略。
3、改良45nm High-K + Metal Gate電晶體技術(shù)
2007年Intel首次在代號為P1266的45nm工藝中使用上High-K配搭Metal Gate技術(shù),令芯片漏電情況大幅降低,因此Intel 45nm處理器在功耗及發(fā)熱表現(xiàn)上,擁有很高水平,而直至目前為止,也只有Intel把45nm High-K + Metal Gate電晶體技術(shù)用于量產(chǎn)之中。由于High-K材料配搭Metal Gate電晶體技術(shù)帶來優(yōu)秀表現(xiàn),Intel 45nm研發(fā)至量產(chǎn)是Intel歷史中最快完成的,所需的研發(fā)時間僅為65nm的一半。
代號為P1268的全新Intel 32nm工藝,主要基于現(xiàn)有的45nm High-K + Meta Gate電晶體技術(shù),并作出了大幅度的改良,包括High-K的等效氧化層厚度,由45nm制程的1nm降低至32nm制程只有0.9nm,并且閘極長度縮少至只有30nm,閘極距離繼續(xù)以每兩年縮少0.7x的目標(biāo)發(fā)展中,Intel的32nm是現(xiàn)時所有相同制程中其閘極距離最窄小的。
透過了降低High-K的等效氧化層厚度及閘極距離,Intel 32nm的NMOS及PMOS電晶體性能相較上45nm提升14%及22% ,漏電比較上代45nm制程,NMOS電晶體減少超過5x,PMOS電晶體減少漏電超過10x,以上的改善令處理器工程師在電路設(shè)計時規(guī)限大幅減少,也令核心可以更小,當(dāng)然處理器核心頻率及功耗表現(xiàn)也能大幅減少。
Intel 32nm制程同時改用了第四代應(yīng)變矽技術(shù),用矽鍺、雙應(yīng)力應(yīng)變矽以及先進(jìn)的應(yīng)變記憶技術(shù),能夠有效提高晶體管的開關(guān)速度和電源效率,此一改變將可在運(yùn)作頻率及功耗表現(xiàn)在獲益重大改善。
4、針對加密/解密運(yùn)算全新AES指令集
Intel Westmere處理器是代表推出具有增強(qiáng)微架構(gòu)的新一代矽制程技術(shù),因此技術(shù)改良主要集中于矽制程上,而微架構(gòu)設(shè)計完全則基于Nehalem微架構(gòu),今代在微架構(gòu)改良僅加入了六組針對加密及解密運(yùn)算,即AES指令集。
Intel AES指令集提供了快速及保密的資料加密及解密運(yùn)算功能,AES是block cipher(塊密碼)運(yùn)算的最主流規(guī)格,因此全新Intel AES指令集能應(yīng)用十分廣泛并能為不少應(yīng)用程序進(jìn)行加速。
Intel AES指令集共有六組指令提供硬體AES運(yùn)算加速,包括四組AES加密及解密(AESENC、AESENCLAST、AESDEC、AESDECLAST) ,另外兩組為AES金鑰產(chǎn)生(AESIMC、AESKEYGENASSIST) ,相較單純以軟體運(yùn)算效能可高出4倍以上。 此外, Intel AES指令集不僅支援3種AES官方規(guī)格金鑰長度(ASE128、ASE192、ASE256)及所有AES官方規(guī)格運(yùn)算模式,并支持?jǐn)?shù)種AES非官方定義規(guī)格。
除了性能上的提升外,采用Intel AES指令集讓資料以data-independent time運(yùn)算及不需要采用lookup Table,Cache Attacks的攻擊無法再成功,而且難以采用Software Side Channel Attacks破解,大大提高了資料的安全性及保密性。
此外,Intel Westmere處理器還加入了一組Carryless multiply指令(PCLMULQDQ) ,讓處理器可以在一個周期內(nèi)處理兩個64Bit Carry-less Multiplication(無攜帶乘法) ,它是大部份加密標(biāo)準(zhǔn)所必要處理的元件,采用伽羅瓦計數(shù)器模式(GCM) 。
GCM模式在2006年4月得到美國政府批準(zhǔn)及支持,與AES規(guī)格混及使用,并成為NSA Suite B.的一部分,它也是IEEE 802.1ae標(biāo)準(zhǔn),并建議使用于轉(zhuǎn)發(fā)率高于10 Gbps的應(yīng)用中,包括IPsec (IPsec RFC 4106)協(xié)定及ISO T11標(biāo)準(zhǔn)光纖通道存儲標(biāo)準(zhǔn)的P1619安全協(xié)定。
有了Intel AES指令集,日后PC的OS Level Disk可完全加密形以提升保安性,而且不會把系統(tǒng)效能拖垮,不僅在商業(yè)應(yīng)用上令保密性大幅提高,一般PC用戶的個人資料亦得到更好的保障。
5、CPU+GPU先到:解讀Intel全線32nm布局
根據(jù)intel原定規(guī)劃,內(nèi)置顯示核心的45nm Havendale桌面處理器及Auburndale筆記本處理器應(yīng)于今年年底量產(chǎn),但由于32nm第二代Hi-K制程已十分成熟的關(guān)系,最終決定取消量產(chǎn)Havendale及Auburndale處理器,直接由32 nm版本Clarkdale處理器及Arrandale處理器取代,量產(chǎn)日期與上市時間將會不變,但內(nèi)置GPU核心部份仍會是45nm生產(chǎn),但功耗表現(xiàn)將可進(jìn)一步改善,預(yù)計于2010年第一季初上市。代號為Clarkdale桌面處理器及代號為Arrandale移動處理器,兩者均為雙核心設(shè)計并內(nèi)置顯示核心,主要針對入門至主流級市場。值得注意的是,Intel并不打算為32nm Westmere處理器推出完整的產(chǎn)品線,而是與45nm Nehalem處理器并存于市場上,直至再下一代Sandy Bridge微架構(gòu)才會全線導(dǎo)入32nm工藝。
因此Intel 32nm Westmere將不會有四核處理器,代號為Lynnfield桌面處理器及Clarksfield移動平臺處理器將繼續(xù)留守市場,直至下代Sandy Bridge微架構(gòu)產(chǎn)品才會退場。此外,受惠于全新32nm工藝的優(yōu)秀功耗表現(xiàn),今天評測的首款六核桌面處理器,Intel將會于2010年第二季推出,代號為Gulftown,主要針對更高端玩家市場。
低端市場方面將由45nm Penryn微架構(gòu)產(chǎn)品支撐大局,直至下一代Sandy Bridge微架構(gòu)產(chǎn)品推出后,Clarkdale及Arrandale處理器將向下移至低端市場,因此Socket 775在2010年仍不會退場。
&nb
6、六核12線程Gulftown處理器工程樣本
下圖為Intel 32nm Westmere六核處理器工程樣本,核心代號為Gulftown,采用32nm無鉛、無鹵制程,LGA 1366封裝,兼容現(xiàn)有的Intel X58平臺主板,但需要更新主板BIOS更新。盡管Intel還未決定Gulftown出貨頻率及Turbo Boost頻率,但FMB將會采用08規(guī)格及最高TDP為130W,與45nm四核心Bloomfield相同。
Intel Gulftown六核心工程樣本,A1版本頻率為2.4GHz
Intel Gulftown六核仍支持HT技術(shù),該技術(shù)可在1個執(zhí)行內(nèi)核中同時處理2條線程,透過4個執(zhí)行引擎,多核處理器中的同步多線程能力可將同時運(yùn)行于所有內(nèi)核的整體線程的潛在數(shù)量提高1倍,也就是說Gulftown處理器可同時執(zhí)行12條線程。
六核支持HT技術(shù),能同時處理高達(dá)12個線程
根據(jù)Intel所提供的數(shù)據(jù)指出,HT出色的能耗表現(xiàn)顯著提升了處理器的性能,處理器只需消耗極低的電量,便可將應(yīng)用性能提升20-30%,在能源日漸短絀的今日,HT提供了高效能又節(jié)能的處理器表現(xiàn)。
7、六核Gulftown默認(rèn)2.4G,三緩高達(dá)12MB
Intel Gulftown處理器支持QPI技術(shù),最高連接速度仍為6.4GT/s,總帶寬高達(dá)25.6GB/s,按照核心數(shù)目的提升,三級緩存由上代Bloomfield的8MB增加至12MB,但仍保持16-Ways設(shè)計。
左為45nm Bloomfield四核心,右為32nm Gulftown六核心
與Bloomfield四核一樣,Gulftown六核內(nèi)建三通道DDR3內(nèi)存控制器,最高可支持48GB容量,不過令人失望的是, Gultown六核仍然官方支持DDR3-1066速度,最高頻寬為25.6GB/s。
Gulftown六核將支持Intel VT-x、Intel VT-d、Intel 64技術(shù)及Intel EIST技術(shù),但不會支持Intel TXT技術(shù)。此外,盡管32nm Westmere核心支持新一代Intel AES指令集,但I(xiàn)ntel暫定不會在最高階的Gulftown六核心中開放AES功能,但我們手上的工程樣本中仍能使用AES指令。
根據(jù)Intel向主板業(yè)者透露,Intel Gulftown六核最終命名,很大機(jī)會不會采用Core i9家族,而是Core i7-1000家族,因為Gulftown并沒有微架構(gòu)上的改動,僅有核心數(shù)目的增長,不足以構(gòu)成全新品牌。
&nb
7、CPU綜合性能測試 一
測試平臺
◎ PC Mark05/Vantage性能測試
PCMark Vantage 是Futuremark發(fā)布的新一代基準(zhǔn)測試軟件,并比較完美的對多核心處理器進(jìn)行了優(yōu)化,而且是專為Windows vista 32/64-bit打造的,不再支持Windows 2000/XP。
盡管六核Gulftown處理器相較四核Bloomfield處理器多出兩個核心,但卻沒有在PC Mark測試中性能增長,主要原因在于PC Mark大部份測試均只需要同時處理四核運(yùn)算,從上面運(yùn)行截圖中可以看到,大部份情況下Gulftown的負(fù)載率僅有34%-50% ,并無法完全反映出六核優(yōu)勢。
以上測試意味著,如果使用者并不需要同時執(zhí)行很多應(yīng)用軟件,或是所執(zhí)行的軟件并沒有為多核進(jìn)行優(yōu)化,沒有支持超過四個以上線程的話, Gulftown六核根本毫無用武之地。
8、CPU綜合性能測試 二
◎ CineBench R10性能測試
CineBench R10是著名的OpenGL運(yùn)算測試軟件,并可支持多線程運(yùn)算,Cine Bench R10執(zhí)行多核心測試,可把Gulftown六核及12個執(zhí)行線程能力完全發(fā)揮,性能大幅超越Bloomfield四核。
◎ Sandra 2009性能測試
Sandra 2009主要是測試處理器的運(yùn)算最大吞吐量,因此得出的結(jié)果都是最大理論值,而性能理論值所得出的差距,則要視乎軟件對多線程的優(yōu)化功力。筆者采用Sandra 2009測試軟件,除了要證實(shí)這顆Gulftown六核所有核心均正常運(yùn)行外,更重要的是測試Intel AES指令集的威力,從Cryptographic Bandwidth、AES256 Bandwidth及SHA256 CPU Hashing Bandwitdh測試中可以看到,新一代32nm Westmere在AES運(yùn)算性能有著明顯的突破。
◎ ScienceMark 2.0性能測試
ScienceMark 2.0雖然能認(rèn)出Gulftown六核支持12個線程,但事實(shí)并無法完全運(yùn)用這顆六核的線程,證明軟件設(shè)計將左右多核心的性能提升幅度。
9、CPU綜合性能測試 三
◎ Microsoft Excel 2007
Microsoft曾經(jīng)表示Excel 2007針對多核心運(yùn)算作出了完全優(yōu)化,因此我們采用了兩個用于金融業(yè)的算式,計算美國國庫債卷現(xiàn)價及計算期權(quán)現(xiàn)價的程式作測試,可以看到Gulftown六核心大幅超頻Blommfield四核心。
◎ Microsoft office 2007
同樣是Microsoft Office的一員,但筆者采用兩個50MB的Word文件進(jìn)行Word Merge ,然后把一個304MB的PowePoint檔案列印成向量的XPS檔案,但多核心的優(yōu)勢并未為Gulftown帶來漂亮的成績單。
◎ Microsoft Windows Vista
◎ Adobe Photoshop CS4
◎ Mainconcept H.264 Encoder
我們找來Microsoft Windows Vista內(nèi)建的2款軟件、Adobe Photoshop CS4的兩個插件及Mainconcept H.264 Encoder作測試,看來并不是所有軟件均能為六核帶來領(lǐng)先優(yōu)勢,所以消費(fèi)者在選擇處理器時,如果要求提升執(zhí)行單一軟件性能,則較高頻率的四核很大機(jī)會較六核更明顯。
10、3D基準(zhǔn)/3D游戲性能測試
在3D游戲測試方面,由于要降低顯卡性能瓶頸以達(dá)至處理器性能差別最大化,我們采用了現(xiàn)在最強(qiáng)的GeForce GTX 295顯卡,并把分辨率設(shè)定于1024x 768及效果設(shè)定為Low,以測試核心數(shù)目對游戲FPS的影響。結(jié)果是大部份3D游戲均未有對六核進(jìn)行優(yōu)化,處理器核心數(shù)目的提升并沒有為FPS帶來明顯增幅。
11、處理器功耗及溫度測試:
功耗及溫度測試方面,采用32nm的Gulftown六核表現(xiàn)令人驚喜,雖然核心數(shù)目相較45nm的Bloomfield四核多出兩個,但閑置及完全負(fù)載的功耗及溫度表現(xiàn)均低于Bloomfield四核,證明新一代32nm工藝已經(jīng)十分成熟。
編輯總結(jié):
Westmere處理器如期現(xiàn)身,每年推出具備改良微架構(gòu)的全新工藝,全新或大幅改良的微架構(gòu)設(shè)計的承諾順利達(dá)成,雖然Westmere在微架構(gòu)上改動不大,但制程技術(shù)提升后不僅功耗、溫度下降,更為Intel帶來更大的頻率提升空間及核心數(shù)目提升空間,而且核心尺寸進(jìn)一步縮少令成本更低,競爭力進(jìn)一步提升。
本次測試的Intel Gulftown桌面六核,其技術(shù)宣布意義大于實(shí)際,由于是針對最高端的玩家市場,一般普通玩家是無法嘗試了,不過,就算是高端玩家,由于大部份桌面應(yīng)用軟件及3D游戲仍未有對六核作出優(yōu)化,根本難以體現(xiàn)六核的真正威力,只有用于工作站或服務(wù)器環(huán)境才有實(shí)際意義。除非得到軟件廠商的配合,針對六核作出優(yōu)化,否則Intel Gulftown六核心就像一臺F1賽車車在一般路面上,完全浪費(fèi)了應(yīng)有的運(yùn)算能力。 ■<
關(guān)注我們
