国产成人福利在线视频播放下载,成人无码www免费视频在线看,放荡的美妇在线播放,大地资源网最新更新,国产成人精品日本亚洲网站

泡泡網(wǎng)CPU頻道 PCPOP首頁(yè)      /      CPU     /      評(píng)測(cè)    /    正文

酷睿架構(gòu)首款處理器測(cè)試 5大創(chuàng)新解析

  2006年6月27日,英特爾公司面向服務(wù)器、工作站、通信、存儲(chǔ)和嵌入式細(xì)分市場(chǎng),大批量上市全新雙核英特爾®至強(qiáng)®處理器5100系列(研發(fā)代碼:Woodcrest)。該處理器基于革命性的全新英特爾®酷睿™微體系架構(gòu),結(jié)合了許多全新處理器設(shè)計(jì)方法,并以全球非常先進(jìn)的制造工藝,在服務(wù)器性能、能效和成本優(yōu)勢(shì)方面建立了毋庸置疑的領(lǐng)導(dǎo)地位。內(nèi)部訂單顯示,從今天算起,已有150多家廠商,在200多種服務(wù)器和工作站模型里計(jì)劃裝備該處理器。

酷睿第一彈 英特爾隆重發(fā)布Woodcrest
 
 Intel攜手眾廠商發(fā)布新一代至強(qiáng)5100系列
 
  作為取代NetBurst構(gòu)架的Dempsey Xeon處理器的最新Xeon家族產(chǎn)品,Woodcrest也采用了和Dempsey相同的65nm工藝制作,兩者最大功耗均為130w。但是Woodcrest在性能/功耗比上大幅強(qiáng)于Dempsey。據(jù)Intel宣稱(chēng),Woodcrest處理器性能/功耗比比Dempsey高出2-3倍。和AMD Opteron處理器相比,Intel宣稱(chēng)Woodcrest處理器可以節(jié)省功耗33%。實(shí)際測(cè)試顯示,Woodcrest處理器在一些情況下,處理器功耗比Opteron節(jié)省10%到15%。
 
{imageTitle}

  設(shè)計(jì)上,與Dempsey分離的2*2MB L2緩存設(shè)計(jì)不同,Woodcrest采用4M共享L2緩存。而首批上市的Core2Duo以及Woodcrest Xeon將不支持HT技術(shù),這項(xiàng)技術(shù)可以使得Dempsey Xeon處理器在某些情況下可以同時(shí)執(zhí)行4個(gè)線程,但是這項(xiàng)技術(shù)有望在稍后的時(shí)間加入到Core2Duo XE以及Woodcrest Xeon中。

  主板支持方面,Xeon DP和現(xiàn)有的LGA771主板兼容,內(nèi)存采用DDR2內(nèi)存,支持DDR2-533或者DDR2-667,代號(hào)為Bensley平臺(tái)的Woodcrest Xeon DP處理器主板一般集成1條PCI Express顯卡插槽。

Intel Xeon Processor

Processor Brand

Processor No.

Core /FSB

L2 Cache

Price

Xeon Processor DP
(Woodcrest Bin-0)

5160

3.0GHz /
1333MHz

4MB

$850

Xeon Processor DP
(Woodcrest Bin-1)

5150

2.66GHz /
1333MHz

4MB

$690

Xeon Processor DP
(Woodcrest Bin-2)

5140

2.33GHz /
1333MHz

4MB

$455

Xeon Processor DP
(Woodcrest Bin-3)

5130

2.0GHz /
1333MHz

4MB

$320

Xeon Processor DP
(Woodcrest Bin-4)

5120

1.86GHz /
1066MHz

4MB

$260

Xeon Processor DP
(Woodcrest Bin-5)

5110

1.60GHz /
1066MHz

4MB

$210

  價(jià)格方面,Xeon DP的千顆批發(fā)單價(jià)從210到850美金不等。全球大部份服務(wù)器廠商都將出貨Xeon DP服務(wù)器產(chǎn)品,其中Apple蘋(píng)果電腦將采用Xeon DP處理器生產(chǎn)新一代Xserve服務(wù)器。盡管Woodcrest于今天發(fā)布,但是Intel將首先滿(mǎn)足OEM和系統(tǒng)集成商的需求,渠道商將于2周后拿到處理器實(shí)物。而零售商表示,盒裝的Woodcrest可能將于8月才在市場(chǎng)上出現(xiàn)。

  而作為競(jìng)爭(zhēng)對(duì)手的AMD,將于今年8月1日發(fā)布其最新的大型服務(wù)器用處理器?;贚GA 1207針 Socket F,F(xiàn)制程的最新版Opteron。

  基于英特爾酷睿微體系架構(gòu)的第一款處理器

  Core微體系架構(gòu)提升了新處理器的性能,同時(shí)也是冠以Intel Core 2 Duo處理器品牌的移動(dòng)和桌面產(chǎn)品的設(shè)計(jì)基礎(chǔ)。Intel Core微架構(gòu)相比上代架構(gòu),約有70-80%的架構(gòu)和線路被重新設(shè)計(jì),并加入了五項(xiàng)主要改革,包括寬位動(dòng)態(tài)執(zhí)行、智能功率特性、高級(jí)智能高速緩存、智能內(nèi)存訪問(wèn)以及高級(jí)數(shù)字媒體增強(qiáng),本文將會(huì)詳細(xì)介紹這五項(xiàng)技術(shù)創(chuàng)新的原理。

英特爾寬位動(dòng)態(tài)執(zhí)行(Intel Wide Dynamic Execution)

Intel Core微架構(gòu)全解析 X6800搶先測(cè)
 
  Pentium Pro開(kāi)始,Intel加入了Dynamic execution動(dòng)態(tài)執(zhí)行,令x86處理器首次支援Data Flow Analysis、Speculative Execution、Out of Order Execution及Super Scalar等RISC的處理器技術(shù)技術(shù)。直至Pentium 4的NetBurst架構(gòu)則被再度改良稱(chēng)為Advanced Dynamic Executive,它采用更深的Out of Order Speculative Executive引擎,以善用高Pipeline Stage架構(gòu)減少浪費(fèi),同時(shí)改善Branch-Prediction機(jī)制減少造成分支預(yù)測(cè)錯(cuò)誤,全是為了高時(shí)脈政策而鋪路。

  明顯地,Intel Core微架構(gòu)的Wide Dynmaic Execution和Adcanced Dynamic Executive意念不同,它的出發(fā)點(diǎn)在于如何提高每周期指令處理數(shù)目,改善執(zhí)行時(shí)間及提升處理器的能源效益,Core微架構(gòu)擁有4組Decoder(3 Simple decoders + 1 Complex decoder),比上代Pentium Pro(P6)/PentiumII/PentiumIII/Pentium M架構(gòu)擁有2 Simple decoders + 1 Complex decoder可多處理一組指令,與AMD K8不同的是它只擁有3組Complex ecoders,正常來(lái)說(shuō)大部份x86指令均可以采用Simple Coder把它翻譯成一個(gè)Micro-Op指令,只有極少數(shù)學(xué)運(yùn)算的指令,需要采用Complex decoders來(lái)把它翻譯為四個(gè)Micro-Ops指令,因此在正常情況下Core微架構(gòu)對(duì)比Netburst及K8有更優(yōu)秀的指令執(zhí)行效率。取消了高時(shí)脈政策,Intel Core微架構(gòu)用回較高效率的14層Pipelines,為了提升分支預(yù)測(cè)的能力及準(zhǔn)確性,Branch Predictor的Bandwitdh提升20B(K8、Banias為16B,Netburst為4B),這些都是體現(xiàn)了"Wide"的意念。

Intel Core微架構(gòu)全解析 X6800搶先測(cè)

  Wide Dynamaic Execution首次加入了Macro-Fusion技術(shù)。在舊世代的微架構(gòu)中,每個(gè)指令被送來(lái)時(shí)其解碼及執(zhí)行動(dòng)作是完全獨(dú)立的,但I(xiàn)ntel Core微架構(gòu)可以讓常見(jiàn)的指令組例如一個(gè)Compare指令配隨后擁有一個(gè)Jump指令,便可把這個(gè)指令組合成單一的Micro-Op指令,這令Core微架構(gòu)在特定情況下每個(gè)周期有運(yùn)算五組指令,據(jù)Intel表示大部份x86程序,約每十至十五個(gè)指令就會(huì)出現(xiàn)一組可透過(guò)Macro -Fusion被組合,因此減少了程序執(zhí)行所需運(yùn)算時(shí)間、提升效能卻不會(huì)增加處理器的功耗,為此Intel亦改良ALU(Arithmetic Logic Unit)部份以支援Macro-Fusion技術(shù)。

Intel Core微架構(gòu)全解析 X6800搶先測(cè)
 
  此外,Intel Core微架構(gòu)保留了Banias微架構(gòu)的Micro-op Fusion技術(shù),在現(xiàn)代的x86處理器,x86指令(Macro-ops)會(huì)被分拆去為長(zhǎng)短相同的Micro-Ops指令,才會(huì)被送往處理器的Pipeline等候執(zhí)行,而Micro-op Fusion能把相同的Macro-ops混合成單一個(gè)Micro-ops,減少了Micro-ops運(yùn)算的數(shù)目亦令處理器運(yùn)作排序更有效率,據(jù)Intel表示,Micro-op Fision透過(guò)Out-of-order邏輯可以減高達(dá)10%的Micro-op指令執(zhí)行數(shù)??偫ǘ?,Macro-Fusion及Micro-op Fision提升了核心的執(zhí)行效率同時(shí)保持高能源效益。
英特爾智能功率特性(Intel Intelligent Power Capability)
 
Intel Core微架構(gòu)全解析 X6800搶先測(cè)
 
  由于上代Prescott處理器功耗表現(xiàn)并未如理想,故新一代Core架構(gòu)針對(duì)功耗上作出重良的改善稱(chēng)為Intel Intelligent Power Capability技術(shù),處理器在制程技術(shù)作出優(yōu)化,例如采用先進(jìn)的65奈米Strained Silicon技術(shù)、加入Low-K Dielectric物質(zhì)及增加金屬層,相比上代90奈米制程減少漏電情況達(dá)1千倍。但最值得注意的是,Intel加入了細(xì)微的邏輯控制機(jī)能獨(dú)立開(kāi)關(guān)各運(yùn)算單元,只有需要時(shí)才會(huì)被開(kāi)啟,避免閑置時(shí)出現(xiàn)不必要的功耗浪費(fèi),稱(chēng)為Sleep Transistors技術(shù),此外,把核心各個(gè)Buses及Array采用獨(dú)立控制其VCC電壓,當(dāng)這些部份被閑置時(shí)會(huì)被運(yùn)作于低功耗模式中。
 
  以往要實(shí)現(xiàn)達(dá)成Power Gating是十分困難,因?yàn)樵谠_(kāi)關(guān)的過(guò)程需要消耗一定程度的能源,而且需要克服由休眠至恢復(fù)工作出現(xiàn)的延遲值,故此在Intel Intelligent Power Capability設(shè)計(jì)考慮到如何優(yōu)化Sleep Transistor的應(yīng)用,并確保不會(huì)因Sleep Transistors技術(shù)而影響效能表現(xiàn)。在Computex TW 06期間,Intel就曾展示一臺(tái)Core 2 Duo E6300(1.86GHz/2MB L2/1066MHz FSB)在沒(méi)有采用風(fēng)扇輔助下完全負(fù)載前景播放HD WMV9影片、背景同時(shí)不斷重覆Lame Audio Encoding WAV to MP3壓縮,經(jīng)過(guò)20分鐘后仍能保持正常運(yùn)作,用手觸摸處理器散熱器表面只是微熱,相反北橋散熱器的溫度要比它還要燙手,很難想像這顆65W TDP的處理器竟有如高水準(zhǔn)表現(xiàn),據(jù)Intel表示由于影片壓縮工作部份核心元件并不會(huì)被使用,會(huì)被關(guān)掉或是運(yùn)作于低功耗模式中,縱使其他核心部份正部完全負(fù)載。
 
英特爾高級(jí)智能高速緩存(Intel Advanced Smart Cache)
 
Intel Core微架構(gòu)全解析 X6800搶先測(cè)
 
  Intel第一代雙核心處理器設(shè)計(jì)只是單純地把兩顆核心封裝在一起,并分享同一個(gè)Front Side Bus(FSB)頻寬,當(dāng)其中一顆核心使用FSB時(shí),另一顆便需要等待另一顆的完成才能使用FSB,加上Intel FSB設(shè)計(jì)是單向存取,還需要透過(guò)北橋來(lái)讀取系統(tǒng)記憶體資料,均嚴(yán)重加重Intel的FSB工作量,兩顆核心亦沒(méi)有直接溝通的橋梁,如果CPU 0的L2 Cache需要讀取CPU 1的L2 Cache,更是需要經(jīng)過(guò)FSB及北橋才能達(dá)至出現(xiàn)嚴(yán)重的延遲。
 
  Intel Core微架構(gòu)對(duì)此作出了大幅改良,全新的Intel Advanced Smart Cache有效加強(qiáng)多核心架構(gòu)的效率,傳統(tǒng)的雙核心設(shè)計(jì)每個(gè)獨(dú)立的核心都有自己的L2 Cache,但I(xiàn)ntel Core微架構(gòu)則是透過(guò)核心內(nèi)部的Shared Bus Router共用相同的L2 Cache,當(dāng)CPU 1運(yùn)算完畢后把結(jié)果存在L2 Cache時(shí),CPU 0便可透過(guò)Shared Bus Router讀取CPU 1放在共用L2 Cache上資料,大幅減低讀取上的延遲并減少使用FSB頻寬,同時(shí)加入L2 & DCU Data Pre-fetchers及Deeper Write output緩沖記憶體,大幅增加了Cache的命中率。
 
  相比現(xiàn)時(shí)K8的雙核心L2 Cache架構(gòu),也是比不上Advanced Smart Cache設(shè)計(jì),因?yàn)楣灿肔2 Cache能進(jìn)一步減少了Cache Misses的情況,K8微架構(gòu)在CPU 0需要讀取CPU 1 L2 Cache的資料時(shí),需要向System Request Interface提向要求并透過(guò)Crossbar Switch就把取讀資料,但CPU 0發(fā)現(xiàn)讀取自己的L2 Cache沒(méi)有該筆資料才會(huì)要求讀取CPU 1的L2 Cache資料,情況等同于CPU 0的L3 Cache,而共用的L2 Cache設(shè)計(jì)卻沒(méi)有以上需要,AMD已明確在下一代K8L微架構(gòu)中加入相似Shared Cache技術(shù),但K8L產(chǎn)品在AMD Roadmap中暫定于2007年H2才能登場(chǎng)。
 
  Smart Cache架構(gòu)還有很多不同的好處,例如當(dāng)兩顆核心工作量不平均時(shí),如果獨(dú)立L2 Cache的雙核心架構(gòu)有機(jī)會(huì)出現(xiàn)其中一顆核心工作量過(guò)少,L2 Cache沒(méi)有被有效地應(yīng)用,但另一顆核心的L2 Cache卻因工作量過(guò)重,L2 Cache容量沒(méi)法應(yīng)付而需要傳取系統(tǒng)記憶體,值得注意的是它并無(wú)法借用另一顆核心的L2 Cache空間,但SmartCache因L2 Cache是共用的而沒(méi)有這個(gè)問(wèn)題。
 
  Shared Bus Router除了更有效處理L2 Cache讀取外,還會(huì)為雙核心使用FSB傳輸進(jìn)行排程,新加入的Bandwidth Adaptation機(jī)制改善了雙核心共用FSB時(shí)的效率,減少不必要的延遲,其實(shí)這個(gè)Shared Bus Router設(shè)計(jì)確實(shí)有點(diǎn)像K8的System Request Interface及Crossbar Switch的用途。此外,Intel Advanced SmartCache架構(gòu)用在行動(dòng)處理器上亦很有優(yōu)勢(shì),系統(tǒng)工作量不高或是處于閑置狀態(tài)下,Intel Core微架構(gòu)可以把其中一顆核心關(guān)掉,以減少處理器的功耗,不過(guò)卻可以保持4MB L2 Cache運(yùn)是保持工作,而且Shared Bus Router更可以因應(yīng)L2 Cache的需求量改變L2 Cache的大小,在不必要時(shí)關(guān)掉部份L2 Cache以減低功耗,但在獨(dú)立L2 Cache的雙核心,如果要把其中一個(gè)Cache關(guān)掉,則必需要把其中一顆核心的L2 Cache資料移交出來(lái),而且Cache亦會(huì)和核心同時(shí)被關(guān)閉,并沒(méi)法因應(yīng)需求實(shí)時(shí)改變或關(guān)掉部份L2 Cache的容量以減低功耗。
英特爾智能內(nèi)存訪問(wèn)(Intel Smart Memory Access)
 
Intel Core微架構(gòu)全解析 X6800搶先測(cè)
 
  Intel Core微架構(gòu)同時(shí)亦改良了記憶體傳取效能,每顆核心均擁有3個(gè)獨(dú)立Prefetchers(2 Data and & 1 Instruction),及2個(gè)L2 Prefetchers,能同時(shí)地偵出Multiple Streaming及Strided Acess Patterns,讓核心需要的資料提早準(zhǔn)備就緒于L1之中,兩組L2 Prefetchers則會(huì)分析L2 Cache資料并保留有日后需要的資料于L2 Cache之中。Core微架構(gòu)的L1 Cache設(shè)計(jì)放棄使用上代Netburst的Trace Cache設(shè)計(jì),因?yàn)門(mén)race Cache的最大優(yōu)點(diǎn)在于較長(zhǎng)的Pipeline Stage微架構(gòu),而Core只擁有14 Stages故此它改用Banias架構(gòu)的8-Way 32KB Instruction Cache + 32KB Data Cache設(shè)計(jì),雖然容量比AMD K8的 64K Instruction Cache + 64KB Data Cache少一半,但由于AMD的L1 Cache只是2-Way設(shè)計(jì),因此Intel的L1 Cache命中率相比K8有較輕微的優(yōu)勢(shì)。L2 Cache方面擁有特大的16-Way 256Bit 4MB容量,但Latechy卻下降至和AMD K8相約的12-14ns之間,相比AMD K8只有16-Way 128Bit 1MB(部份型號(hào)只有512KB),Intel Core微架構(gòu)在改良Cache系統(tǒng)后擁有絕對(duì)優(yōu)勢(shì)。
 
  但如果對(duì)比系統(tǒng)記憶體存取表現(xiàn),AMD K8卻因內(nèi)建記憶體控制器而比Intel Core微架構(gòu)優(yōu)勝,但由于Core微架構(gòu)的采用上短Pipeline Stage架構(gòu)及時(shí)脈相對(duì)Netburst微架構(gòu)低,加上高容量的L2 Cache并內(nèi)建Shared Router Bus減少FSB使用,因此系統(tǒng)記憶體控取的表現(xiàn)差距,已不像與上代Netburst微架構(gòu)產(chǎn)品般嚴(yán)重,而為了進(jìn)一步拉近與K8架構(gòu)上的記憶體效能距離,Intel在Core微架構(gòu)中加入全新的記憶體讀取技術(shù)稱(chēng)為Memory Disambiguation。
 
Intel Core微架構(gòu)全解析 X6800搶先測(cè)
 
  Memory Disambiguation是一個(gè)十分聰明的設(shè)計(jì),透過(guò)Out of Order過(guò)程把記憶體讀取次序作出分析。在傳統(tǒng)的微架構(gòu)里,記憶體讀取是按排程順序而被執(zhí)行,如圖上例子Load 4是獨(dú)立的Data X讀取執(zhí)行,亦必需要等待其他Store 1、Load 2及Store 3工作完畢,縱使Load 4的Data X和前面的資料存取動(dòng)作并無(wú)關(guān)系,因?yàn)樘幚砥鞑⒉粫?huì)得悉前面的動(dòng)作會(huì)否改變Data X的數(shù)值,所以不能重新排序并分析Load 4能否提前執(zhí)行。
 
Intel Core微架構(gòu)全解析 X6800搶先測(cè)
 
  在Intel Core微架構(gòu)中透過(guò)智能的分析機(jī)制,能預(yù)知Load 4的Data X是完全獨(dú)立,并可讓它提早執(zhí)行。正因如此Memory Disambigutaion能減少處理器的等候時(shí)間減少閑置,同時(shí)減低記憶體讀取的延遲值,而且它可以偵出沖突并重新讀取正確的資料及重新執(zhí)行指令,保證運(yùn)作結(jié)果不會(huì)出現(xiàn)嚴(yán)重,但在正常情況下Memory Disambirutation出錯(cuò)的機(jī)會(huì)率甚低。
 
英特爾高級(jí)數(shù)字媒體增強(qiáng)(Intel Advanced Digital Media Boost
 
Intel Core微架構(gòu)全解析 X6800搶先測(cè)

  Intel Core微架構(gòu)同時(shí)亦針對(duì)SSE指令執(zhí)行作出了改良,稱(chēng)為Intel Advanced Digital Media Boost技術(shù),新一代Core微架構(gòu)擁有128Bit-SIMD interger arithmetic及128bit SIMD雙倍精準(zhǔn)度Floating-Point Operations。傳統(tǒng)的處理器設(shè)計(jì)只有64Bit的SIMD interger arithmetic及Floating-Point Operations,因此在執(zhí)行128Bit的SSE、SSE2及SSE3指令時(shí),需要把指令分拆為兩個(gè)64Bit指令,并需要兩個(gè)時(shí)脈周期完成,但Core微架構(gòu)則只需要一個(gè)時(shí)脈調(diào)期便能完成,執(zhí)成效率提升達(dá)一倍,現(xiàn)時(shí)SSE指令集已經(jīng)十分普遍地用于主流的軟件中,包括繪圖、影像、音像、加密、數(shù)學(xué)運(yùn)算等用途,單周期128Bit處理器能力以時(shí)脈以外的方法提升效能,令處理器擁有高能源效益表現(xiàn)。
  以下測(cè)試數(shù)據(jù)來(lái)自于GamePC網(wǎng)站,測(cè)試選擇的是一顆Xeon 5140處理器,屬于已發(fā)布的Woodcrest中比較主流的產(chǎn)品,頻率2.33GHz,4MB L2緩存,支持1333MHz FSB。
 
{imageTitle}
 
{imageTitle}
 
 Xeon 5140處理器
 
{imageTitle}
 
 系統(tǒng)空閑時(shí)降頻到2GHz以降低功耗
 
{imageTitle}
 
 CPU-Z已經(jīng)可以很好的識(shí)別
 
  Woodcrest核心Xeon 5100系列處理器,相比不久前發(fā)布的Xeon 5000系列,在很多方面都有不同。接口上,兩者同為L(zhǎng)GA771,但5100系列是基于新的Core微架構(gòu),功耗更低,L2緩存智能共享,并且支持1333MHz FSB。
 
{imageTitle}
 
  以上是Intel Xeon系列處理器roadmap,其中也表明了各代在規(guī)格上的區(qū)別。在2007年初,Intel將發(fā)布四核心處理器。
● 測(cè)試平臺(tái)
 
{imageTitle}
 
{imageTitle}
 
{imageTitle}
 
{imageTitle}

  以上是這次測(cè)試的平臺(tái)信息,包括了Xeon 5100系列、Xeon 5000系列以及AMD Opteron系列。以下是測(cè)試成績(jī)?nèi)∽訥amePC網(wǎng)站,只供讀者參考,并不代表泡泡網(wǎng)觀點(diǎn)。

{imageTitle}
 
{imageTitle}

  總體來(lái)看,Xeon 5100系列相比Xeon 5000系列在功耗和性能方面都有不錯(cuò)的改進(jìn),體現(xiàn)出了非常高的性能/功耗比,但相比AMD Opteron來(lái)說(shuō),似乎優(yōu)勢(shì)并不大,在許多項(xiàng)目中還是落后。AMD即將在8月1日發(fā)布新一代Socket F Opteron處理器,其在各方面都會(huì)有所突破,屆時(shí)Intel將面臨更大的挑戰(zhàn)。<

0人已贊

關(guān)注我們