重拾三級(jí)緩存 AMD四核"巴塞羅納"解析
Intel將在下月正式發(fā)布四核處理器,而AMD至少還要等上半年,但這并不意味著在四核處理器的對(duì)決中,AMD就100%會(huì)輸,因?yàn)槠湫乱淮鶮8L相當(dāng)值得期待。今天我們就帶您詳細(xì)了解一下AMD K8L架構(gòu)首款核心Barcelona(巴塞羅納)的情況。
巴塞羅納是西班牙東北部的美麗港市,用其作為新一代處理器的代號(hào),也顯示了AMD的良苦用心。一般來(lái)講,處理器架構(gòu)從概念到實(shí)物出貨,需要經(jīng)過(guò)很長(zhǎng)的周期,所以說(shuō)在K8L架構(gòu)上,AMD肯定已經(jīng)下了大工夫。雖然目前來(lái)看Intel Core微架構(gòu)獨(dú)領(lǐng)風(fēng)騷,但到明年中期四核市場(chǎng)成熟時(shí)鹿死誰(shuí)手,還未可知。
AMD Barcelona四核架構(gòu)圖
Barcelona核心可以說(shuō)是由目前AMD x86-64架構(gòu)上改進(jìn)而來(lái),他和當(dāng)前Opteron的關(guān)系,就好比Core 2與Pentium M一樣。今天我們文章中涉及到的Barcelona細(xì)節(jié)內(nèi)容,出自該核心性能模型小組主導(dǎo)人Ben Sander之口,所以真實(shí)性很高很高。
● 提升浮點(diǎn)運(yùn)算性能
Barcelona不僅是下代工作站/服務(wù)器處理器Opteron的核心,同時(shí)也將是AMD下一代桌面產(chǎn)品的基礎(chǔ),雖然兩者之間會(huì)有些許不同,但設(shè)計(jì)方向應(yīng)該是一致的。所以這一新四核必須滿(mǎn)足以下兩方面的需求。
- 具有超高的科學(xué)計(jì)算性能,具體包括財(cái)務(wù)分析、石油勘探和生物學(xué)計(jì)算等。
- 多媒體編/解碼能力:HD-DVD播放和視頻壓縮等
這兩方面的應(yīng)用交集,可以說(shuō)是對(duì)處理器浮點(diǎn)運(yùn)算能力的要求。在過(guò)去的10年中,軟件已經(jīng)漸漸向SIMD浮點(diǎn)運(yùn)算發(fā)展,所以相對(duì)于過(guò)去的Opteron處理器,AMD這次大幅強(qiáng)化了Barcelona的SSE單元,下面的表格給出了具體的細(xì)節(jié):
新特性 | 當(dāng)前架構(gòu) | |
SSE execution width | 64 bits wide | 128 bits wide |
Instruction fetch bandwidth | 16 bytes/cycle | 32 bytes/cycle |
Data cache bandwidth | 2 x 64 bit loads/cycle | 2 x 128 bits loads/cycle |
L2 cache/memory controller bandwidth | 64 bits/cycle | 128 bits/cycle |
Floating-point scheduler depth | 36 dedicated x 64-bit ops | 36 dedicated x 128-bit ops |
此外SSE MOV指令將可以在浮點(diǎn)"store"管線(xiàn)中執(zhí)行,兩個(gè)SSE操作可以分別在兩個(gè)周期以SSE move方式執(zhí)行。同時(shí),Barcelona還支持非聯(lián)盟加載/執(zhí)行(load/execute)模式,這樣可以使指令的封裝和解碼更加高效。
以上這些變化與Intel Core微架構(gòu)已經(jīng)采用的方式有些類(lèi)似,不知道屆時(shí)SSE高負(fù)載應(yīng)用下,Intel和AMD誰(shuí)的處理器表現(xiàn)更好呢。
● Barcelona核心IPC進(jìn)一步增強(qiáng)
自從Core微架構(gòu)發(fā)布后,人們?cè)絹?lái)越開(kāi)始強(qiáng)調(diào)IPC(instructions per cycle,每周期執(zhí)行的指令數(shù))的重要性,當(dāng)然AMD在Barcelona上也對(duì)這一方面進(jìn)行了加強(qiáng)。和Intel不同的是,AMD并沒(méi)有采用增寬指令管線(xiàn)的方式來(lái)實(shí)現(xiàn),而是用了其他一些方法。

這些增強(qiáng)包括:
- Advanced branch prediction(增強(qiáng)分支預(yù)測(cè)),AMD的工程師們使Barcelona的返回堆棧容量加倍,并且加入了更多的分之歷史位,內(nèi)置了512-entry間接分支預(yù)報(bào)器。
- 32-byte instruction fetch(32字節(jié)指令存取),提高指令存取的效率。
- Sideband stack optimizer(頻帶堆棧優(yōu)化),對(duì)堆棧的處理器進(jìn)行優(yōu)化,使其不浪費(fèi)執(zhí)行單元的位寬。
- Out-of-order load execution(亂序載入執(zhí)行),加強(qiáng)亂序執(zhí)行能力,使L2緩存的延遲達(dá)到最小化。
此外,其他方面的改進(jìn)還包括優(yōu)化TLBs (translation lookaside buffers),額外的快路徑指令和擴(kuò)展位操作和SSE指令等。
● Barcelona中的內(nèi)存帶寬改進(jìn)
AMD通過(guò)以下幾個(gè)方面來(lái)提升Barcelona的內(nèi)存帶寬性能:
處理器核心將擁有完全獨(dú)立的內(nèi)存控制器,這樣可以提供更多的內(nèi)存頁(yè)來(lái)保持打開(kāi)狀態(tài),此外,內(nèi)存控制器將支持48位硬件級(jí)尋址,理論上可以支持256TB的物理內(nèi)存!除了常規(guī)的4KB和2MB頁(yè)尺寸外,AMD這次還拿出了1GB容量的內(nèi)存頁(yè)。
● 重拾三級(jí)緩存架構(gòu)
Barcelona將采用三級(jí)緩存架構(gòu),其中L1緩存容量為64KB,L2緩存容量512KB,L3容量為2MB。L1和L2緩存和以前一樣,為各自的核心獨(dú)立配備,而L3緩存則是所有核心共享使用。在設(shè)計(jì)上,L3緩存的容量是一個(gè)可以變化的數(shù)值,不同的產(chǎn)品將提供不同容量的L3緩存。
AMD表示采用這樣的三級(jí)緩存設(shè)計(jì)架構(gòu),不僅可以在性能上得到提升,同時(shí)也將更有利于配合虛擬化技術(shù)的使用。
新一代處理器上,AMD也對(duì)硬件級(jí)虛擬化進(jìn)行了加強(qiáng),其中最重要的一點(diǎn)變化是虛擬化尋址轉(zhuǎn)移代替了之前的影像分頁(yè),這將進(jìn)一步降低虛擬管理程序操作影像頁(yè)的時(shí)間。
● 電源管理 核心與內(nèi)存控制器分離
人們已經(jīng)開(kāi)始越來(lái)越在乎處理器的功耗水平,在過(guò)去的很長(zhǎng)時(shí)間里,AMD一直在這方面處于領(lǐng)先地位,但是自Intel發(fā)布酷睿2后,這種優(yōu)勢(shì)已經(jīng)不復(fù)存在,AMD希望通過(guò)Barcelona重新奪回失去的光芒。主要的改進(jìn)手段如下:
首先,Barcelona將基于AMD 65nm SOI工藝技術(shù),這將讓處理器的電壓更低,在提升電路密度的同時(shí),熱量輸出不會(huì)提高。處理器本身將和內(nèi)存控制器單獨(dú)供電,這樣在內(nèi)存控制器處于滿(mǎn)載狀態(tài)時(shí),處理器也不會(huì)跟著滿(mǎn)載,提高電源的利用率。
其次,Barcelona還將支持新版本的AMD PowerNow技術(shù),先前PowerNow可以自動(dòng)根據(jù)情況降低處理器頻率,而進(jìn)入多核時(shí)代,新版PowerNow可以對(duì)每個(gè)核心的頻率進(jìn)行控制,當(dāng)只需要一個(gè)核心負(fù)載的時(shí)候,其他三個(gè)核心可以運(yùn)行在很低的頻率上。提醒一句,PowerNow并不會(huì)控制每個(gè)核心的電壓。
AMD表示Barcelona的TDP不會(huì)超過(guò)95W,一個(gè)雙處理器系統(tǒng),加上內(nèi)存、芯 片組功耗應(yīng)該不會(huì)超過(guò)240W這個(gè)水平。
● 厚積薄發(fā) AMD首發(fā)“真”四核
總體來(lái)看,Barcelona并不會(huì)像Intel Core微架構(gòu)相比NetBurst那樣有巨大的改變,但是新一代四核在性能上必然將有不小的提升,但具體的提升幅度,目前還無(wú)從考證。AMD方面目前也沒(méi)有公布過(guò)任何有關(guān)性能的說(shuō)明。
AMD有望在年底前展示基于Barcelona四核處理器的系統(tǒng),實(shí)際的處理器出貨要等到2007年中期,在這之前,我們還無(wú)法了解其性能的高低??梢钥隙ǖ氖?,Barcelona肯定會(huì)比今天的Opteron更快,但與Intel對(duì)比是否有競(jìng)爭(zhēng)力,還是個(gè)問(wèn)號(hào)。
Intel下月將搶先發(fā)布四核處理器
AMD桌面四核也將在明年下半年發(fā)布,這樣來(lái)看,在未來(lái)的6-7個(gè)月里,Intel在四核發(fā)布將保持領(lǐng)先地位。不過(guò)AMD已經(jīng)表示,Intel即將發(fā)布的Kentsfield四核,實(shí)際是將兩顆雙核封裝在一起而成,并不是真“四核”,但不知道消費(fèi)者是否會(huì)在意這個(gè)問(wèn)題。<
關(guān)注我們
