性能之王還是不進(jìn)反退,Prescott全
首先是參數(shù)測試部分,這一部分我們將從大家已經(jīng)熟悉的sissoftsandra2004測試開始。
該部分的測試主要由考核CPU數(shù)學(xué)計(jì)算性能的Drystone、Whiestone,考核CPU多媒體數(shù)據(jù)處理性能、內(nèi)存帶寬性能以及緩存——內(nèi)存系統(tǒng)傳輸帶寬四大部分組成。我們分別在打開超線程和關(guān)閉超線程的情況下作了測試,以下為前三項(xiàng)測試的詳細(xì)結(jié)果:
由前三項(xiàng)測試結(jié)果可見,受到流水線深度的制約,相比Northwood來說,Prescott在SisoftSandra中的表現(xiàn)只能說是差強(qiáng)人意,多數(shù)情況下都不如Northwood的表現(xiàn)。它僅在內(nèi)存帶寬測試中與Northwood持平。
而Athlon64 3200+則由于不支持超線程和雙通道模式,因此在前面兩項(xiàng)超線程處理器占了便宜的測試中落后。同時在內(nèi)存持續(xù)帶寬的測試中AMD和Intel錯開了較大的差距。但是由于Athlon64內(nèi)置的內(nèi)存控制器極大地減小了內(nèi)存?zhèn)鬏斞舆t,對于單通道內(nèi)存配置的系統(tǒng)來說,這樣的成績可以說是相當(dāng)不錯的了。
至于緩存——內(nèi)存系統(tǒng)傳輸帶寬,為了對比方便,我們根據(jù)SisoftSandra 2004的測試結(jié)果,繪制了下面的圖表。對于P4系列處理器,該項(xiàng)測試僅在超線程狀態(tài)下進(jìn)行。
Sissoftsandra2004緩存——內(nèi)存帶寬測試(點(diǎn)擊放大)
與上面的內(nèi)存持續(xù)帶寬測試不同,此項(xiàng)測試可考核一級緩存、二級緩存以及內(nèi)存的數(shù)據(jù)傳輸帶寬。在測試前部,數(shù)據(jù)塊尺寸較小,可以被一級緩存所容納,此時的數(shù)據(jù)傳輸主要依靠一級緩存進(jìn)行;隨著數(shù)據(jù)塊尺寸的進(jìn)一步增大,超出一級緩存的容量后,就必須依靠二級緩存進(jìn)行存儲;到測試的尾部,數(shù)據(jù)塊的尺寸增加到1M以上,就只能通過內(nèi)存來存儲如此大尺寸的數(shù)據(jù)塊了。通過這種逐級加大數(shù)據(jù)塊尺寸的方法,就可以測試出處理器里一級緩存、二級緩存以及內(nèi)存的傳輸帶寬。
在此項(xiàng)測試中,三款處理器的存儲子系統(tǒng)帶寬,呈現(xiàn)出形態(tài)各異的三條曲線。
◎ 在考核一級緩存數(shù)據(jù)傳輸帶寬的測試前部,Prescott處理器與Northwod雖然一級緩存工作頻率、傳輸位寬相同,但是由于前者的一級數(shù)據(jù)緩存為后者的2倍,緩存延遲有所增加,因此持續(xù)帶寬也隨之下降,但容量上的改變也帶來了在8-16KB區(qū)域的領(lǐng)先。而AMD處理器盡管一級緩存容量為64KB,遠(yuǎn)遠(yuǎn)大于Prescott的16KB和Northwood的8KB,但由于工作頻率較低,因此雖然在64KB之前的數(shù)據(jù)傳輸帶寬變化比較平緩,但在數(shù)值上仍然遠(yuǎn)低于P4系列。
◎ 在考核二級緩存數(shù)據(jù)傳輸帶寬的測試中部,由于類似的原因,Prescott處理器與Northwod雖然二級緩存工作頻率、傳輸位寬相同,但是由于前者的二級數(shù)據(jù)緩存為后者的2倍,緩存延遲有所增加,因此持續(xù)帶寬也隨之下降,但容量上的改變也帶來了在512KB—1M區(qū)域的領(lǐng)先。在此區(qū)域中,Athlon64 3200+除了憑借比Northwood大一倍的二級緩存容量,而在大數(shù)據(jù)塊區(qū)領(lǐng)先Northwood外,其余部分由于受頻率、位寬限制,表現(xiàn)并不令人滿意。
◎ 在測試的尾部,3套系統(tǒng)都必須動用內(nèi)存來存儲數(shù)據(jù)了,由于平臺相同,因此兩塊P4處理器的尾部曲線重合在一起;而Athlon64 3200+則由于僅為內(nèi)存單通道,因此在這部分中繼續(xù)落后。
ScienceMark 2.0是一款多功能的軟件,可以進(jìn)行科學(xué)計(jì)算測試,也可用于存儲子系統(tǒng)的帶寬、延遲測試。本次測試沒用啟用此軟件的全部功能,而主要使用存儲子系統(tǒng)測試模塊進(jìn)行3款處理器存儲子系統(tǒng)的延遲性能測試。測試結(jié)果如下:
| 一級緩存 | 二級緩存 | 內(nèi)存 | |||
延 遲周 期 | 納秒 | 延 遲周 期 | 納秒 | 延 遲周 期 | 納秒 | |
P4 3.2E | 4 | 1.25 | 26 | 8.11 | 210 | 65.47 |
P4 3.2C | 2 | 0.62 | 19 | 5.92 | 204 | 63.6 |
A64 3200+ | 3 | 1.49 | 16 | 7.96 | 85 | 42.29 |
測試結(jié)果表明,Prescott處理器緩存系統(tǒng)的傳輸延遲,相比Northwood有所提高,其一級緩存、二級緩存?zhèn)鬏斞舆t均有較大的增加。而Athlon64 3200+則由于工作頻率低,因此其一級、二級緩存的延遲為三款處理器之最;但由于使用了內(nèi)置的內(nèi)存控制器,因此內(nèi)存?zhèn)鬏斞舆t非常之小,相比P4明顯占優(yōu)。這樣,在內(nèi)存零星數(shù)據(jù)的存取上,Athlon64 3200+將體現(xiàn)出一定的優(yōu)勢。
Prescott在Linpack測試中的表現(xiàn)(點(diǎn)擊放大)
◎ 在測試的前部,矩陣尺寸較小,只需要存儲在一級緩存中既可,此時處理器的浮點(diǎn)運(yùn)算能力(每秒百萬次浮點(diǎn)運(yùn)算數(shù)目——MFLOPS)不會受到二級緩存、內(nèi)存延遲的干擾,能夠得到充分的體現(xiàn)。從這部分曲線,我們可以看到Athlon64 3200+的浮點(diǎn)性能表現(xiàn)不錯。反觀Prescott,雖然采取了一些措施,但由于流水線級數(shù)的增加,處理此類浮點(diǎn)運(yùn)算的性能有所下降,因此在Linpack中表現(xiàn)仍然落后于Northwood不少。
◎ 在測試的中后部,矩陣尺寸增加了,必須使用二級緩存乃至內(nèi)存來進(jìn)行矩陣數(shù)據(jù)的傳輸,本可繼續(xù)保持上升勢態(tài)的Athlon64 3200+曲線,在超過64KB(等于Athlon64 3200+的一級數(shù)據(jù)緩存容量)部分的曲線區(qū)域,由于受到二級緩存性能的制約,而未能如P4處理器那樣繼續(xù)上升,而是急劇下降;反觀P4處理器,顯然在二級緩存性能上優(yōu)于Athlon64 3200+,在很長的范圍內(nèi),曲線都保持了上升勢態(tài)。尤其是Prescott,雖然在峰值上劣于Northwood,但由于增加了二級緩存的容量,因此在512KB之后的測試中優(yōu)勢明顯。<
關(guān)注我們
