四核白刃戰(zhàn)!AMD 45nm羿龍全方位評測
● 回顧:從65nm羿龍說起
Phenom 命名:K8 Athlon時代開始,AMD的處理器中文品牌就固定為“X龍”形式,包括Athlon速龍、Sempron閃龍、Duron毒龍、Opteron皓龍、Turion炫龍等。在迎接K10系列的過程中,AMD為其桌面家族加入了一個新的Phenom品牌,而中文名則延續(xù)傳統(tǒng)慣例,命名為羿龍。
Phenom名字公布后,很多人按照英文發(fā)音猜測AMD可能會將中文名定為頗有氣勢的飛龍,但最終AMD專門創(chuàng)造了羿龍這么一個更具古典深意的新名字。據(jù)悉,羿龍的“羿”取自中國古老神話“后羿射日”的典故,象征著挑戰(zhàn)極限、超越夢想,更重要的是,“后羿射日”代表了傳統(tǒng)中國文化取向,有一種浪漫英雄主義的情結(jié)映在其中。這不論對于AMD中國,還是消費(fèi)者,都是一種與生俱來的向往和追求。
◎ 1. TLB臭蟲令Phenom遭受困擾
TLB bug....這是Phenom上市之初的一大困擾。 AMD承認(rèn)在B2的Phenom中存在一個臭蟲,B2版就是2007年發(fā)售的所有Phenom,這個Bug被AMD標(biāo)示為「勘誤298」,俗稱TLB臭蟲。 TLB(Translation Lookaside Buffer)是CPU內(nèi)部管理記憶體的緩存,大意是在存取TLB特定位址的資料時會產(chǎn)生一個空窗,于是在L3緩存寫入錯誤的資料,可能會在四核心完全滿載時造成系統(tǒng)當(dāng)機(jī)。
新版的BIOS都會有這個「Patch AMD TLB Erratum」的選項,開啟就是用BIOS修正,有些主機(jī)板可能為了100%的穩(wěn)定性,會強(qiáng)制開啟并隱藏這個選項。AMD通過BIOS來修復(fù)這個存在的錯誤,其BIOS設(shè)計思路就是讓TLB不在緩存中查找頁面表,這樣可以避免出現(xiàn)TLB延遲,但會使得內(nèi)存延遲大大提升,很顯然的這主要是由于內(nèi)存對頁面表的訪問次數(shù)要明顯增加,于是話延遲自然就會提升。
其實(shí)當(dāng)AMD發(fā)布BIOS修復(fù)程序的時候,很多人都已經(jīng)測試過會對系統(tǒng)性能的影響,其影響其實(shí)還是比較大的,為了給人一個直觀的感受,我們給出以下的簡單測試,測試的時候我們通過Everest的Cache&Memory Benchmark測試來進(jìn)行內(nèi)存性能的比對,測試處理器為B2版的Phenom X4 9600處理器,分別是啟用TLB-Patch和關(guān)閉TLB-Patch后的效率和B3版的Phenom X4 9850處理器效率:
B2版的Phenom處理器TLB-Patch關(guān)閉
B2版的Phenom處理器TLB-patch開啟
B3版的Phenom處理器解決TLB BUG問題
從以上的對比很容易看到,在啟用這個補(bǔ)丁之后,內(nèi)存的延遲增加了50%左右,從原來的58.1ns提升到了90.2ns,這也導(dǎo)致內(nèi)存性能的全面降低,無論是讀取、寫入還是拷貝效率都有一定的損失,并且從以往的測試來看,開啟這個補(bǔ)丁之后,在實(shí)際性能中會有10-30%左右的效率降低。
很顯然,內(nèi)存延遲被很好的控制在同B2步進(jìn)不開啟TLB補(bǔ)丁的情況下,由于有一個需要從L2緩存拷貝頁面表到L3緩存的過程,這個過程勢必會影響一定系統(tǒng)的性能,但會比較小,而實(shí)際測試的情況也是如此,修正后的B3步進(jìn)處理器的測試成績,內(nèi)存延遲只是增加了0.6ns,這個差異已經(jīng)是非常小的了。最終在內(nèi)存性能上的影響大約只有1%左右。而這個差異顯然是容易被人接受的。
就因為AMD Phenom 9x00系列處理器出現(xiàn)了TLB bug問題,AMD的工程師為的修復(fù)這個臭名昭著的TLB錯誤花費(fèi)了大約半年時間才拿出了B3步進(jìn)的修正這個錯誤的新版本,使得AMD發(fā)布時間大幅度延期。B3版本改變先從處理器的名稱開始,Phenom 9x00系列處理器徹底更名為Phenom 9x50,采用全新B3步進(jìn),而且仍然會采用K10架構(gòu)Agena核心。全新的B3修復(fù)版Phenom 9x50處理器將不存在TLB bug問題,但是也與對手在產(chǎn)品進(jìn)度上拉開了差距,一子錯滿盤皆落索!
關(guān)注我們
