三通道+DDR3能普及嗎?內(nèi)存變革進(jìn)行時(shí)
內(nèi)存(memory),作為協(xié)調(diào)CPU和存儲間的中轉(zhuǎn)站,一直在系統(tǒng)中扮演著重要角色。硬件領(lǐng)域的幾次整體架構(gòu)升級,都和內(nèi)存有著莫大的關(guān)系,無論是SDRAM到DDR,再從DDR到DDR2,以及即將普及的DDR3,升級的本質(zhì)都是為了提高內(nèi)存帶寬,可見內(nèi)存對系統(tǒng)性能的有著至關(guān)重要的作用。
談到內(nèi)存架構(gòu)升級,不得不提及Intel,也許有些人會說,intel不就是個(gè)造CPU的廠商嗎?和內(nèi)存有什么關(guān)系!在硬件領(lǐng)域中,也許只有intel這樣一個(gè)廠商可以推行根據(jù)自身發(fā)展需要推行硬件設(shè)備的新規(guī)范新標(biāo)準(zhǔn)。大多情況下,在intel的領(lǐng)導(dǎo)下,整個(gè)硬件產(chǎn)業(yè)都要跟隨intel的腳步前進(jìn)。
看看我們現(xiàn)在常見的硬件規(guī)范,從大家常見的USB,SATA2,PCI-E標(biāo)準(zhǔn),哪個(gè)不是英特爾力主的,現(xiàn)今PC上的硬件標(biāo)準(zhǔn)幾乎都是intel設(shè)計(jì)的,其它廠商不過是跟隨和生產(chǎn)而已。不過內(nèi)存的規(guī)范上,intel失敗過,也許是僅有的一次失敗——DDR內(nèi)存標(biāo)準(zhǔn)(下文中會對此進(jìn)行說明),此后,intel再沒有給別人機(jī)會,DDR2就是在intel的領(lǐng)導(dǎo)下推廣開來,而現(xiàn)在,隨著集成了支持DDR3內(nèi)存控制器的nehalem即將發(fā)布,內(nèi)存的架構(gòu)也會掀開新的一頁!
CPU中集成內(nèi)存控制器,是一把雙刃劍,雖然能提高系統(tǒng)的性能,主要是降低系統(tǒng)延時(shí),但CPU的頻率提升因此變得很難,還有不小的制造成本。也正因此,集成內(nèi)存控制器一直是個(gè)大家樂于討論的問題,孰優(yōu)孰劣,一直爭論不休。不可否認(rèn)的是,當(dāng)AMD集成內(nèi)存控制器,并通過HT總線連接系統(tǒng)的時(shí)候,已經(jīng)縮小與Intel之間的技術(shù)差距。
在AMD推出集成內(nèi)存控制器近5年后,英特爾終于將推出了集成內(nèi)存控制器的CPU,而為了壓制競爭對手,保持技術(shù)領(lǐng)先者的姿態(tài),一上來就引入了3通道DDR3,引領(lǐng)內(nèi)存帶寬達(dá)到新的高度。
根據(jù)英特爾的資料,Nehalem的內(nèi)存控制器為Integrated Memory Controller,簡稱IMC。規(guī)格上支持三通道DDR3內(nèi)存,初期最高支持到1333MHz,不過像個(gè)別一線廠商的高端主板支持oc到1600MHz的規(guī)格。同時(shí),IMC支持亂序讀取可以有效降低延遲,而且每通道均可獨(dú)立運(yùn)行,無疑在一定程度上提高了兼容性問題。但稍感遺憾的是,Intel似乎沒有照顧低端用戶的意思,IMC僅支持目前價(jià)格昂貴的DDR3。
●FSB生命進(jìn)入倒計(jì)時(shí),學(xué)會生活在QPI時(shí)代
當(dāng)我們習(xí)慣了FSB——前端總線(Front SIDE Bus,簡稱FSB),面對QPI時(shí)代的到來,以后再談?wù)揅PU連接到北橋芯片的總線時(shí),QPI將是一個(gè)嶄新的朋友,作為取代FSB,成為新一代CPU和CPU、CPU與芯片組(CPU與內(nèi)存)之間的連接總線,QuickPath Interconnect(簡稱QPI)的總線技術(shù),Nehalem成為了推動FSB生命終結(jié)的死亡使者。
讓FSB去死的關(guān)鍵理由,就是總也喂不飽內(nèi)存所需要帶寬,即使是配備再強(qiáng)的CPU,將前端總線頻率超至新高,用戶也不會明顯感覺到計(jì)算機(jī)整體速度的提升。即使是弱小的phenomX4,也依靠HT總線技術(shù)縮小其與酷睿2 yorkfield的性能差距,所以說QPI的誕生具有革命性的意義。
小提示:目前Intel處理器主流的前端總線頻率有800MHz、1066MHz、1333MHz幾種,進(jìn)入2007年后,Intel在11月又將處理器前端總線提升至1600MHz(默認(rèn)外頻400MHz),這比2003年最高端的800MHz FSB總線頻率整整提升了一倍。這樣高的前端總線頻率,其帶寬有多大呢?前端總線為1333MHz時(shí),處理器與北橋之間的帶寬是10.67GB/s,而提升到1600MHz能達(dá)到12.80GB/s,增加了20%。
在測試3通道內(nèi)存性能前,筆者有必要介紹下內(nèi)存的發(fā)展史。DDR內(nèi)存作為近十年來最為重要的內(nèi)存技術(shù),想當(dāng)初,一個(gè)傳奇版的技術(shù)差點(diǎn)就被intel扼殺在搖籃中,要不是當(dāng)年鼎盛時(shí)期的威盛力主和當(dāng)時(shí)低下的生產(chǎn)工藝,也許現(xiàn)在我們使用的內(nèi)存就將不是DDRX(X=1、2、3、4),而是Rambus以及后續(xù)產(chǎn)品了。
當(dāng)時(shí)的電腦系統(tǒng)中,內(nèi)存帶寬是除硬盤外的最大瓶頸,各芯片級廠商也共商提高內(nèi)存性能的方法,一方是以威盛為代表的守舊派,一方是以革新內(nèi)存架構(gòu)的intel。當(dāng)時(shí)的局面類似于HDDVD于blu-ray的對決,但結(jié)果卻是截然相反的。
以更先進(jìn)技術(shù)出現(xiàn)的Rambus雖然看上去很好,但是授權(quán)費(fèi)和內(nèi)存芯片廠初期的建廠成本導(dǎo)致的高價(jià)格,以及威盛主流芯片組的大賣特賣,將Rambus推向深淵,最終intel也不得不放棄Rambus轉(zhuǎn)而支持DDR內(nèi)存。可以說,現(xiàn)在內(nèi)存技術(shù)的發(fā)展方向,和當(dāng)時(shí)威盛芯片組有很大關(guān)系,但也正是基于此,得罪了intel,為日后的失敗種下了禍根。在intel取消芯片技術(shù)交差授權(quán)后,nvidia在芯片組領(lǐng)域的崛起(AMD平臺),現(xiàn)在的威盛不得不在其它領(lǐng)域謀求發(fā)展。
小貼士:DDR-SDRAM:DDR SDRAM(Double Data Rate DRAM)或稱之為SDRAMⅡ,由于DDR在時(shí)鐘的上升及下降的邊緣都可以傳輸資料,從而使得實(shí)際帶寬增加兩倍,大幅提升了其性能/成本比。就實(shí)際功能比較來看,由PC133所衍生出的第二代PC266 DDR SRAM(133MHz時(shí)鐘×2倍數(shù)據(jù)傳輸=266MHz帶寬),不僅在InQuest最新測試報(bào)告中顯示其性能平均高出Rambus 24.4%,在Micron的測試中,其性能亦優(yōu)于其他的高頻寬解決方案,充份顯示出DDR在性能上已足以和Rambus相抗衡的程度。
傳輸模式:傳統(tǒng)SDRAM采用并列數(shù)據(jù)傳輸方式,Rambus則采取了比較特別的串行傳輸方式。在串行的傳輸方式之下,資料信號都是一進(jìn)一出,可以把數(shù)據(jù)帶寬降為16bit,而且可大幅提高工作時(shí)鐘頻率(400MHz),但這也形成了模組在數(shù)據(jù)傳輸設(shè)計(jì)上的限制。也就是說,在串接的模式下,如果有其中一個(gè)模組損壞、或是形成斷路,便會使整個(gè)系統(tǒng)無法正常開機(jī)。因此,對采用Rambus內(nèi)存模組的主機(jī)板而言,便必須將三組內(nèi)存擴(kuò)充插槽完全插滿,如果Rambus模組不足的話,只有安裝不含RDRAM顆粒的中繼模組(Continuity RIMM Module;C-RIMM),純粹用來提供信號的串接工作,讓數(shù)據(jù)的傳輸暢通。
DDR2比DDR有哪些改變
|
DDR |
DDR 2 |
目前最高時(shí)鐘頻率(單位MHz) |
533(非標(biāo)準(zhǔn)) |
1066(非標(biāo)準(zhǔn)) |
數(shù)據(jù)帶寬(GB/s) |
4.26GB/s |
8.5GB/s |
芯片封裝 |
TSOP Ⅱ |
FBGA等 |
工作電壓 |
2.5V |
1.8V |
最高物理Bank |
8 |
4 |
最高邏輯Bank |
4 |
8 |
數(shù)據(jù)預(yù)取(bit) |
2 |
4 |
通過上面的表格,很明顯,DDR 2的工作電壓比DDR低近30%,功耗也能相應(yīng)下降大約50%了。采用FBGA等CSP方式封裝,減小了模組尺寸,并提高信號完整性,它增加了各模塊之間的空氣流動空間因而提高了熱性能和可靠性。綜合來看,更容易達(dá)到最高的頻率。目前廠商等不及動作太慢的JEDEC,自行推出了DDR 1066的產(chǎn)品。這種產(chǎn)品單條即有8.5GB/s的帶寬,相當(dāng)于雙通道DDR 533。
由于核心頻率和外部頻率的倍進(jìn)關(guān)系,而我們又是以外部頻率作為衡量內(nèi)存時(shí)鐘頻率的標(biāo)準(zhǔn),因此同頻DDR 2內(nèi)存和DDR內(nèi)存相比,數(shù)據(jù)傳輸率是一樣的,當(dāng)然,僅僅是頻率上的提升,頂多算個(gè)“DDR.改”,談不上“DDR 2”。DDR 2的重大改進(jìn)之處就在于數(shù)據(jù)預(yù)取從DDR的2bit提升為4bit。所謂2bit預(yù)取,可以理解為內(nèi)存核心向外部I/O緩沖傳遞一次數(shù)據(jù),可供外部I/O傳輸兩次的量。而4bit預(yù)取,就是內(nèi)存核心向外部I/O緩沖傳遞一次數(shù)據(jù),可供外部I/O傳輸4次的量。
我們知道,內(nèi)存芯片的頻率也有芯片核心頻率和外部頻率兩種:在DDR時(shí)代,這兩個(gè)頻率是相同的;但在DDR 2時(shí)代,核心頻率就變成了外部頻率的一半。這是為什么呢?因?yàn)镈DR的2bit預(yù)取,核心一次傳輸?shù)臄?shù)據(jù)可供外部I/O緩沖傳輸2次,而數(shù)據(jù)以DDR方式傳輸,數(shù)據(jù)傳輸是CLK時(shí)鐘的上下沿觸發(fā),因此外部時(shí)鐘頻率與核心頻率保持一致。而4bit預(yù)取就不一樣了,核心一次傳輸數(shù)可供外部I/O緩沖傳輸4次,同樣使DDR方式傳輸,外部頻率也要是核心頻率的兩倍才行。
除了4bit預(yù)取,DDR 2還有一些重大改進(jìn),例如片上終結(jié)ODT,將DDR時(shí)代設(shè)計(jì)在主板上的終結(jié)器改為設(shè)計(jì)到內(nèi)存條上
這樣一來,問題就出現(xiàn)了。因?yàn)橥獠款l率才是內(nèi)存數(shù)據(jù)傳輸品頻率的基準(zhǔn),我們平時(shí)說的內(nèi)存的頻率都是指其外部頻率,除非不以DDR方式工作,否則當(dāng)預(yù)取數(shù)據(jù)超過外部I/O緩沖和MCH芯片一次DDR傳輸量,內(nèi)存芯片核心頻率就必須降低。
因此,盡管是4bit預(yù)取,但與同頻率DDR內(nèi)存相比,DDR 2內(nèi)存的數(shù)據(jù)帶寬是一樣的。并且,由于核心頻率和外部時(shí)鐘頻率的這種倍進(jìn)關(guān)系,造成一個(gè)時(shí)鐘周期等待時(shí)間更長。也就是俗稱的“DDR 2高延遲”。隨著頻率的提升,這種延遲會變得越來越明顯。
盡管延遲略高,DDR 2和同頻DDR內(nèi)存比較實(shí)際應(yīng)用中差別很小一度有傳言說,DDR 2性能不如DDR,這其實(shí)是一種誤解。在頻率相同的情況下,DDR 2內(nèi)存確實(shí)有部分性能不如DDR內(nèi)存,例如專門的內(nèi)存測試項(xiàng)和部分整數(shù)運(yùn)算性能,但這種差異很小很小,在游戲里更是幾乎沒有差別。
而隨著頻率的提高,DDR 2高頻高帶寬的優(yōu)勢體現(xiàn)無疑,DDR也就533MHz到頭了。所以,在現(xiàn)有的主流內(nèi)存里,DDR 2內(nèi)存性能更強(qiáng)是肯定的。只不過確實(shí)由于Intel強(qiáng)推,讓剛進(jìn)入成熟期的DDR內(nèi)存提前退出了主流市場,讓很多玩家感到不滿而已。
● DDR3集萬千寵愛搶班奪權(quán)
1. 8bit預(yù)取設(shè)計(jì),而DDR2為4bit預(yù)取。
相對于DDR2內(nèi)存的4bit預(yù)取機(jī)制,DDR3內(nèi)存模組最大的改進(jìn)就是采用了8bit預(yù)取機(jī)制設(shè)計(jì),也就是內(nèi)部同時(shí)并發(fā)8位數(shù)據(jù)。在相同Cell頻率下,DDR3的數(shù)據(jù)傳輸率是DDR2的兩倍。這樣DRAM內(nèi)核的頻率只有接口頻率的1/8,DDR3-800的核心工作頻率只有100MHz,當(dāng)DRAM內(nèi)核工作頻率為200MHz時(shí),接口頻率已經(jīng)達(dá)到了1600MHz。而當(dāng)DDR3內(nèi)存技術(shù)成熟時(shí),相信有實(shí)力的內(nèi)存廠商將推出DDR3-2000甚至2400的頻率更高的內(nèi)存。
內(nèi)存規(guī)格對比表
2. 采用點(diǎn)對點(diǎn)的拓樸架構(gòu),以減輕地址/命令與控制總線的負(fù)擔(dān)。
這是為了提高系統(tǒng)性能而進(jìn)行的重要改動,也是DDR3與DDR2的一個(gè)關(guān)鍵區(qū)別。在DDR3系統(tǒng)中,一個(gè)內(nèi)存控制器只與一個(gè)內(nèi)存通道打交道,而且這個(gè)內(nèi)存通道只能有一個(gè)插槽,因此,內(nèi)存控制器與DDR3內(nèi)存模組之間是點(diǎn)對點(diǎn)(Point-to-Point,P2P)的關(guān)系(單物理Bank的模組),或者是點(diǎn)對雙點(diǎn)(Point-to-two-Point,P22P)的關(guān)系(雙物理Bank的模組),從而大大地減輕了地址/命令/控制與數(shù)據(jù)總線的負(fù)載。而在內(nèi)存模組方面,與DDR2的類別相類似,也有標(biāo)準(zhǔn)DIMM(臺式PC)、SO-DIMM/Micro-DIMM(筆記本電腦)、FB-DIMM2(服務(wù)器)之分,其中第二代FB-DIMM將采用規(guī)格更高的AMB2(高級內(nèi)存緩沖器)。
3. 采用100nm以下的生產(chǎn)工藝,將工作電壓從1.8V降至1.5V,在DDR3系統(tǒng)中,對于內(nèi)存系統(tǒng)工作非常重要的參考電壓信號VREF將分為兩個(gè)信號,即為命令與地址信號服務(wù)的VREFCA和為數(shù)據(jù)總線服務(wù)的VREFDQ,這將有效地提高系統(tǒng)數(shù)據(jù)總線的信噪等級。
4. 增加異步重置(Reset)與ZQ校準(zhǔn)功能。重置是DDR3新增的一項(xiàng)重要功能,并為此專門準(zhǔn)備了一個(gè)引腳。這一引腳將使DDR3的初始化處理變得簡單。當(dāng)Reset命令有效時(shí),DDR3內(nèi)存將停止所有操作,并切換至最少量活動狀態(tài),以節(jié)約電力。在Reset期間,DDR3內(nèi)存將關(guān)閉內(nèi)在的大部分功能,所有數(shù)據(jù)接收與發(fā)送器都將關(guān)閉,所有內(nèi)部的程序裝置將復(fù)位,DLL(延遲鎖相環(huán)路)與時(shí)鐘電路將停止工作,而且不理睬數(shù)據(jù)總線上的任何動靜。這樣一來,將使DDR3達(dá)到最節(jié)省電力的目的。
● DDR3與DDR2的不同之處
1、邏輯Bank數(shù)量
DDR2 SDRAM中有4Bank和8Bank的設(shè)計(jì),目的就是為了應(yīng)對未來大容量芯片的需求。而DDR3很可能將從2Gb容量起步,因此起始的邏輯Bank就是8個(gè),另外還為未來的16個(gè)邏輯Bank做好了準(zhǔn)備。
2、封裝(Packages)
DDR3由于新增了一些功能,所以在引腳方面會有所增加,8bit芯片采用78球FBGA封裝,16bit芯片采用96球FBGA封裝,而DDR2則有60/68/84球FBGA封裝三種規(guī)格。并且DDR3必須是綠色封裝,不能含有任何有害物質(zhì)。
3、尋址時(shí)序(Timing)
就像DDR2從DDR轉(zhuǎn)變而來后延遲周期數(shù)增加一樣,DDR3的CL周期也將比DDR2有所提高。DDR2的CL范圍一般在2至5之間,而DDR3則在5至11之間,且附加延遲(AL)的設(shè)計(jì)也有所變化。DDR2時(shí)AL的范圍是0至4,而DDR3時(shí)AL有三種選項(xiàng),分別是0、CL-1和CL-2。另外,DDR3還新增加了一個(gè)時(shí)序參數(shù)——寫入延遲(CWD),這一參數(shù)將根據(jù)具體的工作頻率而定。
4、新增功能——重置(Reset)
重置是DDR3新增的一項(xiàng)重要功能,并為此專門準(zhǔn)備了一個(gè)引腳。DRAM業(yè)界已經(jīng)很早以前就要求增這一功能,如今終于在DDR3身上實(shí)現(xiàn)。這一引腳將使DDR3的初始化處理變得簡單。當(dāng)Reset命令有效時(shí),DDR3內(nèi)存將停止所有的操作,并切換至最少量活動的狀態(tài),以節(jié)約電力。在Reset期間,DDR3內(nèi)存將關(guān)閉內(nèi)在的大部分功能,所以有數(shù)據(jù)接收與發(fā)送器都將關(guān)閉。所有內(nèi)部的程序裝置將復(fù)位,DLL(延遲鎖相環(huán)路)與時(shí)鐘電路將停止工作,而且不理睬數(shù)據(jù)總線上的任何動靜。這樣一來,將使DDR3達(dá)到最節(jié)省電力的目的。
5、根據(jù)溫度自動自刷新(SRT,Self-Refresh Temperature)
為了保證所保存的數(shù)據(jù)不丟失,DRAM必須定時(shí)進(jìn)行刷新,DDR3也不例外。不過,為了最大的節(jié)省電力,DDR3采用了一種新型的自動自刷新設(shè)計(jì)(ASR,Automatic Self-Refresh)。當(dāng)開始ASR之后,將通過一個(gè)內(nèi)置于DRAM芯片的溫度傳感器來控制刷新的頻率,因?yàn)樗⑿骂l率高的話,消電就大,溫度也隨之升高。而溫度傳感器則在保證數(shù)據(jù)不丟失的情況下,盡量減少刷新頻率,降低工作溫度。不過DDR3的ASR是可選設(shè)計(jì),并不見得市場上的DDR3內(nèi)存都支持這一功能,因此還有一個(gè)附加的功能就是自刷新溫度范圍(SRT,Self-Refresh Temperature)。通過模式寄存器,可以選擇兩個(gè)溫度范圍,一個(gè)是普通的的溫度范圍(例如0℃至85℃),另一個(gè)是擴(kuò)展溫度范圍,比如最高到95℃。對于DRAM內(nèi)部設(shè)定的這兩種溫度范圍,DRAM將以恒定的頻率和電流進(jìn)行刷新操作。
6、局部自刷新(RASR,Partial Array Self-Refresh)
這是DDR3的一個(gè)可選項(xiàng),通過這一功能,DDR3內(nèi)存芯片可以只刷新部分邏輯Bank,而不是全部刷新,從而最大限度的減少因自刷新產(chǎn)生的電力消耗。這一點(diǎn)與移動型內(nèi)存(Mobile DRAM)的設(shè)計(jì)很相似。
從技術(shù)角度上看,DDR3內(nèi)存確實(shí)比DDR2改進(jìn)不少,自身?xiàng)l件已經(jīng)達(dá)到普及的標(biāo)準(zhǔn)。但是如果要更好的發(fā)展還要外部支持才行。
作為世界內(nèi)存領(lǐng)導(dǎo)型企業(yè),海盜船的領(lǐng)先技術(shù)一次次讓業(yè)界震撼,這次根據(jù)nehalem的架構(gòu)特性對內(nèi)存的特殊需要——高頻低壓,搶先業(yè)界推出i7御用的排裝內(nèi)存條(3根)。
因?yàn)閚ehalem引入了3通道概念,內(nèi)存套裝的描述也發(fā)生了變化,原來的對條、一對等稱謂已不適合。那么3根內(nèi)存我們?nèi)绾畏Q呼呢?海盜船給我們做出了表率,一排、排裝內(nèi)存。 本次海盜船送測了單根2G和單根1G的兩排內(nèi)存,因測試時(shí)間的緊促和系統(tǒng)問題,筆者不得已使用3根單根1G排裝進(jìn)行測試,已避免32bit系統(tǒng)內(nèi)存超過4GB后帶來的性能下降問題。內(nèi)存模組型號為XMS3-1333,默認(rèn)電壓1.5V,延時(shí)為9-9-9-24,單條容量為1024MB,加裝銀灰色鋁質(zhì)散熱片,金手指采用電鍍工藝,PCB為高級的brainpower生產(chǎn)。在內(nèi)存costdown嚴(yán)重的今天,實(shí)屬難能可貴,體現(xiàn)出國際內(nèi)存領(lǐng)導(dǎo)型企業(yè)的風(fēng)采。
根據(jù)nehalem的定位,intel官方說法是初期上市的3款nehalem除了頻率區(qū)別外,新加入的QPI總線帶寬也有差別,以區(qū)別產(chǎn)品的定位。
Core i7 920 |
Core i7 940 |
Core i7 Extreme Edition 965 | |
產(chǎn)品編碼 |
BX80601920 |
BX80601940 |
BX80601965 |
制程 |
45nm |
45nm |
45nm |
接口 |
LGA 1366 |
LGA 1366 |
LGA 1366 |
晶體管數(shù) |
7.31億 |
7.31億 |
7.31億 |
核心線程數(shù) |
4核8線程 |
4核8線程 |
4核8線程 |
主頻 |
2.66GHz |
2.93GHz |
3.2GHz |
二級緩存 |
4x256KB |
4x256KB |
4x256KB |
三級緩存 |
8MB |
8MB |
8MB |
QPI總線 |
4.8GT/s |
4.8GT/s |
6.4GT/s |
內(nèi)存控制器 |
三通道DDR3-1066 |
三通道DDR3-1066 |
三通道DDR3-1066 |
TDP |
130W |
130W |
130W |
售價(jià) |
284美元 |
562美元 |
999美元 |
為了驗(yàn)證QPI總線的性能差別,筆者的測試方案如下,將nehalem的頻率統(tǒng)一設(shè)定在2.66GHz上,比較同頻率下不同QPI帶寬的新跟那個(gè)差異。由于集成內(nèi)存控制器,intel芯片組第一次引入了CMD概念,在同頻下,測試內(nèi)存CMD(1T、2T)間的性能差異。
硬件系統(tǒng)配置 | |
處理器 |
Core i7 Extreme Edition 965 (四核/2.66GHz/4x256KBytes L2/8M L3) Core i7 920 (四核/2.66GHz/4x256KBytes L2/8M L3 |
主板 |
技嘉EX58- extreme |
硬盤 |
西部數(shù)據(jù) velociraptor (300GB, 10,000 RPM, 16M,SATA300) |
內(nèi)存 |
海盜船 TR3X3G1333C9 3X1G DDR3 1333MHz (9-9-9-20 1T) |
顯卡 |
nvidia 9800GTX+ |
電源 |
海盜船 corsair TX1000W |
顯示器 |
ASUS 24寸 |
軟件系統(tǒng)配置 | |
操作系統(tǒng) |
Windows VISTA Ultimate SP1 32BIT |
顯示驅(qū)動 |
nvidia 180.42 |
為了不使測試平臺的其它部分作為瓶頸,選用了技嘉X58-extreme搭配9800GTX+進(jìn)行輔助測試,為了不使內(nèi)存帶寬成為瓶頸,使用海盜船1333排裝組成三通道測試內(nèi)存帶寬,同時(shí)存儲方面使用目前在SATA硬盤中的神器velociraptor,將平臺性能發(fā)揮到最大。
CPU理論運(yùn)算對比測試
◎ SuperPI性能測試
Super PI是由東京大學(xué)Kanada Lab.所制作的一款通過計(jì)算圓周率的來檢測處理器性能的工具,在測試?yán)锩婵梢杂行У姆从嘲–PU在內(nèi)的運(yùn)算性能。在玩家群中,Super PI更是一個(gè)衡量CPU性能的標(biāo)尺之一。
在Super Pi 8M的測試較量中,可以看到QPI對內(nèi)存性能的影響比內(nèi)存延時(shí)大的多,看來3通道內(nèi)存還是對帶寬的敏感性比延時(shí)更強(qiáng)。
◎ EVERST 內(nèi)存性能測試
我們采用了EVERST Ultimate軟件中的內(nèi)存測試項(xiàng)目考驗(yàn)雙款平臺的內(nèi)存性能。這樣可以測試出CPU集成內(nèi)存控制器對內(nèi)存性能的影響。
看到成績結(jié)果后,要具體問題具體分析,在讀取、寫入和拷貝的對比中,對內(nèi)存控制器負(fù)載最低的讀取性能差距較小,性能差異根據(jù)對內(nèi)存控制器負(fù)責(zé)高低決定,負(fù)責(zé)最大的拷貝測試,差異更明顯??傮w上看,QPI對性能的影響比重更大。
◎ Fritz 10 Benchmark 性能測試
這是一款國際象棋測試軟件,但它并不是獨(dú)立存在的,而是《Fritz9》這款獲得國際認(rèn)可的國際象棋程序中的一個(gè)測試性能部分。由于國際象棋的運(yùn)算大致仍舊是依靠電腦CPU的高速處理能力,將每一個(gè)可能的走法以窮舉算法預(yù)測,從中選擇勝算最大的非常好的走法。所以用它來衡量對比不同的PC系統(tǒng)中CPU的多線程運(yùn)算能力也是有參考價(jià)值的。
由于Fritz主要是考驗(yàn)CPU計(jì)算性能的軟件,內(nèi)存在其中所占比重較小,但微弱的差異也能體現(xiàn)出QPI的功能,根據(jù)測試成績比例來看,QPI仍舊比CMD對性能的影響更高。
◎ ScienceMark 性能測試
ScienceMark是一款通過運(yùn)行一些科學(xué)方程式來測試系統(tǒng)性能的工具。主要用于桌面臺式機(jī)和工作站上測試內(nèi)存子系統(tǒng),同時(shí)也用于測試服務(wù)器環(huán)境中的讀寫延時(shí),當(dāng)然,它對內(nèi)存的帶寬及CPU與內(nèi)存控制器之間的速度等也可進(jìn)行測試。
從Sciencemark的測試結(jié)果看,所有成績都在同一水平,看來核心運(yùn)算效率強(qiáng)勁前提下,對內(nèi)存的要求不高。
● DX10游戲CPU性能測試—《孤島危機(jī)》
作為年度DX10游戲巨作Crysis的游戲畫面達(dá)到了當(dāng)前PC系統(tǒng)所能承受的極限,超越了次世代平臺和之前所有的PC游戲,即便是搭配優(yōu)異的顯卡,在采用大分辨率開抗鋸齒的情況下,也只能勉強(qiáng)“瀏覽”游戲。
測試方法:Crysis Demo內(nèi)置了CPU和GPU兩個(gè)測試程序,我們使用CPU測試程序,這個(gè)程序會自動切換地圖內(nèi)的爆炸場景,激烈的爆炸場面嚴(yán)格的考驗(yàn)著CPU渲染性能,運(yùn)行一段時(shí)間得到穩(wěn)定的平均FPS值作為測試依據(jù)。
在低分辨率情況下,顯卡已經(jīng)不是瓶頸,而僅僅在于CPU的運(yùn)算能力。Crysis的兩個(gè)CPU測試場景,得出的結(jié)果表現(xiàn)基本一致。這點(diǎn)就讓人匪夷所思,Nehalem的性能提升是毋容置疑的,但為什么在對硬件要求甚高的crysis中無明顯作用呢?
筆者經(jīng)過測試crysis,再次證明QPI的重要性遠(yuǎn)比內(nèi)存延時(shí)來的高,即使是QPI 6.4GB/s 2T的模式下,性能也比QPI4.8GB/s 1T模式下高出3幀左右。
4組QPI不同設(shè)置下的對比測試到此結(jié)束了,對所有的測試成績進(jìn)行分析對比后,可以得出以下結(jié)論:
-
QPI對提升系統(tǒng)性能有很大幫助,在Sisoftware Sandra理論測試中,帶寬甚至突破了20GB/s大關(guān),雖然實(shí)際應(yīng)用時(shí)不可能達(dá)到如此之高,但帶寬大的好處顯而易見,如同開跑車在山地上和高速公路間的差異。
-
在QPI時(shí)代,QPI的頻率比內(nèi)存延時(shí)對系統(tǒng)性能影響更大,優(yōu)先提升QPI的頻率更加重要。
-
通過QPI,相比之前FSB時(shí)代,對內(nèi)存的體質(zhì)要求有所降低,即使因?yàn)閮?nèi)存體質(zhì)只能工作在2T模式下,只要QPI頻率高,性能也不會削減太多。
intel的每次架構(gòu)升級,都地對電腦系統(tǒng)的結(jié)構(gòu)帶來巨大影響,除了當(dāng)年力挺的Rambus因?yàn)榧夹g(shù)太過先進(jìn),因產(chǎn)能不足失敗外,此后的CPU架構(gòu)升級所帶來的系統(tǒng)部件發(fā)展方向都按照intel的規(guī)劃前進(jìn)。DDR2的普及,和酷睿2的騰空出世有著深遠(yuǎn)關(guān)系。那么,作為全新架構(gòu)的Nehalem,也必將對DDR3的普及產(chǎn)生巨大推動作用!<
關(guān)注我們
