国产成人福利在线视频播放下载,成人无码www免费视频在线看,放荡的美妇在线播放,大地资源网最新更新,国产成人精品日本亚洲网站

泡泡網(wǎng)CPU頻道 PCPOP首頁(yè)      /      CPU     /      評(píng)測(cè)    /    正文

AMD Athlon 64系列終極報(bào)告(上):

    關(guān)心AMD的人應(yīng)該知道,AMD公司舊有的K7處理器Barton、Athlon XP由于EV6前端總線帶寬、處理器核心頻率提升能力不足等問(wèn)題,在性能表現(xiàn)上不及Intel P4系列。

    AMD要想在性能上同Intel繼續(xù)競(jìng)爭(zhēng),必須依靠新的前端總線和處理器核心。為此,AMD公司早在3年前就放出新研制的K8核心處理器及其搭配的X86-64指令集的消息。

    在這3年漫長(zhǎng)的等待過(guò)程中,有關(guān)AMD公司產(chǎn)能有限,將被IBM兼并;AMD應(yīng)用SOI技術(shù)制作新K8處理器時(shí)出現(xiàn)問(wèn)題等流言通過(guò)各路媒介四處傳播開來(lái)。終于在2003年9月中旬,繼推出服務(wù)器平臺(tái)的K8核心Opteron處理器系列之后,AMD排除萬(wàn)難推出了萬(wàn)眾矚目的AMD Athlon 64 FX51(支持雙通道DDR400)和AMD Athlon 64(僅支持單通道DDR400)兩個(gè)系列的桌面處理器,用事實(shí)給那些流言制造者們?cè)蚁铝酥刂氐囊诲N。

    另一方面,針對(duì)Athlon 64系列的推出,Intel慌忙在2003年秋季的IDF論壇拿出了具備多達(dá)2MB三級(jí)緩存容量的P4 3.2GHz Exterem Edition處理器作為應(yīng)對(duì)。稍加注意我們就可以發(fā)現(xiàn),P4 EE同Intel的另一款支持多處理器系統(tǒng)的服務(wù)器CPU——Gallatin 核心的Xeon MP規(guī)格非常相像,甚至可以說(shuō)是Xeon MP去掉對(duì)多處理器支持的簡(jiǎn)化版。由此看來(lái),為了對(duì)付Athlon 64系列,Intel可謂煞費(fèi)苦心。

    那么,讓我們苦苦等待,迫使Intel不惜出動(dòng)“服務(wù)器級(jí)“處理器大動(dòng)干戈的Athlon 64系列究竟有哪些新看點(diǎn)呢?接下來(lái),我們就在此為大家做一番詳盡分析。<

    說(shuō)到K8處理器,大家不免會(huì)想到AMD大肆宣傳的X86-64指令集的概念。而要較為明晰地理解X86-64指令集,就必須從64位處理器的本質(zhì)談起。

● 理解64位指令

    我們都知道,處理器所處理的普通指令一般由操作碼(OP Code)和操作數(shù)(Operand)組成。其中操作數(shù)可以是等待處理的數(shù)據(jù),也可以是待處理數(shù)據(jù)的內(nèi)存地址。而操作碼則描述將要對(duì)操作數(shù)進(jìn)行何種處理。

    需要強(qiáng)調(diào)的是,通常所說(shuō)的64位指令,并不是指指令的全長(zhǎng)或操作碼的長(zhǎng)度為64位,而是指操作數(shù)所能達(dá)到的最大位數(shù)為64位。通過(guò)下面的圖示,我們可以很好地理解64位指令和64位處理器的本質(zhì)。

 64位指令工作原理示意圖

    由于操作數(shù)一般需要存放在通用寄存器中,因此64位處理器通用寄存器的尺寸也必須是64位。這樣我們就很容易理解K8處理器里通用寄存器結(jié)構(gòu)的上半部分(指RAX-RSP部分,下半部分我們后邊再提)。如下圖所示:

  K8通用寄存器的擴(kuò)展,點(diǎn)擊查看詳圖

    從上面的圖示可以看出,相對(duì)于傳統(tǒng)的X86處理器而言,K8在進(jìn)行64位擴(kuò)展的時(shí)侯,把8個(gè)通用寄存器增加到了64位,同時(shí)增加了指令指針寄存器的位數(shù)為64位。

    至于尋址方面,由于地址數(shù)據(jù)只不過(guò)是整數(shù)操作數(shù)中的一種,因此同樣使用GPR。這樣,64位處理器所能處理的地址數(shù)據(jù)長(zhǎng)度自然就增加到了64位,從而大大增加了處理器的尋址空間。

    當(dāng)然,為了簡(jiǎn)化起見,以上我們所說(shuō)的操作數(shù),只不過(guò)是現(xiàn)代CPU所處理的操作數(shù)中的整數(shù)數(shù)據(jù)(地址數(shù)據(jù))。它們由處理器中的ALU(算術(shù)邏輯單元)和AGU(地址生成單元)進(jìn)行處理,一般使用通用寄存器(GPR)來(lái)保存。實(shí)際上,我們還需要處理通常保存在浮點(diǎn)寄存器、MMX以及XMM寄存器里的浮點(diǎn)以及其它多種數(shù)據(jù)。

    不過(guò),在我們進(jìn)一步談這些除了整數(shù)和地址數(shù)據(jù)外其它數(shù)據(jù)類型在64位處理器中的處理狀況前,我們必須首先了解一些有關(guān)寄存器和數(shù)據(jù)類型的基本知識(shí)。

● 寄存器和數(shù)據(jù)類型

    我們知道:整數(shù)、地址、指令指針和浮點(diǎn)數(shù)據(jù)是按照數(shù)據(jù)形式來(lái)劃分的,CPU所要處理的3種主要數(shù)據(jù)類型。此外我們還可以根據(jù)數(shù)據(jù)需要CPU進(jìn)行處理的類型,來(lái)將它們分為標(biāo)量數(shù)據(jù)和矢量數(shù)據(jù)兩大類。

    通常我們把需要CPU進(jìn)行不同處理的單個(gè)數(shù)據(jù)稱為標(biāo)量數(shù)據(jù)(Scala Data)。標(biāo)量數(shù)據(jù)既可以是整數(shù)數(shù)據(jù),也可以是浮點(diǎn)數(shù)據(jù)。其中整數(shù)標(biāo)量數(shù)據(jù)的存放區(qū)一般為通用寄存器(GPR),浮點(diǎn)標(biāo)量數(shù)據(jù)的存放區(qū)一般為浮點(diǎn)寄存器(FPR)。

    與標(biāo)量數(shù)據(jù)相對(duì)的是矢量數(shù)據(jù)(Vector Data)。所謂矢量數(shù)據(jù)就是指一列需要由處理器作相同處理的數(shù)據(jù)集合。比如處理器在做MP3編碼的過(guò)程中,需要對(duì)內(nèi)存中的音頻文件里的各字節(jié)數(shù)據(jù)作相同的MP3編碼操作。那么通常使用MMX或SSE這類單指令多數(shù)據(jù)流(SIMD)指令,將數(shù)個(gè)字節(jié)打包為一組矢量數(shù)據(jù),存放在MMX或SSE寄存器中,再送往相應(yīng)的功能單元進(jìn)行統(tǒng)一操作。

    和標(biāo)量數(shù)據(jù)一樣,這些矢量數(shù)據(jù)既可以是整數(shù)數(shù)據(jù),也可以是浮點(diǎn)數(shù)據(jù)。矢量數(shù)據(jù)以封包的形式批量存放在MMX(對(duì)于使用MMX、3DNow!進(jìn)行操作的數(shù)據(jù)而言)和XMM(對(duì)于使用SSE、SSE2進(jìn)行操作的數(shù)據(jù)而言)寄存器中。

    通過(guò)下面的圖,我們可以更好地了解標(biāo)量數(shù)據(jù)和矢量數(shù)據(jù)的區(qū)別:

 標(biāo)量與矢量數(shù)據(jù)

    以下,我們整理了標(biāo)量數(shù)據(jù)和矢量數(shù)據(jù)在X86-32位處理器以及AMD的X86-64處理器中所用寄存器的具體區(qū)別如下表:

    實(shí)際上,MMX和XMM通過(guò)寄存器映射的方法,也可以參與標(biāo)量浮點(diǎn)數(shù)據(jù)的存儲(chǔ)。同時(shí)數(shù)據(jù)類型也遠(yuǎn)不止整數(shù)、浮點(diǎn)這兩類基本數(shù)據(jù)類型,還包括有指令指針數(shù)據(jù)、BCD數(shù)據(jù),位數(shù)據(jù)等。要把這些情況一一說(shuō)清,顯然不是一兩篇文章能解決得了問(wèn)題的。

    幸好,這些省略的部分與我們的結(jié)論并沒(méi)有影響,因此我們敘述時(shí)使用了簡(jiǎn)化的措施。需要更詳細(xì)完整的資料,您可以參考Intel的IA32以及AMD的X86-64架構(gòu)編程指導(dǎo)書。

    從上表我們可以看見,K8的64位擴(kuò)展部分似乎僅對(duì)于整數(shù)、地址數(shù)據(jù)有效。對(duì)浮點(diǎn)和向量數(shù)據(jù)則仍然保持原樣。

    經(jīng)過(guò)上面的分析,我們似乎可以得出這樣的結(jié)論,那就是:我們能從K8向64位的擴(kuò)展所獲得的好處,只不過(guò)是可以在同樣一條指令中,處理更大數(shù)值的整數(shù)數(shù)值以及管理空間更大的內(nèi)存區(qū)域而已。而在32位的情況下,由于通用寄存器只能容納最大32位的數(shù)據(jù),因此顯然要花費(fèi)更多條指令對(duì)尺寸超過(guò)32位的數(shù)據(jù)進(jìn)行處理。

    這種改進(jìn)對(duì)服務(wù)器、科學(xué)計(jì)算這樣的領(lǐng)域雖然具有一定的意義,但顯然并不是普通家用環(huán)境急需的改進(jìn)。試問(wèn)在近期普通應(yīng)用中,有多少情況下會(huì)用到超過(guò)232這樣大的整數(shù)數(shù)值和超過(guò)4GB的內(nèi)存空間呢?

    然而,如果你因此低估了K8和X86-64指令集的實(shí)力,那就大錯(cuò)特錯(cuò)了。 

    顯然,K8體系不可能只是如我們上面所說(shuō)的那樣,僅僅簡(jiǎn)單地在64位環(huán)境下增加通用寄存器的寬度到64位。X86-64最吸引我們的部分應(yīng)該在于對(duì)傳統(tǒng)X86寄存器“體系”的變革上。

● 寄存器體系的變革

    我們都知道,X86指令集本身屬于一種復(fù)雜指令集(CISC)。長(zhǎng)期以來(lái),使用X86指令集的處理器架構(gòu)一直沿用寄存器結(jié)構(gòu)。相比那些使用精簡(jiǎn)指令集(RISC)的處理器架構(gòu)來(lái)說(shuō),由于程序可見的寄存器數(shù)量較少,因此造成傳輸延遲,性能以及流水線工作效率相對(duì)落后,從而給X86架構(gòu)處理器的表現(xiàn)造成了影響。同時(shí)程序和編譯器的優(yōu)化難度也較大。

    雖然近代的X86處理器中都增加了許多程序不可見的內(nèi)部寄存器,并通過(guò)寄存器換名(Register Rename)技術(shù)變相地增大通用寄存器的數(shù)量,來(lái)彌補(bǔ)這一不足。然而這種措施由于只能通過(guò)處理器的硬件控制來(lái)實(shí)施,程序員無(wú)法根據(jù)需要來(lái),靈活控制實(shí)際的寄存器使用狀況,顯然不如直接增加可見的通用寄存器來(lái)的有效。

    而K8針對(duì)上述問(wèn)題作出了改良。處理器在64位狀態(tài)下工作時(shí),增加了大量的程序員可見寄存器以供編程者使用,如下圖:

  X86-64的寄存器擴(kuò)展(點(diǎn)擊察看大圖)

    可以說(shuō),這些額外增加的寄存器(我們姑且稱之為“寄存器擴(kuò)展“吧),才是真正能為桌面用戶帶來(lái)的好處之所在!

    不過(guò),盡管如此,我們也只能在K8的64位模式下,才能全部用到這些多出來(lái)的寄存器擴(kuò)展資源(紫色部分的寄存器)。因?yàn)闉榱思嫒菀酝腦86指令,K8所用的X86-64指令集將其所支持的指令分成了如下表所示的數(shù)個(gè)部分:

    如上表所見,前面我們所說(shuō)到的令人激動(dòng)的寄存器擴(kuò)展功能,并不是“即插即用“的。它需要我們將操作系統(tǒng)向64位轉(zhuǎn)換,同時(shí)重新按64位的編程規(guī)范編譯應(yīng)用程序。在其它模式下,我們根本無(wú)法享受到這些好處。

    盡管X86-64前途遠(yuǎn)大,不過(guò)古語(yǔ)云:天將降大任于斯人,必先……。以目前X86-64指令集64位擴(kuò)展的各方面支持狀況來(lái)說(shuō),情勢(shì)不容樂(lè)觀。

操作系統(tǒng)的支持

    從操作系統(tǒng)方面來(lái)看,目前除了部分版本的Linux率先支持X86-64位指令集64位擴(kuò)展外,X86-64位指令集64位擴(kuò)展真正走向主流所必不可缺的因素——Microsoft的視窗系列操作系統(tǒng),相關(guān)的正式版卻遲遲未能露面,僅在Athlon 64發(fā)布日匆匆推出了一款WinXP 64-bit beta版。

 如何獲取WinXP 64-bit beta版的官方說(shuō)明(點(diǎn)擊放大)

    同時(shí)系統(tǒng)也僅配用了稍顯老舊的Directx8.1,64位Directx9.0b則根本無(wú)法通過(guò)正常渠道獲取。而通過(guò)上面摘自微軟頁(yè)面的說(shuō)明,我們也可以看到WinXP 64-bit beta版的獲取途徑對(duì)于一款操作系統(tǒng)來(lái)說(shuō),也顯得相當(dāng)另類。這一切,多少令人感覺(jué)有點(diǎn)敷衍了事的意思。

設(shè)備驅(qū)動(dòng)的支持:

    從64位操作系統(tǒng)所必備的64位設(shè)備驅(qū)動(dòng)程序來(lái)看,包括主板、顯卡在內(nèi)的許多重要設(shè)備的64位驅(qū)動(dòng)程序也是猶抱琵琶半遮面,絕大多數(shù)設(shè)備廠商甚至在客服網(wǎng)頁(yè)中也沒(méi)有包含相關(guān)的下載文件,更不要提隨盤附帶64位驅(qū)動(dòng)了。

    在這方面,NVIDIA倒是率先提供了64bit版本的顯示卡驅(qū)動(dòng)程序,算是業(yè)內(nèi)走在前列的廠商了。

● 應(yīng)用軟件的支持

 《UT2004》畫面(點(diǎn)擊放大)

    從64位最終的執(zhí)行者——常用應(yīng)用程序看,目前只有《UT2004》等極少數(shù)游戲宣稱將推出64位版本的游戲。而更多的應(yīng)用軟件廠商則只是表示會(huì)支持,但多數(shù)都沒(méi)有成品64位程序推出。

    正是基于以上的原因,我們此次的評(píng)測(cè),也沒(méi)有添加64位的相關(guān)部分。

    所有這一切,似乎映證著一句俗話:道路是曲折的,前途是光明的。<

    盡管在X86-64的64位擴(kuò)展上,AMD目前遇到了一些推廣方面的阻力。然而作為世界上頂尖的處理器制造廠商之一,AMD仍然具備非凡的實(shí)力。他們的新王牌——K8顯然在常規(guī)32位領(lǐng)域也作足了準(zhǔn)備和Intel繼續(xù)拼殺。這一部分目的的達(dá)成,在失去了指令集的優(yōu)勢(shì)后,就必須更多依賴整個(gè)系統(tǒng)的架構(gòu)以及處理器的核心架構(gòu)。在這個(gè)兩方面,AMD也采取了許多措施,實(shí)現(xiàn)了K8的32位性能相對(duì)K7質(zhì)的飛躍,從而完全具備了同Intel在32位領(lǐng)域一爭(zhēng)高下的強(qiáng)大實(shí)力!

    那么相比之下,K8在系統(tǒng)的架構(gòu)這部分究竟有哪些主要的變動(dòng)呢?下面我們就為大家做一些粗略的分析。
  
● 舊有架構(gòu)的缺陷

    我們都知道:處理器主要同兩類外部設(shè)備進(jìn)行信息交換,其一是內(nèi)存,其二是I/O設(shè)備(包括顯卡、硬盤等等)。對(duì)于桌面系統(tǒng)而言,通常的做法是設(shè)置南北橋兩個(gè)外置芯片,由外置的前端總線連接CPU和北橋,負(fù)責(zé)單個(gè)或多個(gè)CPU同內(nèi)存和I/O設(shè)備的信息傳輸。

    這方面的例子有AMD的上一代K7架構(gòu),如上圖。它采用同為點(diǎn)對(duì)點(diǎn)傳輸?shù)腅V6前端總線技術(shù),前端總線數(shù)據(jù)傳輸率數(shù)據(jù)傳輸率為總線運(yùn)行頻率的2倍,即200×2=400MHz。不過(guò),雖然在處理器與北橋芯片之間使用點(diǎn)對(duì)點(diǎn)傳輸,然而多處理仍然必須共享集成在北橋里的內(nèi)存控制器。

    Intel P4 3.2GHz則仍使用沿襲自P6架構(gòu)的多處理器共享式AGTL+前端總線技術(shù),如上圖。不過(guò),Intel將前端總線數(shù)據(jù)傳輸率提升為總線運(yùn)行頻率的4倍,即200×4=800MHz。多處理器間不僅共享前端總線,同時(shí)還必須共享集成在北橋里的內(nèi)存控制器。

    這兩種辦法存在兩個(gè)主要缺點(diǎn),其一是由于前端總線和內(nèi)存控制器外置,導(dǎo)致CPU同內(nèi)存進(jìn)行數(shù)據(jù)交換時(shí)的延遲較大;其二是由于AGP顯卡等I/O設(shè)備和內(nèi)存一起共享前端總線同單CPU或多CPU交流,特別是在多處理器的環(huán)境下,由于前端總線為多處理器共享,造成前端總線“交通擁擠“,效率不佳。

● 全新架構(gòu)的改良

    因此,新的K8核心處理器使用了全新的北橋架構(gòu),把舊有北橋一分為二,將傳統(tǒng)北橋的內(nèi)存控制器和北橋總線接口內(nèi)置到CPU核心中,而傳統(tǒng)北橋中的AGP控制器以及同南橋進(jìn)行數(shù)據(jù)交換的接口界面則仍然外置。新的北橋架構(gòu)通過(guò)外置Hypertransport總線將北橋的內(nèi)置部分同外置部分的AGP控制器等連接在一起。下面,我們給出傳統(tǒng)系統(tǒng)結(jié)構(gòu)與K8結(jié)構(gòu)的區(qū)別圖如下:

 傳統(tǒng)系統(tǒng)結(jié)構(gòu)與K8結(jié)構(gòu)的區(qū)別圖(點(diǎn)擊放大

    對(duì)于Athlon64、Athlon64 FX51以及Opteron14系列處理器來(lái)說(shuō),內(nèi)置北橋具備一條最大位寬16bit,最大運(yùn)行頻率800MHz的雙向傳輸Hypertransport總線。它同外置的北橋其余部分進(jìn)行連接,峰值帶寬達(dá)到了6.4GB/s,超過(guò)了以前K7系統(tǒng)的3.2GB/s,與Intel P4的6.4GB/s持平。

    雖然數(shù)值上與Intel P4的6.4GB/s持平,但是不要忘記,Hypertransport支持雙向點(diǎn)對(duì)點(diǎn)傳輸,況且從原來(lái)的外置北橋中移走了內(nèi)存部分。而對(duì)于Opteron的其它系列處理器來(lái)說(shuō),這個(gè)連接數(shù)目則增加到3條,使Opteron具備連接多處理器的能力。

    通過(guò)使用新的北橋架構(gòu)和新的總線,改正了舊北橋結(jié)構(gòu)的兩個(gè)主要缺點(diǎn),使處理器同內(nèi)存、外設(shè)接口的性能獲得了較大的提升。<

    說(shuō)到HyperTransport總線,就必須提一提它的靈活多變特性。

    與我們熟悉的傳統(tǒng)前端總線可調(diào)總線運(yùn)行頻率,位寬固定為64bit所不同的是,HyperTransport總線具備傳輸位寬、傳輸頻率可調(diào)的特征。

    雖然Athlon64 FX所具備的HyperTransport總線接口,最大運(yùn)行頻率和上下行總線位寬分別為800MHz——由于HyperTransport總線采用類似DDR內(nèi)存的雙倍數(shù)據(jù)傳輸率的技術(shù),因此其數(shù)據(jù)傳輸率還應(yīng)×2,即為800×2=1600MT/s——和16bit。

    然而實(shí)際應(yīng)用中總線的運(yùn)行頻率和總線位寬都可以作出靈活的變動(dòng)。頻率方面有200/400/600/800MHz等多種選擇。上下行位寬方面也有2/4/8/16bit等多種選擇,同時(shí)上行位寬與下行位寬之間也不必保持一致。具體如下表:

 Hypertransport總線多變的參數(shù)(點(diǎn)擊察看全圖

    這就出現(xiàn)眾多支持K8處理器的外置北橋,各自采用不同的HyperTransport總線運(yùn)行頻率以及不同上下行位寬的混亂局面。這一點(diǎn),請(qǐng)大家在接觸K8平臺(tái)時(shí)要特別注意。在我們的《新多元方程:nForce3 Pro 150技術(shù)解析》一文中,也因此作出了一些錯(cuò)誤的判斷。

    當(dāng)時(shí)我們將NVIDIA公司的K8平臺(tái)芯片組——nForce3 Pro 150的最高運(yùn)行頻率誤判為450MHz,上下行位寬誤判為16/16bit,事實(shí)證明這個(gè)結(jié)論是錯(cuò)誤的。

    為此,我們列出根據(jù)官方聲明更正后的各大廠家生產(chǎn)的K8平臺(tái)北橋芯片組的HyperTransport接口特性,如下表:

    至于最近大家爭(zhēng)論不休的nForce3(Pro)150數(shù)值上顯得較低的3.6GB/s總線峰值帶寬,會(huì)不會(huì)給系統(tǒng)性能造成影響,我們留待后面的評(píng)測(cè)部分為大家揭開謎底。

    除此之外,HyperTransport總線還具備雙向差分傳輸?shù)扰c傳統(tǒng)總線所不同的特殊結(jié)構(gòu)特性。關(guān)于這些特性,在各種媒體中均已經(jīng)有了較為詳盡的闡述,我們?cè)诖司筒辉俣嘌粤恕?/FONT><

    外圍系統(tǒng)架構(gòu)的變革,歸根到底還是為處理器內(nèi)核服務(wù)。如果這一部分不作出改進(jìn),性能上的提升,也只能是一紙空文。

    首先,我們來(lái)看一張K8核心的Athlon64(FX)與K7核心處理器的內(nèi)部架構(gòu)對(duì)比圖:

  

 Athlon64(FX)與K7內(nèi)部架構(gòu)對(duì)比(點(diǎn)擊放大)

    圖中可見,表面上看新的核心和K7相比總體上變化并不大,同樣的3個(gè)負(fù)責(zé)整數(shù)運(yùn)算的ALU、AGU單元,同樣的3個(gè)負(fù)責(zé)浮點(diǎn)、3DNow!等多媒體指令運(yùn)算的浮點(diǎn)單元。如果不考慮新的64位指令執(zhí)行狀況,基本上兩者處理數(shù)據(jù)的流程將非常相似。

    但是較為仔細(xì)地了解了新核心的內(nèi)部結(jié)構(gòu)后,你會(huì)發(fā)現(xiàn)即使對(duì)于32位指令的執(zhí)行來(lái)說(shuō),雖然他和K7相比外貌相似,實(shí)際上還是存在幾處較為明顯的區(qū)別的。

    我們首先從前端的緩存部分入手吧:

● 緩存部分的改進(jìn)

    一級(jí)緩存、二級(jí)緩存部分,Athlon64(FX)同K7核心相比,除了將二級(jí)緩存容量統(tǒng)一提升到1MB,二級(jí)緩存位寬相比K7核心的64bit倍增為128bit之外,并沒(méi)有在結(jié)構(gòu)上作出太大的變動(dòng)。

    然而,CPU中另一類重要緩存――-主管內(nèi)存地址翻譯的TLB的相關(guān)參數(shù),卻在Athlon64(FX)中相對(duì)K7處理器做出了較大的變動(dòng)。

    為了使大家更透徹地理解TLB的參數(shù)變化對(duì)CPU性能的影響,關(guān)于TLB的原理,我們作出如下的簡(jiǎn)要介紹:

    TLB的英文全名為:Translation Lookaside Buffer,我們可以翻譯為旁路轉(zhuǎn)換緩沖,也可以把它理解成頁(yè)表緩沖,因?yàn)樗锩嫫鋵?shí)存放的是一些頁(yè)表文件(虛擬地址到物理地址的轉(zhuǎn)換表)。

    首先我們需要知道的是:TLB和我們熟悉的一級(jí)、二級(jí)緩存并沒(méi)有本質(zhì)的區(qū)別,二者都屬于緩存一類,他們的區(qū)別在于所緩存的內(nèi)容不同。我們知道,同CPU在內(nèi)存中存取數(shù)據(jù)時(shí)先查找一級(jí)、二級(jí)緩存中是否存在所需的數(shù)據(jù)相同;當(dāng)處理器要在內(nèi)存中尋址數(shù)據(jù)時(shí),它也不是直接到內(nèi)存的物理地址里查找的,而是通過(guò)一組虛擬地址轉(zhuǎn)換到主內(nèi)存的物理地址。

    這樣,就需要有一組將虛擬地址和物理地址對(duì)應(yīng)起來(lái)的地址對(duì)應(yīng)表格。通常,這個(gè)表格存放在內(nèi)存中,TLB則負(fù)責(zé)緩存這個(gè)表格中的數(shù)據(jù)。而CPU需要尋址數(shù)據(jù)時(shí),同樣會(huì)優(yōu)先在TLB中查找是否有需要的表格數(shù)據(jù)。這樣,同一級(jí)、二級(jí)緩存尺寸和聯(lián)合路數(shù)對(duì)處理器性能的影響相同,處理器的性能和尋址的命中率,進(jìn)而同TLB的尺寸、聯(lián)合路數(shù)有很大的關(guān)系了。

    對(duì)于尋址空間更大的K8,增加TLB條目數(shù),改變TLB聯(lián)合方式顯然具有更重要的意義。

    回到正題,我們整理了AthlonXP 與Athlon64(FX)相關(guān)的TLB參數(shù)的不同之處,列出以下的表格,供大家參考:

    以下則是我們使用Wcpuid3.1a所測(cè)出的Athlon 64 FX51以及Athlon 64 3200+的緩存相關(guān)信息:(兩者信息相同,不重復(fù)貼出。)

 Athlon64 FX51緩存相關(guān)信息(點(diǎn)擊放大)

    同時(shí),在TLB控制機(jī)構(gòu)方面,為了提高在程序間切換時(shí)的處理器性能,Athlon64(FX)也相應(yīng)K7核心作出了一些變化。具體變化大家可以參考如下的Athlon64(FX)TLB機(jī)構(gòu)圖:

 新的TLB控制機(jī)構(gòu)(點(diǎn)擊察看大圖)<

● 流水線級(jí)數(shù)增加

    總體上看,整數(shù)流水線部分,Athlon64(FX)具備12級(jí)流水線,相比K7的10級(jí)流水線增加了2級(jí);浮點(diǎn)流水線部分,流水線深度則增加到17級(jí),相比K7核心的15級(jí)增加了2級(jí)。

  

 K8和K7的流水線(點(diǎn)擊放大)

    增加的流水線級(jí)數(shù),顯然有利于提升處理器的頻率。然而相對(duì)P4的超長(zhǎng)20級(jí)管線對(duì)提升處理器頻率的貢獻(xiàn)來(lái)說(shuō),Athlon64(FX)仍然較小,這也暗示了Athlon64(FX)處理器頻率仍然將落下風(fēng)的結(jié)局。不過(guò)幸好大家都已經(jīng)清楚對(duì)于不同的處理器架構(gòu)來(lái)說(shuō),處理器運(yùn)行頻率與實(shí)際性能之間并不存在簡(jiǎn)單的正比關(guān)系。

    另外,還有一點(diǎn)要提的是:從許多資料上,大家可能會(huì)看到諸如K8流水線深度增加到32級(jí)之類的說(shuō)法,這是由于加入了內(nèi)部整合的內(nèi)存控制器執(zhí)行階段。至于傳統(tǒng)意義上的核心部分,流水線深度則應(yīng)為12級(jí)和17級(jí)。
  
    以下,我們順著流水線的走向,來(lái)看看K8的核心部分與K7的異同之處。

● 指令取和分支預(yù)測(cè)部分

    這部分的變化,主要在于分支預(yù)測(cè)單元部分所作出的改變。此部分許多媒體已經(jīng)作了介紹,因此我們不再重復(fù),只作簡(jiǎn)要說(shuō)明。

    由于流水線長(zhǎng)度的增加,為了減小分支預(yù)測(cè)失敗給處理器性能造成危害的可能性,K8相對(duì)于K7在其分支預(yù)測(cè)部分作出了一些改進(jìn),其中包括使用新的分支預(yù)測(cè)算法,將Global History Counter的條數(shù)增加到16K,為原來(lái)K7的4倍之多,加入可快速、準(zhǔn)確地計(jì)算出下一條分支指令地址的Branch target address calculator等。通過(guò)這種改進(jìn),AMD宣稱其分支預(yù)測(cè)精準(zhǔn)度將比K7提高18%。
  
● 解碼部分

    接下來(lái),進(jìn)入到解碼部分。
  
    解碼部分的出口保持與K7一致,仍然為3個(gè)。不過(guò),在K8的解碼部分中,更多的指令將籍由硬件解碼器(AMD稱之為Fastpath或Directpath)而不是送往速度相對(duì)較慢的Mircocode單元中執(zhí)行解碼,比如原來(lái)需要借助Mircocode單元解碼的SSE矢量數(shù)據(jù)處理指令,現(xiàn)在則完全由Fastpath單元擔(dān)任解碼工作,加強(qiáng)了執(zhí)行SSE指令的處理效率。此外,由于K8處理器加入了對(duì)SSE2指令集的支持,很顯然K8解碼部分也因此相應(yīng)作出了一些變化。

    考慮到讀者可能對(duì)Fastpath和Mircocode的概念比較陌生,這里我們對(duì)此進(jìn)行一些解說(shuō):

    我們都知道,要對(duì)一條X86指令進(jìn)行解碼,必須使用一些翻譯機(jī)構(gòu)。目前來(lái)看,使用的翻譯機(jī)構(gòu)不外乎兩種:

    一種是純硬件的處理單元直接翻譯,K8中的Fastpath指的就是這類單元;

    另一種則是使用微編程(Microprogaming)的辦法,將μOp(微指令)預(yù)先存儲(chǔ)在MicroROM(MROM)內(nèi)部,然后根據(jù)外部輸入的指令來(lái)判定需要到MROM中選取那些μOp輸出,K8中的Mircocode指的就是這類單元。

    下面的圖能幫助大家更好地理解這兩種解碼方式:

 Fastpath和Mircocode解碼原理圖

    兩種辦法互有優(yōu)劣,純硬件的解碼器由于沒(méi)有MROM的延遲問(wèn)題,因此執(zhí)行速度快,F(xiàn)astpath也是因此而得名;但是,這需要相對(duì)復(fù)雜的硬件機(jī)構(gòu)實(shí)現(xiàn)。特別對(duì)于X86這種復(fù)雜指令集而言,如果全部使用硬件處理單元直接翻譯,勢(shì)必導(dǎo)致解碼處理單元數(shù)量的劇增;而Mircocode單元雖然從硬件上實(shí)施起來(lái)相對(duì)簡(jiǎn)單,同時(shí)很適合復(fù)雜指令集的口味,但是相對(duì)純硬件的解碼單元,存在延遲較大的缺點(diǎn)。

    由于兩者互有優(yōu)劣,因此目前執(zhí)行X86指令集的處理器解碼單元中,通常都設(shè)置了這兩種結(jié)構(gòu)同時(shí)進(jìn)行指令的解碼翻譯工作,通常由硬件解碼器(Fastpath)負(fù)責(zé)包含μOp數(shù)目較少的短指令的解碼,而由Microcode解碼器負(fù)責(zé)包含μOp數(shù)目較多的長(zhǎng)指令的解碼。
   
● 執(zhí)行部分

    接下來(lái),經(jīng)過(guò)解碼的μOp,通過(guò)解碼單元的3個(gè)出口順著指令路徑進(jìn)入到處理器的發(fā)動(dòng)機(jī)——執(zhí)行部分。

    首先進(jìn)入執(zhí)行部分的ICU(指令控制單元),Intel又稱ROB(微指令池)部分。此部分的任務(wù)是負(fù)責(zé)緩存由解碼單元而來(lái)的μOp,協(xié)調(diào)它們輸出到具體執(zhí)行單元的順序,負(fù)責(zé)處理執(zhí)行過(guò)程中出現(xiàn)的異常情況等。在執(zhí)行單元中擔(dān)任十分重要的角色。不過(guò),在K8中此部分參數(shù)基本沒(méi)有變化,其所能容納的μOp數(shù)目仍然保持為原來(lái)K7的72條。出口方面,顯然也還是相同的3條出口。
  
    由ICU出口處送出(Dispatch)的μOp(微操作),將視其類型分別送往浮點(diǎn)/多媒體指令執(zhí)行部分或是整數(shù)/地址指令處理部分。

● 指令調(diào)度部分

    在執(zhí)行部分中,MacroOp從ICU送出后,還要先送往浮點(diǎn)/多媒體指令執(zhí)行單元或是整數(shù)/地址指令處理單元各自的指令調(diào)度器(Integer/FPU Scheduler)中進(jìn)行進(jìn)一步處理。

    指令調(diào)度器對(duì)超標(biāo)量處理器的執(zhí)行效率意義重大,我們以整數(shù)/地址指令調(diào)度器(Integer Scheduler)—又稱Reservation station(Res)為例,介紹指令調(diào)度器。它的工作大致可分以下三部分:

    其一是負(fù)責(zé)在指令執(zhí)行相對(duì)較慢的整數(shù)單元和指令送出(Dispatch)速度相對(duì)較快的ICU單元之間負(fù)責(zé)緩沖作用。其緩沖能力與指令調(diào)度器內(nèi)部所能存放的μOp條目數(shù)(entries)成正比——單從這一點(diǎn)上看,與一、二級(jí)緩存的容量和其在處理器與內(nèi)存之間所能起的緩沖作用的關(guān)系十分類似;

    其二是負(fù)責(zé)將ICU送來(lái)的μOp,根據(jù)μOp的類型,將其分別送往(issue)AGU或ALU;

    其三是根據(jù)存放操作數(shù)的寄存器以及AGU/ALU的空閑狀況,負(fù)責(zé)安排好μOp送往AGU/ALU單元的次序。對(duì)于超標(biāo)量處理器而言,指令的正確調(diào)度,對(duì)于避免出現(xiàn)流水線危機(jī)(Pipeline Hazard)的作用十分重大。

    在K8中,為了加強(qiáng)整數(shù)部分的性能,該部分所用的指令調(diào)度器所能緩沖的μOp條目數(shù)由原來(lái)的18條增加到了24條。增加整數(shù)指令調(diào)度器的μOp條目數(shù),顯然是當(dāng)心較慢的整數(shù)執(zhí)行單元或是頻繁使用的寄存器會(huì)使前面發(fā)布μOp的ICU陷入等待狀態(tài)。

● 整數(shù)執(zhí)行單元和浮點(diǎn)/多媒體指令執(zhí)行單元
  
    接下來(lái),指令進(jìn)入整數(shù)執(zhí)行單元或浮點(diǎn)/多媒體指令執(zhí)行單元。

    整數(shù)處理單元仍然由3個(gè)AGU、3個(gè)ALU組成。不過(guò),在執(zhí)行整數(shù)乘法時(shí),K8核心的整數(shù)乘法單元(MULT)在處理32位整數(shù)數(shù)據(jù)乘法操作時(shí),延遲由K7的4個(gè)周期減小為3個(gè)周期,具體如下表:

 改進(jìn)的整數(shù)乘法執(zhí)行效率

    浮點(diǎn)/多媒體指令執(zhí)行單元部分則基本沒(méi)有變化,仍然是原來(lái)的FADD、FMUL以及FMISC三個(gè)部分。強(qiáng)大的浮點(diǎn)單元應(yīng)該令A(yù)MD感到十分放心。

    不過(guò)對(duì)于多媒體指令特別是新增的SSE2指令處理方面,在執(zhí)行階段,可以說(shuō)基本同K7不會(huì)有什么太大的區(qū)別,這方面唯一的改進(jìn),應(yīng)該在我們剛才提及的解碼部分,加快了這類指令的解碼速度。

    以上,我們粗略為大家介紹了K8處理器核心部分的改進(jìn)。希望對(duì)大家理解新的K8核心能起到一定的參考作用。<

    盡管K8系列處理器已經(jīng)在處理器內(nèi)集成了北橋的一部分,但仍不能缺少外置芯片組的支持。這方面目前為止主要有5家廠商為AMD K8處理器生產(chǎn)其配套芯片組,他們已經(jīng)推出的產(chǎn)品分別有:NVIDIA的nForce3系列芯片組、VIA的K8T800系列芯片組、AMD的8000系列芯片組、ALI的M1687+M1563芯片組、SiS的SiS760+SiS964、SiS755+SiS964。如此多廠商加入K8平臺(tái)的角逐,形成了K8平臺(tái)上除處理器外的另一個(gè)戰(zhàn)場(chǎng)。

    我們還是來(lái)逐個(gè)看看各大芯片組廠商推出的K8芯片組具體情況吧。
  
● 參數(shù)的白璧微瑕:nForce3系列芯片組

    NVIDIA在nForce2系列主板上取得的不俗成績(jī),已經(jīng)得到大家的認(rèn)可。隨著K8的推出,與AMD關(guān)系緊密的NVIDIA當(dāng)然也不會(huì)錯(cuò)過(guò)這個(gè)大好機(jī)會(huì)。

    根據(jù)我們目前的信息,他們將推出nForce3(Pro)系列共計(jì)6款芯片組,其中已經(jīng)正式推出的就有5款。NVIDIA以實(shí)際行動(dòng)給予AMD K8莫大的支持。

    除了我們上次在《新多元方程:nForce3 Pro 150技術(shù)解析》這篇文章中為大家介紹的服務(wù)器/工作站平臺(tái)用nForce3 Pro 150(Crush K8)、nForce3 Pro 250(Crush K8S)以及目前為止仍未見蹤影的Crush K8G以外,在最近一段時(shí)間內(nèi)NVIDIA又進(jìn)一步完善了其產(chǎn)品線。

    ◎ 新面孔一:nForce3 150

    為了對(duì)應(yīng)桌面型Athlon64 FX,NVIDIA新推出了nForce3 150芯片組。此款芯片組與先前的nForce3 Pro 150規(guī)格相差不大,唯一的區(qū)別在于前者支持的CPU為754接口的Athlon 64,而后者則支持940接口的Athlon 64 FX以及Opteron。

    ◎ 新面孔二:nForce3 Pro 250Gb

    此外,NVIDIA還進(jìn)一步完善服務(wù)器/工作站的芯片組陣營(yíng),添加了內(nèi)部整合千兆網(wǎng)卡的nForce3 Pro 250Gb,同樣,他與nForce3 Pro250除了內(nèi)部整合千兆網(wǎng)卡,也沒(méi)有太大的區(qū)別。

    ◎ 新面孔之三:nForce3 Go150

    至于nForce3 Go 150則為150的移動(dòng)版本,支持PowerNow!技術(shù)。

    更多內(nèi)容,請(qǐng)參見我們的《新多元方程:nForce3 Pro 150技術(shù)解析》一文。在此我們不再重復(fù)。因此我們認(rèn)為:相比其他芯片組廠商而言,nForce3系列芯片組的看點(diǎn)在于:

    - 整合南北橋設(shè)計(jì),相對(duì)其它廠商而言較低的橋間傳輸延遲;

    - 頗具爭(zhēng)議性的北橋-CPU帶寬問(wèn)題;

    - 齊全的K8芯片組陣營(yíng);

    - 謎一般的Crush K8G。

    我們還制作了如下的NVIDIA最新nForce3桌面系列芯片組特性對(duì)比,以供大家參考:

    這里需要提醒大家注意的是,在nForce3 Pro250Gb上,HyperTransport總線帶寬的參數(shù)已經(jīng)提升到了6.4GB/s。<

    作為AMD的另一個(gè)重要合作伙伴,VIA也推出了自己的K8T800系列芯片組以支持K8處理器。K8T800芯片組由北橋VT8385+南橋VT8237構(gòu)成,以下是使用VT8385+VT8237的K8T800芯片組系統(tǒng)組成結(jié)構(gòu)圖:

 K8T800芯片組系統(tǒng)組成結(jié)構(gòu)圖(點(diǎn)擊察看大圖)

    VIA給用在它們主板上的HyperTransport總線技術(shù)起了一個(gè)很好聽的名字,叫做Hyper8。從這張圖里我們可以直接看到VT8385與CPU間HT傳輸總線的數(shù)據(jù)傳輸率為800MHz×2=1600MHz,同時(shí)上下行皆最大支持16bit的位寬。這樣如我們前面為大家介紹的那樣,其峰值帶寬就為6.4GB/s。

 VIA官網(wǎng)原文截圖(點(diǎn)擊察看全圖)

    有此資本在手,VIA顯然不會(huì)忘記在其官方網(wǎng)頁(yè)上標(biāo)榜一番,同時(shí)不忘抓緊時(shí)機(jī)“郁悶”一下對(duì)手NVIDIA。上圖就是截自VIA官方網(wǎng)站的原文頁(yè)面,從劃紅底線的部分我們不難看出這句話的攻擊矛頭直指NVIDIA。

    現(xiàn)階段K8芯片組中只有NVIDIA的nForce3 Pro 150符合這段話的描述。不過(guò)這里的3.2GB/s似乎應(yīng)該改正為3.6GB/s為宜??磥?lái),在火藥味十足的K8芯片組市場(chǎng),VIA是鉚足了勁要和NVIDIA大干一場(chǎng)了。不過(guò),VIA K8T800也并非無(wú)懈可擊,他們的問(wèn)題在于其VT8237南橋與VT8385北橋間的連接帶寬。

    在K8T800上,VIA繼續(xù)使用其連接南北橋的V-Link總線技術(shù),該總線主要指標(biāo)如下:

    ◎ 總線位寬為16bit;

    ◎ 總線工作頻率為66MHz,并使用類似AGP8×的8×數(shù)據(jù)傳輸率技術(shù),這樣其數(shù)據(jù)傳輸率就應(yīng)為66 MHz×8=533MT/s。

    值得一提的是,當(dāng)連接在V-Link總線一頭的VT8385北橋工作在這個(gè)最高數(shù)據(jù)傳輸率時(shí),卻只能以半雙工的模式進(jìn)行南北橋的數(shù)據(jù)傳輸,這樣其南北橋數(shù)據(jù)傳輸峰值帶寬便為:

    533 MT/s×(16/2)/8=533MB/s

    而相比之下,連在V-Link總線另一頭的VT8237本身則完全可以支持533MT/s時(shí)的全雙工工作模式。只不過(guò)受到VT8385北橋上述特性所限,因此導(dǎo)致K8T800芯片組南北橋數(shù)據(jù)傳輸峰值帶寬僅為533MB/s。這也使K8T800成為所有目前為止發(fā)布的芯片組中,南北橋數(shù)據(jù)傳輸峰值帶寬最低的一款芯片組。

    在產(chǎn)品分類方面,VIA則將K8T800按照面向的應(yīng)用范圍不同而分成了兩種,一種面向服務(wù)器和工作站,另一種則面向現(xiàn)在的桌面PC。這兩者的不同主要在于,一個(gè)支持Opteron,而另一個(gè)是支持Athlon 64。面向服務(wù)器和工作站的版本還可以支持PCI-X標(biāo)準(zhǔn)。由于內(nèi)存控制器已經(jīng)內(nèi)置到了CPU當(dāng)中,所以這一項(xiàng)和主板本身的設(shè)計(jì)關(guān)系不大。

    而關(guān)于這款芯片組的南橋方面則采用的是內(nèi)置功能較多的VT8237,它們所支持的功能包括內(nèi)建的VIA Viny Audio 5.1 環(huán)繞聲卡,2×ATA133+2×SATA硬盤接口,以及SATA接口的RAID功能,10/100M內(nèi)建網(wǎng)卡等。此外,通過(guò)VIA VPX2 I/O 擴(kuò)展橋還可以支持服務(wù)器/工作站平臺(tái)上常見的PCI-X設(shè)備。

    綜上所述,我們認(rèn)為VIA K8T800芯片組的看點(diǎn)在于以下3處:

    - Hyper8所帶來(lái)的參數(shù)優(yōu)勢(shì),可能為VIA帶來(lái)的切實(shí)性能領(lǐng)先;

    - K8T800芯片組較低的南北橋數(shù)據(jù)傳輸帶寬,可能會(huì)對(duì)系統(tǒng)整體表現(xiàn)造成影響;

    - 豐富的南橋內(nèi)置功能。<

    AMD自己的芯片組配合自己的CPU,可謂是門當(dāng)戶對(duì)了。目前AMD的K8平臺(tái)相關(guān)芯片組產(chǎn)品主要是AMD8000系列芯片組。該系列芯片組由充當(dāng)北橋的AMD8151或AMD8131以及充當(dāng)南橋的AMD8111組成,如下圖:

   AMD8000系列芯片組結(jié)構(gòu)圖(點(diǎn)擊察看大圖)

    從上圖可以看出AMD-8131由兩大功能模塊(HT Tunnel+ PCI-X Bridge)組成,HT Tunnel這個(gè)通道內(nèi)分有兩個(gè)接口端,SideA通過(guò)HT總線連接到K8 CPU,SideB則通過(guò)HT總線連接到后端的8111南橋。

● AMD8131

    這里需要注意的是,雖然AMD8131兩端都采用了HyperTransport總線連接,但是A和B兩端的HT傳輸總線的位寬是不同的,A端為雙向16位,B端則為雙向8位。同時(shí)AMD8131還擁有兩個(gè)PCI-X Bridge(BridgeA+BridgeB),獨(dú)具PCI-X支持;

    此外AMD8131兩端HyperTransport總線的最高運(yùn)行頻率也不相同,在A端是800MHz×2=1.6GHz,這樣它和CPU間的最大數(shù)據(jù)傳輸帶寬就是6.4GB/s;而在B端則最高頻率僅為400 MHz×2=800MHz。

● AMD8151

    而AMD-8151的架構(gòu)和AMD-8131類似,也是分成A和B兩個(gè)HT傳輸端口, A和B端的對(duì)應(yīng)HT傳輸總線位寬同樣為雙向16位和雙向8位;并且兩端傳輸總線的時(shí)鐘頻率也不相同。

● AMD8111

    AMD-8111則相當(dāng)于傳統(tǒng)的南橋芯片,上面的結(jié)構(gòu)圖中我們可以看到它和AMD-8131/8151進(jìn)行通訊的部分采用的是8位上行和8位下行的雙向HT總線,同時(shí)最高具備200MHz×2=400MT/s的數(shù)據(jù)傳輸率,這樣它和AMD-8131/8151進(jìn)行通訊的最大帶寬就是400MT/s×(8+8)÷8=800MB/s。

    此外,AMD8111在硬盤接口方面提供兩個(gè)可支持ATA133的EIDE接口,網(wǎng)絡(luò)設(shè)備方面則內(nèi)部?jī)H集成10/100M網(wǎng)卡功能。

    不過(guò),不知出于什么原因,在使用其它廠家芯片組的主板紛紛推出的同時(shí),市場(chǎng)上卻鮮見使用AMD芯片組的主板。這不能不說(shuō)是個(gè)遺憾。<

    如此多的廠家都提供了自己的K8平臺(tái)解決方案,ALI公司當(dāng)然也不甘落后,他們也推出了M1687+M1563的K8平臺(tái)。以下為M1687+M1563的系統(tǒng)構(gòu)架圖:

 M1687+M1563的系統(tǒng)構(gòu)架圖(點(diǎn)擊放大

    有趣的是雖然ALI為這套芯片組的北橋取名為M1687,但是我們?cè)趯?shí)測(cè)中卻發(fā)現(xiàn)實(shí)際上這塊芯片其實(shí)就是AMD的8151芯片組!ALI官方則宣稱M1687是其與AMD合作研發(fā)的產(chǎn)品。這一點(diǎn)從下圖我們?cè)赪inXP的硬件設(shè)備管理器中截取的畫面,就可以得到很好的證明:

  
    既然如此,考慮到我們上面已經(jīng)介紹了AMD8151的相關(guān)參數(shù)。因此舉一反三,我們很自然地就可以想到其南北橋芯片組也是采用HyperTransport技術(shù)進(jìn)行連接。

    不過(guò)值得注意的是,盡管北橋使用AMD8151,但是與AMD8111只能支持200MHz的總線頻率不同,ALi的ALi1563將所支持的HyperTransport總線最高頻率提高到了400MHz,同時(shí)保持最大上下行位寬仍為8bit。這方面ALi沒(méi)有盲從AMD8111的參數(shù)設(shè)計(jì)。因此相比AMD8151+AMD8111的組合實(shí)現(xiàn)了南北橋數(shù)據(jù)傳輸最大峰值帶寬的倍增!這樣我們將800MB/s×2,就得到其相應(yīng)的最大帶寬為1.6GB/s。

    至于北橋和CPU之間,由于采用的同為AMD8151,自然是同樣的最大6.4GB/s的傳輸位寬了。除此以外,南橋方面則沒(méi)有太多的亮點(diǎn),平庸的2×ATA133硬盤接口和內(nèi)建10/100M網(wǎng)卡功能。

    因此,對(duì)于ALI的M1687+M1563芯片組而言,其看點(diǎn):

    - 高達(dá)1.6GB/s的南北橋數(shù)據(jù)傳輸最大峰值帶寬。<

    臺(tái)灣的另一家芯片組大廠SiS則推出了SiS755和SIS760領(lǐng)銜的兩款芯片組為K8助陣。以下是這兩套組合的系統(tǒng)結(jié)構(gòu)圖:

  

 SiS755和SIS760系統(tǒng)結(jié)構(gòu)圖(點(diǎn)擊放大)

    與早先公布的芯片組組合所不同的是,在最近SIS的官方網(wǎng)站上放出的數(shù)據(jù)表明:SIS終于下決心棄用了老舊的SiS963L南橋。SiS755改用北橋SiS755+新南橋SiS964的組合。北橋與CPU間的數(shù)據(jù)傳輸最大峰值帶寬同大多數(shù)芯片組一樣是6.4GB/s,南北橋之間則使用數(shù)據(jù)傳輸峰值帶寬為1.06GB/s的妙渠(MultiI/O)技術(shù)進(jìn)行連接。

    而SiS960其余參數(shù)不變,同時(shí)在北橋內(nèi)部整合其Ultra256 顯卡(僅支持DirectX 8.1),同樣配用較新的SiS964南橋。盡管內(nèi)置顯卡的實(shí)際性能我們尚不得而知,不過(guò)SiS畢竟是首家敢于在成品K8系列芯片組中集成顯卡的廠商,這樣的勇氣值得稱贊。

    新南橋SiS964相比老舊的963L加入了許多新的集成功能,增加了2×SATA通道,同時(shí)還提供了RAID功能的支持。為SiS的K8平臺(tái)增添了幾分靚麗的色彩。

    因此,對(duì)于SIS的760/755芯片組而言,我們認(rèn)為其看點(diǎn)在于:

    - 新加入的SIS964南橋豐富的新增內(nèi)置功能;

    - SIS760內(nèi)部整合Ultra256 顯卡的實(shí)際性能表現(xiàn)如何。<

     從上面的芯片組介紹,大家可以體會(huì)到如此多支持K8的芯片組廠商都紛紛推出了自己的K8平臺(tái)芯片組,真可謂是亂花漸欲迷人眼。為此我們特別整理了如下的表格,以供大家參考對(duì)比??紤]到我們?cè)谏厦嬉呀?jīng)貼出了nForce3芯片組的較全面表格,因此在上面的表格中我們只選取主流桌面市場(chǎng)上大家比較感興趣的nForce3 Pro 150來(lái)做對(duì)比。

歡迎繼續(xù)點(diǎn)擊閱讀下篇:《AMD Athlon 64系列終極報(bào)告(下):效能實(shí)戰(zhàn)篇》<

0人已贊

關(guān)注我們