Conroe強在哪兒?Core vs K8架構(gòu)解析
Intel Core 微架構(gòu)很明顯是曾經(jīng)取得過巨大成功的 P6 微架構(gòu)的繼承者。不過,它加入了很多新的特性和設(shè)計,比如微指令融合技術(shù)、宏指令融合技術(shù)、內(nèi)存相關(guān)性預(yù)測和龐大的 SIMD 及浮點執(zhí)行資源。
與優(yōu)秀的 AMD K8 處理器的設(shè)計相比,采用 Core 微架構(gòu)的處理器是更寬、更有效率、更加亂序化的處理器設(shè)計。當我們對 Jack Doweck 提出“Core 微架構(gòu)中龐大的執(zhí)行資源需要 SMT 技術(shù)才能完全利用”的觀點的時候,Jack Doweck 表示不同意。全新的內(nèi)存相關(guān)性預(yù)測技術(shù)從指令級并行的層次上把 load 操作的并行性提高了一大塊,而 Core 微架構(gòu)強大的一級緩存與二級緩存帶來的高帶寬可以幫助處理器把執(zhí)行單元的利用率保持在與 Pentium M 處理器相近的水平上。這樣,與時鐘頻率相同的 Pentium M 處理器相比,Core 微架構(gòu)多出的三分之一的執(zhí)行資源可以獲得接近三分之一的性能提升。
那么,對 AMD 來說,是否意味著“Game Over”?首先,我們幾乎可以肯定,在 AMD 下一代的處理器上肯定會有一些明顯的變化。然后,現(xiàn)在還不能說 K8 處理器的生命周期已經(jīng)結(jié)束了。AMD 可以做的一種明顯的升級措施是增強其處理器的 SSE 執(zhí)行性能,可以通過增加執(zhí)行單元的位寬,或者增加浮點流水線中的執(zhí)行單元的數(shù)量。
為了保證浮點單元的實力得到充分的發(fā)揮,AMD 應(yīng)該提高處理器緩存的帶寬。舊的 K7 處理器的二級緩存相當慢,而 K8 處理器已經(jīng)可以把二級緩存能夠提供的帶寬加倍。我們可以期待 AMD 在未來的處理器的二級緩存上使用256-bit的總線位寬。
最后,AMD K8 處理器的整數(shù)性能也還有很大的提升空間。K8 處理器對 load 操作的亂序執(zhí)行并不優(yōu)秀,這是從 K7 處理器開始就存在的弱點。實際上,我們知道 AMD 的設(shè)計師對此非常清楚,但是在 K8 處理器上沒有做出改進非常令人驚訝。如果能夠更加有效的對 load 操作進行亂序執(zhí)行,即使不能達到 Core 微架構(gòu)所采用的內(nèi)存相關(guān)性預(yù)測技術(shù)的效果,也可以期待5%的性能提升。這也是 Pentium M 處理器能夠在某些類型的應(yīng)用程序中擊敗 K8 處理器的重要原因之一。
這些只是一些我們熟悉的方面。除此之外,可能還會有更多的措施可以使 K8 處理器延續(xù)的更久。
再來看一下采用 Core 微架構(gòu)的服務(wù)器產(chǎn)品Woodcrest,考慮到服務(wù)器應(yīng)用程序中能夠發(fā)揮指令級并行能力的地方并不多,Core 微架構(gòu)沒有應(yīng)用超線程技術(shù)應(yīng)該是它僅有的缺點。這個小缺點是 Core 微架構(gòu)的設(shè)計思想導(dǎo)致的,因為 Core 微架構(gòu)需要顧及服務(wù)器平臺、桌面平臺和移動平臺。這也許會使 Sun 公司和 IBM 公司在某些需要進行多線程應(yīng)用的服務(wù)器平臺上得到機會。不過,采用 Core 微架構(gòu)的4核產(chǎn)品 Tigerton 很快就要到來,也許可以彌補這個劣勢。那么,現(xiàn)在我們的讀者應(yīng)該清楚了:你很難從 Core 微架構(gòu)中找出明顯的缺陷。
不過,具有諷刺意義的是,就在一年前,Intel 還并不重視提升IPC(Instructions Per Clock)和ILP(指令級并行能力)。多核被認為是未來的發(fā)展趨勢,而單核的性能似乎無關(guān)緊要。因此在 Dobbs 博士的文章中曾經(jīng)提到“The free lunch is over”(免費的午餐結(jié)束了),他認為以后只有增大緩存才能帶來IPC的微弱提升,開發(fā)者把注意力集中在處理器的IPC效率上的日子已經(jīng)一去不復(fù)返了。一些研究者甚至認為,具有簡單的、順序執(zhí)行的架構(gòu)的處理器才是未來的方向。
我們卻非常懷疑“Threading is our only savior”(多線程是唯一的救世主)。Unreal 3 游戲引擎的開發(fā)者 Tim Sweeney 曾經(jīng)指出,在下一代游戲引擎中開發(fā)多線程的代碼是非常大的挑戰(zhàn)。寬流水線、高頻率的處理器被否定得有一些過快。NetBurst 微架構(gòu)的設(shè)計使用了 LVS 電路設(shè)計的策略來實現(xiàn)極高的頻率,而 Core 微架構(gòu)并沒有采用這種策略。但是,它仍然是一個采取極寬流水線的、采取亂序執(zhí)行策略的處理器,這是那些不想花費太大力氣在編寫多線程應(yīng)用程序上的程序員的免費的午餐。從這個角度來說,對雙核處理器發(fā)展的需求可能不會那么太迫切。讓用戶得到更高的性能是軟件開發(fā)者和處理器設(shè)計者共同的責(zé)任。是的,雙核是好東西,但是單核的性能仍然重要。
[下載]常用工具大放送(測試可下)
經(jīng)驗:裝臺P4機器 奸商騙人手段大放送
我使用雙核820的2個月體會 獻給大家
關(guān)注我們
