英特爾45nm新旗艦四核QX9650解析測試
◎ Enhanced Core MA :Fast Radix-16 Divider
Penryn處理器除沿襲Core微架構(gòu)的優(yōu)點外,并進(jìn)一步改良除法器的設(shè)計,在科學(xué)計算、三維坐標(biāo)轉(zhuǎn)換和其它數(shù)學(xué)運算密集型功能中,其帶來約2倍的除法器速度,所包含的新一代的快速除法技術(shù)稱為Radix-16,可加速浮點和整數(shù)的除法運算速度。
其實Intel在Core微架構(gòu)中支持每個周期可處理多達(dá)4個指令(對比舊有處理器最多只能同時處理3個指令),且重新采用較高效率的14層Pipeline Stages,為提升分支預(yù)測的能力及準(zhǔn)確性,Branch Predictor的Bandwitdh提升至20Byte (K8、Banias 為16B,Netburst為4B),令指令執(zhí)行效率大大提高。
此外,Core微架構(gòu)更加入Macro-Fusion技術(shù),可把部份指令組合成單一Micro-Op 指令,令特定情況下每個周期可執(zhí)行5個指令,更保留Micro-op Fusion技術(shù),把相同的Macro-ops混合成單一個Micro-ops 透過Out-of-order邏輯可減少10% 的Micro-op指令執(zhí)行數(shù),除提升核心的執(zhí)行效率,同時也保持高能源效益。
據(jù)了解,基數(shù)為4的算法會在每次迭代運算中計算其2位的商值,當(dāng)提高到基數(shù)為16的算法時,則允許在每次迭代中計算4位的商值,進(jìn)而使延遲縮減一半。
◎ 實測SiSoftware Processor Arithmetic
從實際的測試中看出,Dhrystone和Whetstone是Processor(s) Arithmetic測試項目中的整數(shù)以及浮點運算,用最終成績來評定一款處理器性能。新的Penryn QX9650與QX6850相比,在整數(shù)以及浮點運算上QX9650分別提高了2.4%與12.6%。
關(guān)注我們
