国产成人福利在线视频播放下载,成人无码www免费视频在线看,放荡的美妇在线播放,大地资源网最新更新,国产成人精品日本亚洲网站

泡泡網(wǎng)CPU頻道 PCPOP首頁      /      CPU     /      評測    /    正文

性能之王還是不進反退,Prescott全

     前面我們主要涉及的,只是處理器外圍的緩存部分,下面,我們把目光投向Prescott的核心內(nèi)部,首先看看前端部分的一些變化:

 Prescott前端結(jié)構(gòu)(點擊放大)

    如上圖,P4的前端部分主要由指令取、指令解碼、追蹤緩存、MicrocodeROM以及分支預測機構(gòu)所組成。在這一部分中,Prescott主要在以下三個方面采取了改進措施。

    ◎ 在解碼部分,Prescott將把更多的指令將交由硬件解碼器進行解碼后由指令發(fā)布速度為3條/周期的追蹤緩存來發(fā)布,而不是交由發(fā)布速度僅1條/周期的MicrocodeROM來解碼后發(fā)布,比如我們在上面提到的軟件預取指令,就是一個很好的例子;這一點,同Athlon64的情況比較類似,而有關(guān)MicrodeROM與硬件解碼器的區(qū)別,請點擊此處察看。

    ◎ 第二方面,Prescott的解碼部分能夠識別出更多指令之間不必要的數(shù)據(jù)依賴(Data Dependence),以便提高后面的亂序執(zhí)行效率;

    ◎ 最后,也是最重要的一個方面,就是對分支預測機構(gòu)的改進了,我們將主要針對此方面的改進作一些簡要說明。

    首先,是我們在前面尚未涉及的Trace Cache BTB部分。必須明確的一點是,Trace Cache BTB部分的變動,與Prescott的動態(tài)分支預測機構(gòu)關(guān)系十分緊密,而動態(tài)分支預測機構(gòu)的性能,則對于Prescott這樣的超長流水線處理器,具備相當重要的意義。

    我們知道,簡單處理器取指令時,只能按照編譯后的指令靜態(tài)順序進行順次讀??;但由于分支指令的跳轉(zhuǎn)特性,打亂了這種依次執(zhí)行的順序;如果此時我們?nèi)匀话凑罩噶罹幾g時的靜態(tài)順序順次讀取,或是在具備分支預測的處理器上出現(xiàn)分支預測失敗的現(xiàn)象,錯誤地讀取了其它的指令進行處理,就必然造成流水線部分區(qū)域的停工或是作了無用功。如下圖:

 長流水線分支預測失敗示意圖(點擊放大)

    對于Prescott這樣的31級超長流水線來說,這樣的問題給處理器帶來的危害顯然比稍短的流水線更大。為了解決流水線在執(zhí)行條件分支指令時的上述問題,就必須改進Prescott處理器中的分支預測機構(gòu),這方面Intel主要有以下三方面的措施:

    ◎ 動態(tài)分支預測方面,首先就是我們前面提到的,將追蹤緩存(Trace cache)所用的分支目標緩沖條目數(shù)由以前的512條增加到了2千條;

    ◎ Intel還宣稱在原有的動態(tài)分支預測機構(gòu)中加入非直接跳轉(zhuǎn)分支預測器(Indrector Branch Predictor),改進了動態(tài)預測非直接跳轉(zhuǎn)分支的能力。

    ◎ 第三條措施,就是改進靜態(tài)分支預測的策略。  <

0人已贊

關(guān)注我們

泡泡網(wǎng)

手機掃碼關(guān)注