性能之王還是不進(jìn)反退,Prescott全
接下來(lái),我們進(jìn)入到核心的中部,這一部分主要完成為指令的執(zhí)行調(diào)配所需的資源、動(dòng)態(tài)地編排指令的執(zhí)行順序等工作。此部分與后面我們將要提及的運(yùn)算執(zhí)行單元部分一起,組成了P4的亂序執(zhí)行核心。
Prescott處理器亂序執(zhí)行核心第一部分(點(diǎn)擊放大)
在這一部分中,Prescott相比過(guò)去的P4,做出了以下三個(gè)方面的改進(jìn):
◎ 增加了用于浮點(diǎn)、多媒體運(yùn)算指令的排序(Scheduler)窗口。排序窗口的增大,有利于發(fā)現(xiàn)更多可以并行處理的浮點(diǎn)和多媒體指令,以提高亂序執(zhí)行浮點(diǎn)和多媒體指令的效率;
◎ 改良了用于載入(Load)和儲(chǔ)存(Store)指令排序的機(jī)構(gòu),減小了兩種指令的相互等待時(shí)間;
◎ 增加與各個(gè)指令排序器聯(lián)用的指令列表緩沖(Memory μO(píng)P Queue以及Integer/Floating PointμO(píng)P Queue)的容量,以便緩沖更多由上級(jí)的分配/寄存器換名單元(Allocator/Register Renamer)送來(lái)的指令,減小上級(jí)單元因等待而產(chǎn)生的空閑狀況。
最后是處理器的運(yùn)算執(zhí)行單元部分,主要由負(fù)責(zé)整數(shù)運(yùn)算的ALU、負(fù)責(zé)浮點(diǎn)和多媒體運(yùn)算的FPU以及負(fù)責(zé)地址計(jì)算、數(shù)據(jù)載入以及計(jì)算結(jié)果儲(chǔ)存的AGU部分組成:
Prescott處理器亂序執(zhí)行核心第二部分(點(diǎn)擊放大)
在這一部分中,Prescott相比過(guò)去的P4,做出了以下兩個(gè)方面的改進(jìn):
◎ 在兩個(gè)快速ALU單元(以?xún)杀队谔幚砥鬟\(yùn)行頻率的速度工作)之一中加入處理移位/旋轉(zhuǎn)操作的機(jī)構(gòu);而在舊P4中,這部分功能必則由慢速的ALU單元來(lái)處理。加入新的移位/旋轉(zhuǎn)操作機(jī)構(gòu)之后,處理此類(lèi)運(yùn)算的速度將得到提高;
◎ 過(guò)去的P4,必須依賴(lài)浮點(diǎn)單元進(jìn)行整數(shù)乘法運(yùn)算,這不僅給浮點(diǎn)單元增加了負(fù)擔(dān),而且還需要把待處理的數(shù)據(jù)在浮點(diǎn)、整數(shù)單元之間相互傳遞,浪費(fèi)處理器內(nèi)部的數(shù)據(jù)傳輸帶寬。Prescott則添加了單獨(dú)的整數(shù)乘法單元,消除了這些問(wèn)題。 <
關(guān)注我們
