国产成人福利在线视频播放下载,成人无码www免费视频在线看,放荡的美妇在线播放,大地资源网最新更新,国产成人精品日本亚洲网站

泡泡網(wǎng)CPU頻道 PCPOP首頁      /      CPU     /      應(yīng)用    /    正文

手機和平板的芯:ARM處理器前身今世

    泡泡網(wǎng)CPU頻道7月9日 伴隨著平板的崛起,移動設(shè)備市場又迎來了新一輪的競賽,ARM芯片不斷向傳統(tǒng)的x86架構(gòu)CPU發(fā)起挑戰(zhàn),而作為x86機構(gòu)的代表Intel和AMD也在不遺余力的抵制這種滲透。

    Intel正在努力的加快Atom的步伐,使其能夠在未來的移動設(shè)備市場占有一定的市場,而AMD針對移動市場于近日推出了新的Z01 APU,專門面向平板市場。

強勁世界的芯(一):ARM架構(gòu)全息解讀

    作為中堅力量的ARM則在步步為營,一步一步的將計算市場細分出來,然后逐步攻城略地。

ARM x86

ARM終端產(chǎn)品遍布各個領(lǐng)域

    不過談起ARM很多人可能不不是很了解,為什么一個不曾被大眾熟悉的產(chǎn)品,讓業(yè)界巨頭Intel都感到惶恐。

    為了讓讀者對現(xiàn)今的計算市場有一個大致的認(rèn)識,此片文章主要為ARM基礎(chǔ)知識的介紹。

    ARM的全稱是Advanced RISC Machines,意即高級精簡指令集機器。不過現(xiàn)在ARM它是微處理器設(shè)計廠商,提供高性能、廉價、耗能低的RISC處理器以及相關(guān)軟件和技術(shù)。技術(shù)具有性能高、成本低和能耗省的特點。適用于多種領(lǐng)域,比如嵌入控制、消費/教育類多媒體、DSP和移動式應(yīng)用等。

ARM x86

  ARM將其技術(shù)授權(quán)給世界上許多著名的半導(dǎo)體、軟件和OEM廠商,每個廠商得到的 都是一套少有的ARM相關(guān)技術(shù)及服務(wù)。利用這種合伙關(guān)系,ARM很快成為許多全球性RISC標(biāo)準(zhǔn)的締造者。

    ARM到目前為止已經(jīng)生產(chǎn)超過200億個處理器,每天的銷量超過1000萬,是真正意義上的“The Architecture for the Digital World”(數(shù)字世界的體系結(jié)構(gòu))。  

ARM x86

ARM合作伙伴

    目前,總共有30家半導(dǎo)體公司與ARM簽訂了硬件技術(shù)使用許可協(xié)議,其中包括Intel、NVIDIA、IBM、LG半導(dǎo)體、三星、NEC、德州儀器、高通、SONY、Broadcom等。另外ARM也提供軟件系統(tǒng)方面的服務(wù),合作伙伴包括微軟、SUN和MRI等一系列知名公司。

  1991年ARM公司成立于英國劍橋,主要出售芯片設(shè)計技術(shù)的授權(quán)。目前,采用ARM技術(shù)知識產(chǎn)權(quán)(IP)的微處理器,即我們通常所說的ARM微處理器,已遍及工業(yè)控制、消費類電子產(chǎn)品、通信系統(tǒng)、網(wǎng)絡(luò)系統(tǒng)、無線系統(tǒng)等各類產(chǎn)品市場,基于ARM技術(shù)的微處理器應(yīng)用約占據(jù)了32位RISC微處理器75%以上的市場份額,ARM技術(shù)正在逐步滲入到我們生活的各個方面。

ARM x86

    ARM商品模式的強大之處在于它在世界范圍有超過100個的合作伙伴。ARM是設(shè)計公司,本身不生產(chǎn)芯片。采用轉(zhuǎn)讓許可證制度,由合作伙伴生產(chǎn)芯片。 

  而在上世紀(jì)90年代,受到工藝和市場因素的影響,ARM業(yè)績平平,處理器的出貨量徘徊不前。由于資金短缺,ARM做出了一個意義深遠的決定:自己不制造芯片,只將芯片的設(shè)計方案授權(quán)給其他公司,由它們來生產(chǎn)。正是這個模式,最終使得ARM芯片遍地開花,將封閉設(shè)計的Intel公司置于“人民戰(zhàn)爭”的汪洋大海。

ARM x86

  但是進入21世紀(jì)之后,由于手機制造行業(yè)的快速發(fā)展,出貨量呈現(xiàn)爆炸式增長,ARM處理器占領(lǐng)了全球手機市場。2006年,全球ARM芯片出貨量為20億片,2010年預(yù)計將達到45億片。

    ARM通過將處理器架構(gòu)授權(quán)給有興趣的廠家。并卻提供了多樣的授權(quán)條款,包括售價與散播性等項目。對于授權(quán)方來說,ARM提供了ARM內(nèi)核的整合硬件敘述,包含完整的軟件開發(fā)工具(編譯器、debugger、SDK),以及針對內(nèi)含ARM CPU硅芯片的銷售權(quán)。對于無晶圓廠的授權(quán)方來說,其希能將ARM內(nèi)核整合到它們自行研發(fā)的芯片設(shè)計中,通常就僅針對取得一份生產(chǎn)就緒的知識產(chǎn)權(quán)的認(rèn)證。對這些客戶來說,ARM會釋出所選的ARM核心的閘極電路圖,連同抽象模擬模型和測試程式,以協(xié)助設(shè)計整合和驗證。需求更多的客戶,包括整合元件制造商(IDM)和晶圓廠家,就選擇可合成的RTL形式來取得處理器的知識產(chǎn)權(quán)。借助可整合的 RTL,客戶就有能力能進行架構(gòu)上的非常好的化與加強。這個方式能讓設(shè)計者完成額外的設(shè)計目標(biāo)而不會受限于無法更動的電路圖。雖然ARM并不授予受權(quán)方再次出售ARM架構(gòu)本身,但受權(quán)方可以任意地出售制品。商用晶圓廠是特殊例子,因為他們不僅授予能出售包含ARM內(nèi)核的硅晶成品,對其它客戶來講,他們通常也保留重制ARM內(nèi)核的權(quán)利。

ARM x86

  就像大多數(shù)IP出售方,ARM依照使用價值來決定IP的售價。在架構(gòu)上而言,更低性能的ARM內(nèi)核比更高性能的內(nèi)核擁有較低的授權(quán)費。以硅芯片實作而言,一顆可整合的內(nèi)核要比一顆硬件宏內(nèi)核要來得貴。更復(fù)雜的價位問題來講,持有ARM授權(quán)的商用晶圓廠可以提供更低的授權(quán)價格給他們的晶圓廠客戶。透過晶圓廠自有的設(shè)計技術(shù),客戶可以更低或是免費的ARM預(yù)付授權(quán)費來取得ARM內(nèi)核。相對于不具備自有設(shè)計技術(shù)的專門半導(dǎo)體晶圓廠,授權(quán)商對每片晶圓多收取了兩至三倍的費用。對中少量的應(yīng)用而言,具備設(shè)計部門的晶圓廠提供較低的整體價格(透過授權(quán)費用的補助)。對于量產(chǎn)而言,由于長期的成本縮減可借由更低的晶圓價格,減少ARM的NRE成本,使得專門的晶圓廠也成了一個更好的選擇。

ARM x86

  目前很多半導(dǎo)體公司持有ARM授權(quán):Atmel、Broadcom、Cirrus Logic、Freescale、Qualcomm、富士通、Intel、IBM,英飛凌科技,任天堂、OKI電氣工業(yè),三星電子,Sharp,STMicroelectronics,TI德州儀器和VLSI等許多這些公司均擁有各個不同形式的ARM授權(quán)。雖然ARM的授權(quán)項目由保密合約所涵蓋,在智慧財產(chǎn)權(quán)工業(yè),ARM是廣為人知最昂貴的CPU內(nèi)核之一。單一的客戶產(chǎn)品包含一個基本的ARM內(nèi)核可能就需索取一次高達20萬美元的授權(quán)費用。而若是牽涉到大量架構(gòu)上修改,則費用就可能超過千萬美元。

    目前ARM的處理器設(shè)計的范圍非常廣,在這里我們只介紹一些應(yīng)用型處理器,而應(yīng)用型處理器包括經(jīng)典的ARM7/ARM9/ARM11,另外還有現(xiàn)在熱門的Cortex系列,包括Cortex A5/A8/A9,另外ARM還將在未來推出全新的Cortex A15架構(gòu)芯片。 

ARM x86

    - Cortex-A15,可為新一代移動基礎(chǔ)結(jié)構(gòu)應(yīng)用和要求苛刻的無線基礎(chǔ)結(jié)構(gòu)應(yīng)用提供性能最高的解決方案

    - Cortex-A9實現(xiàn),可提供800MHz - 2GHz的標(biāo)準(zhǔn)頻率,每個內(nèi)核可提供5000DMIPS的性能

    - Cortex-A8單核解決方案,可提供經(jīng)濟有效的高性能,在600MHz - 1GHz 的頻率下,提供的性能超過2000DMIPS

    - Cortex-A5低成本實現(xiàn),在400 - 800MHz的頻率下,提供的性能超過1200DMIPS。

ARM x86

    所有Cortex-A處理器均共享共同的體系結(jié)構(gòu)和功能集。這使其成為開放式平臺設(shè)計的非常好的解決方案,因為此時不同設(shè)計之間軟件的兼容性和可移植性最重要。

    - ARMv7-A 體系結(jié)構(gòu)

    - 對所有操作系統(tǒng)的支持

      Linux完整分配 - Android、Chrome、Ubuntu 和 Debian

      Linux第三方 - MontaVista、QNX、Wind River

      Symbian

      Windows CE

      需要使用內(nèi)存管理單元的其他操作系統(tǒng)支持

    - 指令集支持 - ARM、Thumb-2、Thumb、Jazelle、DSP

    - TrustZone安全擴展

    - 高級單精度和雙精度浮點支持

    - NEON媒體處理引擎 

    通過提供所需最高性能點和可伸縮性,提供所需能效和硅成本,同時維持完整的軟件兼容性,各種Cortex-A處理器可共同提供設(shè)計靈活性。

    SoC(System on a Chip),即片上系統(tǒng),也就是在一顆芯片上就可以實現(xiàn)一個完整的系統(tǒng),而ARM芯片正式基于這一設(shè)計,在較小的芯片內(nèi)實現(xiàn)多重復(fù)雜的功能,相比傳統(tǒng)結(jié)構(gòu)它可以實現(xiàn)軟件系統(tǒng)和硬件系統(tǒng)的集成,顯著降低耗電量、減少體積、增加系統(tǒng)功能、提高速度、節(jié)省成本。

ARM x86

    在一顆ARM芯片內(nèi)部,除了常規(guī)的中央處理器(CPU)、圖形處理器(GPU)、內(nèi)存控制器、橋接樞紐以外,芯片還可以集成視頻解碼器、音頻解碼器、Modem、GPS、藍牙、3G/4G等功能模塊,相對于x86 PC,使用單一的芯片外接輸入輸出設(shè)備,就可以實現(xiàn)一個完整的計算設(shè)備,所以基于SoC的ARM可以很容易的應(yīng)用于手機、平板電腦等微電子領(lǐng)域。

強勁世界的芯(一):ARM架構(gòu)全息解讀

小型化趨勢

    由于ARM芯片的高度整合,成品的體積得到顯著減小,而隨著工藝的發(fā)展,早期芯片性能低下、發(fā)熱量大的問題也得到了極大改善,這也是近年來基于ARM的平板電腦和智能手機風(fēng)起云涌的原因。

ARM x86

    另外ARM芯片基于精簡指令集(RISC),使得產(chǎn)品的開發(fā)難度得到降低,開發(fā)周期也得到極大縮短,更具市場競爭力,ARM處理器可以實現(xiàn)較高性能、較小代碼大小、較低功耗和較小硅面積的良好平衡。

    ARM9處理器系列為微控制器、DSP和Java應(yīng)用提供單處理器解決方案,從而減小芯片面積、降低復(fù)雜性和功耗,并加快產(chǎn)品上市速度。

    ARM9 DSP增強型處理器非常適合需要綜合DSP和微控制器性能的應(yīng)用。ARM9處理器系列包括 ARM926EJ-S、ARM946E-S和ARM968E-S處理器。

ARM x86

    ARM9被廣泛用于智能手機、PDA、機頂盒、PMP、電子玩具、數(shù)碼相機、數(shù)碼攝像機等產(chǎn)品解決方案,可為要求苛刻、成本敏感的嵌入式應(yīng)用提供可靠的高性能和靈活性。豐富的DSP擴展使SoC設(shè)計不再需要單獨的DSP。

    ARM968E-S面積最小、包含DSP增強功能的ARM9處理器,針對低功耗、數(shù)據(jù)密集型、嵌入式實時應(yīng)用,面積最小、功耗最低的ARM9處理器是眾多實時類型應(yīng)用的理想之選。通過可輕松從標(biāo)準(zhǔn)接口集成的緊密耦合內(nèi)存,該處理器可高效工作。

    ARM946E-S具有MPU的DSP增強型高速緩存處理器,針對運行RTOS的實時應(yīng)用,一種具有可選高速緩存接口以及完整的內(nèi)存保護單元的實時處理器。對于大部分代碼位于主存儲器的應(yīng)用,該處理器非常有用,它按需加載到高速緩存中,同時關(guān)鍵的異常處理代碼和數(shù)據(jù)仍本地保留在緊密耦合內(nèi)存中。

    ARM926EJ-S具有Java加速、DSP擴展和MMU的應(yīng)用處理器,針對基于操作系統(tǒng)的應(yīng)用,ARM926EJ-S處理器為入門級處理器,可支持完全版操作系統(tǒng),其中包括Linux、Windows CE和Symbian。因此,此處理器是眾多需要完整圖形用戶界面的應(yīng)用的理想之選。

ARM x86

    ARM9系列技術(shù)特點:

    - 基于ARMv5TE體系結(jié)構(gòu)

    - 高效的5階段管道,可增加吞吐量和提高系統(tǒng)性能

    - 提取/解碼/執(zhí)行/內(nèi)存/寫回

    - 同時支持ARM和Thumb指令集 

    - 高效ARM-Thumb交互操作允許非常好的組合性能和代碼密度

    - 哈佛體系結(jié)構(gòu)–獨立的指令和數(shù)據(jù)內(nèi)存接口 

    - 增加了可用內(nèi)存帶寬

    - 同時訪問I&D內(nèi)存

    - 改進了性能

    - 31 x 32位寄存器

    - 32位ALU和桶式移位器

    - 增強型32位MAC塊

    - CoreSight ETM9接口用于增強型調(diào)試和跟蹤功能

    - 標(biāo)準(zhǔn)AMBA-AHB接口

    - 協(xié)處理器接口

  

    ARM11處理器系列所提供的引擎可用于當(dāng)前生產(chǎn)領(lǐng)域中的大多數(shù)智能手機;該系列還廣泛用于消費、家庭和嵌入式應(yīng)用領(lǐng)域。該處理器的功耗非常低,提供的性能范圍從小面積設(shè)計中的350MHz到速度優(yōu)化設(shè)計中的1GHz(45nm和65nm)。ARM11處理器軟件可以與以前所有ARM處理器兼容,并引入了用于媒體處理的32位SIMD、用于提高操作系統(tǒng)上下文切換性能的物理標(biāo)記高速緩存、強制實施硬件安全措施的TrustZone以及針對實時應(yīng)用的緊密耦合內(nèi)存。

強勁世界的芯(一):ARM架構(gòu)全息解讀

    ARM1176JZ(F)-S

    從智能手機、數(shù)字電視到MID,ARM1176應(yīng)用型處理器在這些領(lǐng)域得到廣泛部署,它可提供媒體和瀏覽器功能、安全計算環(huán)境,而在低成本設(shè)計的情況下可提供高達1GHz的性能。ARM1176JZ-S處理器采用針對安全應(yīng)用領(lǐng)域的ARM TrustZone技術(shù),以及用于執(zhí)行高效嵌入式Java的ARM Jazelle技術(shù)??蛇x的緊密耦合內(nèi)存可以簡化ARM9處理器移植和實時設(shè)計,同時,AMBA 3 AXITM接口提高了內(nèi)存總線性能。DVFS支持可以實現(xiàn)功耗優(yōu)化,使其低于ARM11TM處理器體系結(jié)構(gòu)的同類非常好的額定靜態(tài)和動態(tài)功耗。

強勁世界的芯(一):ARM架構(gòu)全息解讀

    - 設(shè)計用于消費類產(chǎn)品和無線產(chǎn)品的應(yīng)用型處理器。

    - 兩種處理器都具有包含媒體擴展的ARMv6指令集體系結(jié)構(gòu)、ARM Jazelle技術(shù)以及用于壓縮代碼的ARM Thumb。

    - 在ARM11處理器系列中,只有ARM1176JZ(F)-S處理器具有ARM TrustZone技術(shù)。TrustZone技術(shù)在CPU和平臺體系結(jié)構(gòu)內(nèi)提供支持,以便構(gòu)建所需的可信計算環(huán)境,從而能夠保護已下載應(yīng)用程序中的關(guān)鍵系統(tǒng)功能、已下載媒體的版權(quán)保護、實現(xiàn)安全的空中下載系統(tǒng)升級。   

    ARM1136J(F)-S

    ARM1136處理器包含帶媒體擴展的ARMv6指令集、Thumb代碼壓縮技術(shù)以及可選的浮點協(xié)處理器。ARM1136是一個成熟的內(nèi)核,作為一種應(yīng)用型處理器廣泛部署在手機和消費類應(yīng)用程序中。

強勁世界的芯(一):ARM架構(gòu)全息解讀

ARM1176JZ(F)-S處理器架構(gòu)

    - 還設(shè)計用作應(yīng)用型處理器,包括ARM1176JZ(F)-S處理器的許多功能。

    - 不包括AMBA 3 AXI總線或TrustZone。  

    - 一些用戶實現(xiàn)ARM1136J(F)-S處理器,以便通過其基于ARM9處理器的SoC設(shè)計,與現(xiàn)有AMBA AHB總線外設(shè)兼容

    - 通過AMBA AHB到AXI的構(gòu)造,可以更加輕松地從AHB總線外設(shè)移植到基于ARM1176JZ(F)-S處理器的設(shè)計。

    - 到最新ARM Cortex-A類處理器的軟件兼容移植路徑    

    ARM1156T2-S   

    ARM1156處理器對ARM11性能進行了優(yōu)化,以適合高可靠性和實時嵌入式應(yīng)用。ARM1156T2-S和ARM1156T2F-S處理器基于ARMv6指令集體系結(jié)構(gòu),并借助 Cortex處理器系列中的相同Thumb-2增強功能得到了擴展。ARM1156處理器使用九階段整數(shù)管道,合并了同類非常好的分支預(yù)測技術(shù)來提供任何ARM11類處理器的最高指令吞吐量。

    - 第一個合并了ARM Thumb-2技術(shù)的處理器,以便獲得更高的代碼密度和指令集效率。

    - Thumb-2技術(shù)使用的內(nèi)存比純32位代碼少31%,從而降低了系統(tǒng)成本,同時可提供優(yōu)于現(xiàn)有Thumb技術(shù)38%的性能。

    - 這些處理器還具有針對高速緩存和緊密耦合內(nèi)存(TCM)的可選同位數(shù)據(jù)保護以及不可屏蔽中斷,從而使其非常適合重點關(guān)注高可靠性或高可用性的嵌入式控制應(yīng)用領(lǐng)域。

    -ARM1156T2-S處理器具有增強型內(nèi)存保護單元(MPU),并為當(dāng)前使用 ARM946E-S、ARM966E-S或較舊16位處理器的嵌入式控制應(yīng)用程序提供理想的升級途徑。

    - 這些處理器具有AMBA 3 AXI規(guī)格的接口,能夠以較少的總線層提供較高的系統(tǒng)總線帶寬以及快速時序收斂。

    - 到最新ARM Cortex-R類處理器的軟件兼容移植路徑

    ARM11 MPCore

    ARM11 MPCore多核處理器實現(xiàn)ARM11微體系結(jié)構(gòu),并引入了基于單個RTL、從1個內(nèi)核到4個內(nèi)核的多核擴展,從而使具有單個宏的簡單系統(tǒng)設(shè)計可以集成高達單個內(nèi)核的4倍的性能。ARM11 MPCore處理器使用內(nèi)置SCU實現(xiàn)高效一致性,并受到具有ARM SMP功能的眾多操作系統(tǒng)的支持。該處理器使用PIPT高速緩存擴展ARMv6體系結(jié)構(gòu),可以有效支持16KB-64KB L1高速緩存。

ARM x86

    - ARM11 MPCore可合成多處理器基于ARM11微體系結(jié)構(gòu),可以將其配置為包含一到四個處理器,以提供高達2600 Dhrystone MIPS的性能。

    ARM11處理器系列功能:

    - 強大的ARMv6指令集體系結(jié)構(gòu)

    - ARM Thumb指令集可以減少高達35%的內(nèi)存帶寬和大小需求

    - 用于執(zhí)行高效嵌入式Java的ARM Jazelle技術(shù)

    - ARM DSP擴展

    - SIMD(單指令多數(shù)據(jù))媒體處理擴展可提供高達2倍的視頻處理性能

    - 作為片上安全基礎(chǔ)的 ARM TrustZone技術(shù)(ARM1176JZ-S和ARM1176JZF-S處理器)

    - Thumb-2技術(shù)(僅ARM1156(F)-S),可增強性能、能效和代碼密度

    - 低功耗:0.6mW/MHz (130nm 1.2 V),包括高速緩存控制器,能量節(jié)約關(guān)閉模式能夠處理高級工藝中的靜態(tài)漏電情況。

    - 高性能整數(shù)處理器

      - 8階段整數(shù)管道可提供高時鐘頻率(對于ARM1156T2(F)-S為9階段)

      - 單獨的加載-存儲和算法管道

      - 分支預(yù)測和返回棧

    - 高性能內(nèi)存系統(tǒng)設(shè)計

      - 支持4-64k高速緩存大小

      - 針對多媒體應(yīng)用領(lǐng)域的、帶DMA的可選緊密耦合內(nèi)存

      - 對于媒體處理和網(wǎng)絡(luò)應(yīng)用領(lǐng)域,高性能64位內(nèi)存系統(tǒng)加快了數(shù)據(jù)存取速度

      - ARMv6內(nèi)存系統(tǒng)體系結(jié)構(gòu)加快了操作系統(tǒng)上下文切換速度

      - 矢量中斷接口和低中斷延遲模式提高了中斷響應(yīng)速度和實時性能

      - 用于汽車/工業(yè)控制和3D圖形加速的可選矢量浮點協(xié)處理器(ARM1136JF-S、ARM1176JZF-S和ARM1156T2F-S處理器)

      - 所有ARM11系列處理器都作為符合ARM-Synopsys參考方法的可交付項來提供,從而顯著縮短了生成內(nèi)核的特定技術(shù)實現(xiàn)的時間,以及生成一組完整的行業(yè)標(biāo)準(zhǔn)視圖和模型的時間。 

    Cortex A8是一款單核處理器芯片,它基于ARMv7體系結(jié)構(gòu),工作頻率從600MHz到1GHz。Cortex-A8處理器可以滿足需要在300mW以下運行的移動設(shè)備的功率優(yōu)化要求;以及需要2000 Dhrystone MIPS的消費類應(yīng)用領(lǐng)域的性能優(yōu)化要求。

ARM x86

    Cortex-A8高性能處理器在如今的終端設(shè)備中得到了驗證。 從高端特色手機到上網(wǎng)本、DTV、打印機和汽車信息娛樂,Cortex-A8處理器都提供了可靠的高性能解決方案,每年發(fā)貨數(shù)百萬臺。

    - 頻率從600MHz到1GHz及以上

    - 高性能、超標(biāo)量微體系結(jié)構(gòu)

    - 用于多媒體和SIMD處理的NEON技術(shù)

    - 與ARM926(ARM9)、ARM1136和ARM1176(ARM11)處理器的二進制兼容性

    高性能

    在復(fù)雜系統(tǒng)中運行的高性能處理器

    - 對稱、超標(biāo)量管道,以便獲得完全雙指令執(zhí)行功能

    - 通過高效、深管道獲得高頻率

    - 高級分支預(yù)測單元,具有95%以上準(zhǔn)確性

    - 集成的2級高速緩存,以便在高性能系統(tǒng)中獲得非常好的性能

    媒體處理 

    通過NEON技術(shù)在軟件中進行媒體處理

    - 128位SIMD數(shù)據(jù)引擎

    - v6SIMD的2倍性能

    - 通過高效媒體處理節(jié)約功耗

    - 靈活處理將來的媒體格式

    - 通過Cortex-A8上的NEON技術(shù)可以在軟件中輕松集成多個編解碼器

    - 增強用戶界面

    NEON技術(shù)主要應(yīng)用于某些音頻、視頻和圖形工作負(fù)荷可以減輕跨SoC支持多個專用加速器的負(fù)擔(dān),并且使系統(tǒng)可以支持將來的標(biāo)準(zhǔn)。

    2級高速緩存集成到內(nèi)核中,以實現(xiàn)輕松集成、高功效和非常好的性能。 該高速緩存使用標(biāo)準(zhǔn)編譯的RAM構(gòu)建,可配置范圍從0K到1MB。 該高速緩存可以使用編譯的內(nèi)存構(gòu)建,具有可編程延遲,以適應(yīng)不同的數(shù)組特征。

    典型芯片代表:

    德州儀器:OMAP 3430、OMAP3530、OMAP 3610/3630/3640

    高通:MSM 7230/7630/8255/8255T/8655/8655T、QSD 8250/8250A/8650/8650A

    三星:S5PC110

    蘋果:A4

    飛思卡爾:MX515

    瑞芯微:RK2918

    Cortex-A9是目前為止性能最高的ARM處理器,可實現(xiàn)受到廣泛支持的ARMv7體系結(jié)構(gòu)的豐富功能。相對Cortex A8,新的Cortex 9可以最多設(shè)計四個處理內(nèi)核,Cortex-A9處理器的設(shè)計旨在打造非常先進的、高效率的、長度動態(tài)可變的、多指令執(zhí)行超標(biāo)量體系結(jié)構(gòu),提供采用亂序猜測方式執(zhí)行的8階段管道處理器,憑借范圍廣泛的消費類、網(wǎng)絡(luò)、企業(yè)和移動應(yīng)用中的前沿產(chǎn)品所需的功能,它可以提供比較獨特的高性能和高能效。

ARM x86

    Cortex-A9微體系結(jié)構(gòu)既可用于可伸縮的多核處理器(Cortex-A9 MPCore多核處理器),也可用于更傳統(tǒng)的處理器(Cortex-A9單核處理器)??缮炜s的多核處理器和單核處理器支持16/32/64KB 4路關(guān)聯(lián)的L1高速緩存配置,對于可選的L2高速緩存控制器,最多支持8MB的L2高速緩存配置,它們具有極高的靈活性,均適用于特定應(yīng)用領(lǐng)域和市場。

    - 非常好的性能,2GHz標(biāo)準(zhǔn)操作可提供TSMC 40G硬宏實現(xiàn)

    - 以低功耗為目標(biāo)的單核實現(xiàn),面向成本敏感型設(shè)備

    - 利用高級MPCore技術(shù),最多可擴展為4個一致的內(nèi)核

    - 可選NEON媒體和浮點處理引擎

強勁世界的芯(一):ARM架構(gòu)全息解讀

風(fēng)靡Android的Tegra 2采用了Cortex A9雙核架構(gòu)

    通過共享以下常見需求,Cortex-A9處理器可提供滿足各種不同市場應(yīng)用需求的可擴展解決方案,包括移動手機以及高性能的消費類產(chǎn)品和企業(yè)產(chǎn)品:

    - 通過提高性能、降低功耗來提高能效;

    - 提高最高性能,滿足要求更高的應(yīng)用需求;

    - 能夠在多個設(shè)備之間共享軟件和工具投資;

ARM x86

    Cortex-A9 MPCore多核處理器

    Cortex-A9 MPCore集成了經(jīng)驗證非常成功的ARM MPCore技術(shù)以及更多增強功能,以此簡化了多核解決方案,并使其應(yīng)用范圍得到擴展。Cortex-A9 MPCore處理器可提供比較獨特的可擴展的最高性能,同時還支持靈活設(shè)計和新功能,從而進一步降低和控制處理器和系統(tǒng)級的能耗。借助Cortex-A9 MPCore 處理器的定向?qū)崿F(xiàn),移動設(shè)備的最高性能還可在現(xiàn)在的解決方案的基礎(chǔ)上不斷提高,具體方法是:利用設(shè)計靈活性和ARM MPCore技術(shù)提供的高級功率管理技術(shù),在散熱受限以及移動電源預(yù)算緊張的情況下維持運行。使用可伸縮的最高性能,該處理器可超過現(xiàn)今類似的高性能嵌入式設(shè)備的性能,并可在拓寬市場的基礎(chǔ)上進行穩(wěn)定的軟件投資。

    Cortex-A9單核處理器

    Cortex-A9處理器提供了比較獨特的高性能和高能效,從而使其成為需要在低功耗、成本敏感、基于單核處理器的設(shè)備中提供高性能的所有設(shè)計的理想解決方案。使用便利的可合成流和IP成品,Cortex-A9處理器可為基于ARM11處理器的現(xiàn)有設(shè)計提供理想的升級途徑,這類設(shè)計需要在相似的硅成本和電源預(yù)算基礎(chǔ)上提供更高的性能和更高級別的能效,同時使軟件環(huán)境保持兼容。Cortex-A9單核處理器為獨立指令和數(shù)據(jù)事務(wù)提供了雙重、低延遲、Harvard 64位AMBA 3 AXI主接口,在內(nèi)存的緩存區(qū)域之間復(fù)制數(shù)據(jù)時,它能夠維持每五個處理器周期執(zhí)行四次雙字寫入。

    除了單核和多核軟宏外,常用的雙核配置也可用作TSMC 40G/GL工藝的硬宏實現(xiàn),從而最大程度地縮短高性能Cortex-A9處理器的上市時間,降低與其上市關(guān)聯(lián)的風(fēng)險和成本。利用優(yōu)化的ARM物理IP和先進的實現(xiàn)技術(shù),該硬宏可用作功率優(yōu)化實現(xiàn)或性能優(yōu)化實現(xiàn)。

    速度優(yōu)化:速度優(yōu)化硬宏實現(xiàn)可向系統(tǒng)設(shè)計人員提供行業(yè)標(biāo)準(zhǔn)ARM處理器的整合低功率技術(shù),從而使ARM的性能領(lǐng)先優(yōu)勢進一步延伸到緊湊、高密度和散熱受限的環(huán)境所需的功率包絡(luò)中的高利潤消費類設(shè)備和企業(yè)設(shè)備。從標(biāo)準(zhǔn)硅中選擇該硬宏實現(xiàn)后,它的運行頻率超過2GHz,代表了面向性能的高利潤應(yīng)用中的理想解決方案。

    功率優(yōu)化:在許多散熱受限的應(yīng)用領(lǐng)域中,能效極為重要。從標(biāo)準(zhǔn)硅中選擇Cortex-A9功率優(yōu)化硬宏實現(xiàn)后,其提供的最高性能達到4000DMIPS,而每個CPU的能耗不到250mW。

    該硬宏實現(xiàn)包括符合ARM AMBA標(biāo)準(zhǔn)的高性能系統(tǒng)組件,可以最大程度地提高數(shù)據(jù)通信速度,同時使能耗和硅面積降到最低。各Cortex-A9硬宏實現(xiàn)還包括CoreSight程序跟蹤宏單元(PTM),它使處理器的指令流完全可見,從而使軟件社區(qū)成員能夠開發(fā)優(yōu)化性能的代碼。此外,該宏還包括ARM高性能L2高速緩存控制器,它支持L2高速緩存內(nèi)存介于128K和8M之間的配置。

ARM x86

    典型芯片代表: 

    德州儀器:OMAP 4430/4460/4470

    高通:MSM 8260/8660、APQ 8060/8064

    NVIDIA:Tegra 2

    蘋果:A5

    最新的Cortex A15目前還沒有成品芯片上市,最早可能要到2012年上市。Cortex A15和Cortex A9/A8同樣采用了ARMv7-A Cortex架構(gòu),處理器內(nèi)核數(shù)量最多為4個,和Cortex A9相同,處理核心之間通過AMBA 4技術(shù)互聯(lián),支持一系列ISA,能夠在不斷下降的功耗、散熱和成本預(yù)算基礎(chǔ)上提供高度可擴展性解決方案,廣泛適用于下一代智能手機、平板機、大屏幕移動計算設(shè)備、高端數(shù)字家庭娛樂終端、無線基站、企業(yè)基礎(chǔ)架構(gòu)產(chǎn)品等等。

ARM x86

    Cortex A15指令集

    - ARM

    - Thumb-2

    - TrustZone security technology

    - NEON Advanced SIMD

    - DSP&SIMD extensions

    - VFPv4 Floating point

    - Jazelle RCT

    - Hardware virtualization support

    - Large Physical Address Extensions(LPAE)

    ISA指令集方面,新的Cortex A15除了繼承ARMv7系統(tǒng),增加了Large Physical Address Extensions (LPAE),使得處理器最高可以訪問多達1TB的內(nèi)存,能有助于擴大計算設(shè)備的內(nèi)存容量和帶寬。

ARM x86

    而在緩存方面,新的Cortex A15極大的優(yōu)化了一級緩存,數(shù)據(jù)和指令各擁有獨立的32KB緩存,延遲得到極大降低,另外功耗也得到明顯改善,核心之間的交流也得到增強,支持多核開發(fā)的軟件開發(fā)也得到極大改善。在二級緩存,方面,Cortex A15提供高達4MB的二級緩存,支持的速率也更高,顯著降低了芯片的功耗。

    而針對多核這一發(fā)展趨勢,ARM也沒有止步,新增加的AMBA 4技術(shù)專門為多核的Cortex A15設(shè)計,使得核心能夠更好的利用緩存,而軟件的開發(fā)也得到了簡化。結(jié)果是那些對高帶寬要求的應(yīng)用包括游戲,服務(wù)和網(wǎng)絡(luò)能夠有效的將多和凝聚起來,提高運算效率。

   另外針對Cortex A9的多媒體性能表現(xiàn)不如預(yù)期,ARM在新的Cortex A15上又重新把NEON高級SIMD指令集和Floating-Point Unit(FPU)作為必配融入到Cortex A15,使得的媒體處理器速度得到顯著提高。

    值得注意的是新的浮點單元采用了VFPv4架構(gòu)相對VFPv3能夠提供更高的性能,而且新的VFPv4架構(gòu)也將榮早期基于ARM浮點單元協(xié)處理器。

    隨著科技的不斷進步,首批Cortex A15將采用32nm、28nm(TSMC/GlobalFoundries)工藝制造,未來會一直延伸到20nm。Cortex A15主頻最高可達2.5GHz,并可根據(jù)不同應(yīng)用領(lǐng)域靈活調(diào)整,比如智能手機和移動計算的1-1.5GHz單/雙核心、數(shù)字家庭娛樂的1-2GHz雙/四核心、家庭和Web 2.0服務(wù)器的1.5-2.5GHz四/八核心乃至更大規(guī)?;ヂ?lián)。

    作為Cortex-A系列家族的最新成員,Cortex-A15是一顆具備廣泛軟件與功能兼容性的處理器,為操作系統(tǒng)虛擬化、軟錯誤糾正、更大內(nèi)存尋址能力、系統(tǒng)一致性提供了高效的硬件支持, 同時保留該系列低功耗設(shè)計優(yōu)勢,以及全面的應(yīng)用兼容性,可立即投入現(xiàn)有開發(fā)者、軟件生態(tài)系統(tǒng),包括Google Android、Adobe Flash Player、Java SE、JavaFX、Linux、Windows Embedded Compact 7、Symbian、Ubuntu,還有七百多家ARM Connected Community社區(qū)成員提供應(yīng)用軟件、硬件、軟件開發(fā)工具、中間件、SoC設(shè)計設(shè)備。

    Cortex-A15處理器將獲得同步開發(fā)、專門優(yōu)化的ARM物理IP的支持,同時還會支持一系列ARM技術(shù),包括AMBA 4兼容CoreLink系統(tǒng)IP、CoreSight調(diào)試和追蹤IP、Mali圖形核心和一系列開發(fā)工具。

    隨著工藝以及技術(shù)的發(fā)展,ARM也在與時俱進,從ARM926最早采用180nm工藝,而不久后基于Cortex A15的芯片將搭載全新的28nm工藝,晶體管密度提升不知多少倍,另外工藝的演進,相應(yīng)的能效也在不斷提高。

ARM x86

目前主流的Cortex A系列ARM規(guī)格

ARM x86

    從上圖我們發(fā)現(xiàn)早期的ARM926由于工藝和技術(shù)的顯示,Dhrystone性能只有1.1 DIMPS/MHz,另外收到工藝的限制,早期的ARM926采用了180nm工藝,頻率設(shè)計最高只有200MHz,嚴(yán)重制約了性能的提升,而目前的Cortex A9最多可集成4個內(nèi)核,單顆內(nèi)核的Dhrystone性能達到了2.5 DIMPS/MHz,提升了1倍多,另外Cortex A9普遍采用了65nm或40nm工藝,頻率也得到極大提升,性能優(yōu)化后的雙核Cortex A9頻率可達2GHz,提升幅度達10倍。

強勁世界的芯(一):ARM架構(gòu)全息解讀

移動互聯(lián)網(wǎng)逐漸朝一體化趨勢發(fā)展

     相信隨著工藝和技術(shù)的不斷發(fā)展,ARM性能達到主流PC性能也不是問題。ARM精簡的指令集使得運算也更加高效,更具市場競爭力,ARM處理器可以實現(xiàn)較高性能、較小代碼大小、較低功耗和較小硅面積的良好平衡,使得移動互聯(lián)網(wǎng)時代漸趨成熟。■<

0人已贊

關(guān)注我們

泡泡網(wǎng)

手機掃碼關(guān)注