最新款龍芯性能曝光:可媲美i7-3770K
雖然目前龍芯銷售的成品芯片在性能、功耗等各方面都不盡人意,但是下一代核心將有非常明顯的進(jìn)步,一舉接近國(guó)際一流水平。
最近,《中國(guó)科學(xué):信息科學(xué)》期刊刊登了下一代龍芯架構(gòu)的相關(guān)論文,介紹了新產(chǎn)品的具體改進(jìn)與多項(xiàng)性能測(cè)試數(shù)據(jù)。從中我們驚訝地發(fā)現(xiàn),新龍芯已經(jīng)不再是過去那只丑小鴨了。
龍芯現(xiàn)有的兩個(gè)桌面型號(hào)分別是四核心的3A-1000和八核心的3B-1500,其內(nèi)核是2006年定型的GS464微架構(gòu)。如今老舊的GS464核心已經(jīng)不堪重任,各項(xiàng)性能指標(biāo)與當(dāng)前國(guó)際主流CPU差距較大,無(wú)法適應(yīng)競(jìng)爭(zhēng)激烈的芯片市場(chǎng)。
為了追上國(guó)際一流水平,中科院計(jì)算所于2012年開始研制新一代龍芯架構(gòu)“GS464E”。2014年底,使用GS464E核心的首款芯片龍芯3A-1500成功流片,預(yù)計(jì)今年年底成品面世。
相比上代產(chǎn)品,GS464E核心有了相當(dāng)大的改進(jìn):提升分支預(yù)測(cè)效率、增加發(fā)射和重定序隊(duì)列、使用新設(shè)計(jì)的緩存方案和訪存部件等。這些改進(jìn)的結(jié)果是核心單線程性能大幅提升,訪存性能更是有了飛躍。
此外,GS464E還優(yōu)化了多核并行的效率,并增加了硬件級(jí)的x86與ARM指令翻譯模塊,使芯片可以高效率模擬運(yùn)行x86和ARM平臺(tái)的應(yīng)用程序。
大家可以這樣理解新龍芯核心的變化:部隊(duì)行軍作戰(zhàn)不僅需要勇猛的士兵,還要有先進(jìn)的裝備、穩(wěn)定的后勤。上代龍芯架構(gòu)中負(fù)責(zé)“作戰(zhàn)”的那部分設(shè)計(jì)的很好,但與之配合的“裝備”“后勤”就比較落后。GS464E重點(diǎn)強(qiáng)化的就是后者,現(xiàn)在士兵有了強(qiáng)力武器和充足的后勤供應(yīng),打起仗來(lái)自然如虎添翼。
核心大幅改進(jìn)后,新龍芯的性能表現(xiàn)自然就備受期待。這次計(jì)算所慷慨地放出了多項(xiàng)測(cè)試程序的對(duì)比結(jié)果,部分項(xiàng)目還直接找來(lái)Intel上代桌面高端處理器Core i7-3770來(lái)同場(chǎng)競(jìng)技,讓觀眾大飽眼福。
參與測(cè)試的處理器有上代四核心的龍芯3A-1000和新一代的3A-1500,主頻均為1GHz。3A-1000使用通道DDR3-667內(nèi)存,3A-1500則用通道DDR3-1000;對(duì)比的Core i7-3770則使用單通道DDR3-1333內(nèi)存。
首先來(lái)看常用的SPEC CPU 2000跨平臺(tái)測(cè)試集。單線程測(cè)試中3A-1500的整數(shù)性能比上代提升了54.9%,浮點(diǎn)則大幅提升100.6%。
這還是使用通用GCC編譯器的結(jié)果,如果未來(lái)改用針對(duì)新龍芯優(yōu)化的專用編譯器,預(yù)計(jì)其優(yōu)勢(shì)會(huì)更大。
下圖是新龍芯運(yùn)行各項(xiàng)SPEC測(cè)試子項(xiàng)目時(shí)相對(duì)老產(chǎn)品的性能提升比例:
然后是幾項(xiàng)老牌的處理器運(yùn)算速度測(cè)試程序:Whetstone偏重浮點(diǎn)運(yùn)算,Dhrystone和CoreMark是整數(shù)測(cè)試。
由于GS464E主頻較低,這里對(duì)比了它與Core i7-3770的同頻率等效性能。
在這三項(xiàng)測(cè)試中,尚未得到編譯器充分優(yōu)化的龍芯竟然跑出了接近甚至超越Core i7的同頻效率。
雖然龍芯的主頻遠(yuǎn)不如對(duì)手,整體性能依舊落后不少,但同頻性能接近i7-3770已經(jīng)證明新架構(gòu)的實(shí)力的確強(qiáng)悍。將來(lái)龍芯經(jīng)過工藝改進(jìn)和后端優(yōu)化后可以實(shí)現(xiàn)2GHz以上的主頻,屆時(shí)就可以和主流雙核桌面CPU一較高下。
上代龍芯的一大軟肋是訪存性能,這也是GS464E重點(diǎn)強(qiáng)化的指標(biāo)。我們來(lái)看實(shí)際測(cè)試的結(jié)果如何:
由于相關(guān)測(cè)試程序暫時(shí)無(wú)法識(shí)別GS464E的雙路內(nèi)存控制器,所以這里3A-1500與i7-3770都是用單通道內(nèi)存模式,頻率分別為1000MHz和1333MHz。測(cè)試結(jié)果表明新龍芯的訪存性能有了數(shù)量級(jí)的飛躍,已經(jīng)接近國(guó)際一流水平。至此,訪存性能不再是龍芯的主要瓶頸。
計(jì)算所對(duì)新龍芯的初步測(cè)試結(jié)果無(wú)疑是十分滿意的。他們?cè)谖恼轮袑懙溃?/p>
GS464E處理器核的性能比上一代處理器核產(chǎn)品有大幅提升,在流式訪存程序上,更是獲得了超過10倍的性能提升。從程序運(yùn)行效率的角度,其結(jié)果已不輸于Intel Ivy Bridge處理器??傮w而言,GS464E的設(shè)計(jì)已經(jīng)接近國(guó)際非常先進(jìn)水平,是一款國(guó)內(nèi)頂尖的擁有自主知識(shí)產(chǎn)權(quán)的處理器核產(chǎn)品。
短短幾行字,自信和自豪感躍然紙上。
龍芯3A-1500只是GS464E核心的一個(gè)驗(yàn)證性質(zhì)的版本,制造工藝仍是老舊的40nm,主頻不過1GHz。計(jì)算所計(jì)劃在接下來(lái)發(fā)展28nm工藝、主頻超過1.5GHZ的龍芯3A-2000,這款芯片將正式推向市場(chǎng),走進(jìn)PC、服務(wù)器與Intel、AMD的處理器正面對(duì)抗。
計(jì)算所未來(lái)還將有加強(qiáng)浮點(diǎn)能力、支持超線程并改用更先進(jìn)工藝的龍芯3B-2000等新品。
從市場(chǎng)角度來(lái)說(shuō),龍芯3A-2000即可滿足絕大多數(shù)的家用、辦公場(chǎng)景需求,可以替代運(yùn)行常見任務(wù)的x86 PC與服務(wù)器。由于龍芯平臺(tái)基本不存在軟硬件后門問題,更適合政府和大型企業(yè)等敏感部門使用。
棱鏡事件后,中國(guó)對(duì)自主研制的通用處理器需求愈發(fā)強(qiáng)烈。新一代龍芯如能順利發(fā)展,快速推向市場(chǎng),將彌補(bǔ)我國(guó)關(guān)鍵領(lǐng)域缺乏性能夠用的國(guó)產(chǎn)芯片的空白。經(jīng)過十余年艱難探索,龍芯終于要破繭成蝶了。
注:本文數(shù)據(jù)及圖表引用自《龍芯GS464E處理器核架構(gòu)設(shè)計(jì)》(《中國(guó)科學(xué):信息科學(xué)》2015年45卷4期)。■
關(guān)注我們
