不怕美國禁售!新天河推自主超算芯片
天河2號再一次稱霸全球超算性能榜單(性能最大33.83PFlops,千萬億次浮點計算),雖然仍處在建設(shè)中,但它已經(jīng)比較獨特的連續(xù)5次成為Top500的冠軍。
不過,高興之余我們也有意思隱憂,因為美國商務(wù)部在今年4月份發(fā)布公告,決定拒絕英特爾公司向中國的國家超級計算中心出售至強芯片用于天河二號的升級。
因為Xeon E5處理器比較容易獲取,所以限售的重點直指Xeon Phi計算加速卡。至于超算為什么必須用加速卡,重點考慮的就是能耗和建設(shè)成本。
限售令公布后,天河2號系統(tǒng)主任設(shè)計師、國防科大教授盧宇彤曾回應(yīng),“按照原定計劃,天河二號擬在今年將計算能力從55PFLOPS升級到100PFLOPS。盡管此次美方對天河二號升級所需Intel Xeon處理器的限售,對原定升級計劃有一定影響,但我們早有準(zhǔn)備,絕不會影響天河二號從55PFLOPS升級到100PFLOPS的既定目標(biāo) 。
至于中國的信心來自那里,本次超算峰會上,盧宇彤的主題演講也親自做了回應(yīng),我們整理了ZDnet親臨現(xiàn)場后發(fā)回的報道,一起來看看。
這一次,全新的天河2A首次公開對外公布了信息,和與歷代天河系統(tǒng)的對比,其運算峰值將達到100P,更為精彩的是,“中國計算加速卡China Accelerator”首次亮相,型號“Matrix2000”。
雖然處理器方面仍是至強E5-2692 V2,但這款自主的加速卡可謂是對“禁運令”的最大回擊。而且,在性能提升到100P的同時,天河2A的功耗幾乎沒有增加!
事實上,通用處理器在未來的HPC系統(tǒng)里的權(quán)重會越來越低,主要工作將逐漸向控制層面轉(zhuǎn)移,計算任務(wù)則主要由加速器完成。因為NVIDIA GPGPU Tesla同樣在美國限售范圍內(nèi),國防科大給出的中國自主研發(fā)方案就是通用計算數(shù)字信號處理器(GPDSP)。必須承認的是,并不算有多“高大上”。
Matrix2000的主要設(shè)計規(guī)格預(yù)計為16核設(shè)計,可達到2.4T的浮點性能,雖然還比不上Knight Landing的3T,但對于白手起家的中國來說,已經(jīng)相當(dāng)不易,而且功耗比現(xiàn)有的Xeon Phi少了100W。
Matrix2000的內(nèi)部設(shè)計,采用了標(biāo)量與向量單元+超長指令字(VLIW)的架構(gòu)
針對全新的Matrix2000所準(zhǔn)備的軟件堆棧,包括GPDPS驅(qū)動程序、操作系統(tǒng)、編譯器、數(shù)學(xué)庫等
據(jù)國防科大的相關(guān)研發(fā)人員介紹,有關(guān)DSP的浮點計算應(yīng)用,一直也是國防科大的研發(fā)重點,它與超算研究可謂是并行發(fā)展。也正是因為有了這樣的積累,國防科大才能比較從容的面對美國的限售。但該研發(fā)人員也表示,GPDSP的一個推廣難點也就在于,在HPC應(yīng)用領(lǐng)域幾乎是從零起步,就像當(dāng)初NVIDIA剛推出GPGPU時一樣,直到CUDA的發(fā)布才迅速改善了GPGPU的應(yīng)用生態(tài)環(huán)境。
在互聯(lián)層,采用了自主研發(fā)的TH-Express 2+架構(gòu),實現(xiàn)了自適應(yīng)(Adaptive)互聯(lián)架構(gòu)
所謂的自適應(yīng)互聯(lián)架構(gòu),就從多個層面入手,通過自應(yīng)用平臺層至底層形成的智能互動,保證網(wǎng)絡(luò)效率持續(xù)而穩(wěn)定,比如自動規(guī)避質(zhì)量不佳或擁擠的鏈路,進一步杜絕重復(fù)的通信,并在節(jié)點與網(wǎng)絡(luò)故障時對路由重新配置等等。
天河二號A仍然是以自主研發(fā)的H2FS文件系統(tǒng)為核心,實現(xiàn)了1TB/s的突發(fā)傳輸,100GB/s的持續(xù)傳輸
不過盧宇彤表示,目前Matrix2000已經(jīng)通過了驗收。這意味著至少在國防科大的層面,正式投入使用已經(jīng)沒有問題,但具體時間還不能確定,所以只給出了2016年這一較為籠統(tǒng)的時間點。
相關(guān)研發(fā)人員也透露,除了應(yīng)用平臺進一步配套完善之外,GPDSP芯片本身的生產(chǎn)與物理設(shè)備的調(diào)優(yōu)還有很多工作要做。而且受限于當(dāng)前中國半導(dǎo)體生產(chǎn)工藝水平,現(xiàn)在還是采用40nm工藝的GPDSP,也在很大程度上制約了Matrix2000的能力。
總的來說,中國研制超大規(guī)模HPC系統(tǒng)的目的肯定不僅僅是為了跑個LINPACK爭個名次,否則也不會引起美國的重視并引發(fā)限售。
天河二號A的設(shè)計在某種角度上說,真正打開了中國自主HPC發(fā)展的向上之路,因為加速器很重要,也因為加速器被國外限售,所以天河二號A在這種環(huán)境下還能很快達到100P的性能,也許連美國相關(guān)人士也沒有想到,但這絕對是件好事!■
關(guān)注我們
