最強超級計算機!天河一號A 內(nèi)部探秘
泡泡網(wǎng)顯卡頻道12月23日 北京時間12月22日下午,NVIDIA總裁黃仁勛先生在結束了“2010 GPU高性能計算峰會”之后,帶領NVIDIA公司眾多員工和媒體記者朋友們,共同參觀了位于天津濱海新區(qū)的國家超級計算機天津中心,目前世界上最快的超級計算機“天河一號A”就安裝在這里。
筆者有幸跟隨黃仁勛先生親眼目睹了世界最強超級計算機的尊容,并且在國家超級計算機天津中心工作人員的講解下,深入了解了有關天河一號A的相關技術特性和應用。下面筆者就將本次天津之行的過程分享給泡泡網(wǎng)友們。
一進入國家超級計算機中心,映入眼簾的就是國家主席胡錦濤親筆題寫的“天河”兩個大字,以及鼓勵科研人員不斷進取創(chuàng)新的發(fā)言。經(jīng)過三年的努力,“天河一號A”不負眾望終于拿下了TOP500世界靠前,為國爭光!
國務院總理溫家寶在得知“天河一號A”成為世界最強的超級計算機之后,第一時間來到了國家超級計算天津中心,參觀并慰問了廣大科研工作者,并發(fā)表了重要講話。
現(xiàn)在,我們就沿著溫家寶總理的參觀路線,跟隨黃仁勛先生,一同揭開天河一號A的廬山真面目。
在進入天河一號A機房之前,我們可以看到這臺超級計算機所取得過的榮譽和獎項。天河一號A是在天河一號的基礎上改進而來的,而天河一號曾在去年一舉殺進了TOP500前十名,而且是首次以CPU+GPU異構計算的身份,因此備受矚目。
天河一號去年排行第七,今年成為了世界靠前
點擊查看視頻
超級計算機是由無數(shù)顆CPU和GPU以及互聯(lián)網(wǎng)絡組合而成的,因此我們可以看到天河一號A的真身就是一組組類似于服務器的機柜,相信大家對其內(nèi)部結構更加感興趣。
國家超級計算中心的工作人員知道大家對天河一號A的內(nèi)部結構非常好奇,于是打開機柜,將其中的一組加速模塊抽了出來,展示給黃仁勛先生以及眾多記者朋友們。
這一組加速模塊就是由兩片Tesla M2050高性能計算卡組成的,天河一號A 70%左右的運算能力都是由Tesla GPU所提供。Tesla能夠幫助天河一號A取得如此佳績,黃總表示非常自豪。
在天河一號A的機柜上,我們看到了類似于空調(diào)的冷卻系統(tǒng),光散熱就需要消耗8.3千瓦的功率。當然這對于一臺超級計算機來說并不夸張,據(jù)專家表示,如果單純使用傳統(tǒng)處理器的話,要達到同樣的性能需要至少50000顆CPU,同時系統(tǒng)功耗也會達到驚人的1200萬瓦特,而現(xiàn)在使用混合架構之后功耗僅為404萬瓦特,節(jié)省下來的電力足夠5000多戶居民使用一年。
天河一號A機柜下方的地板原來是空的,里面就是冷卻系統(tǒng)的傳輸通道,20多萬顆處理器核心在工作時發(fā)出的廢熱,就從這里導出到整個大樓之外。
對于正在運行中的天河一號A系統(tǒng)來說,我們不能要求工作人員抽取更多的模塊來滿足大家的好奇心,所以還是來看看展示中的天河一號A主要配件吧。首先是最重要的處理器芯片:
天河一號A擁有14336顆Intel Xeon X5670 2.93GHz六核心處理器、7168塊NVIDIA Tesla M2050高性能計算卡,還有2048顆我國自主研發(fā)的飛騰FT-1000八核心處理器,總計20多萬顆處理器核心,同時還更換為專有互聯(lián)網(wǎng)絡。
超級計算機恐怖的運算能力,簡單來說就是靠堆CPU、GPU來實現(xiàn)的,但如何將龐大數(shù)量的處理器通過網(wǎng)絡和節(jié)點集合起來、讓它們高速并行的協(xié)同工作,這就是硬件方面最大的難點?!疤旌右惶朅”通過使用自主研發(fā)的處理器、網(wǎng)絡、互聯(lián)芯片,解決了這一難題,從而實現(xiàn)了不可思議的硬件規(guī)模和傲視群雄的運算能力。
據(jù)悉,組成天河一號A的以上板卡和芯片,多為國產(chǎn)自主研發(fā)設計。正是因為天河一號A擁有如此龐大而又高效的互聯(lián)網(wǎng)絡系統(tǒng),才使得CPU+GPU的異構系統(tǒng)可以獲得50%以上的最大性能與峰值性能比值,堪稱GPU加速系統(tǒng)中的佼佼者。
“天河一號”目前已在國家超級計算天津中心完成安裝部署,主要面向國內(nèi)外高性能計算市場,為包括石油勘探數(shù)據(jù)處理、生物醫(yī)藥研究、航空航天裝備研制、衛(wèi)星遙感、基礎科學理論計算等領域內(nèi)的大規(guī)模計算提供服務。
以下為現(xiàn)場展示的天河一號A實際應用案例:
超級計算機多用于計算密集的科學仿真,在能源、石油、地球物理、氣象、科學計算、生物信息、網(wǎng)游、金融等各種領域應用廣泛。由于高性能計算在國防、軍事上至關重要,某種意義上也象征著一個國家的IT技術實力。但是,高性能計算由于造價高昂,編程困難,導致應用門檻高,一直有“高處不勝寒”的問題。
天河一號A所使用的CPU+GPU異構計算系統(tǒng),在編程方面也遇到了很多困難,但在NVIDIA的鼎立協(xié)助下,依靠CUDA計算平臺在運行效率方面取得了突破,在各行各業(yè)都得到了普遍的應用,目前天河一號A已經(jīng)在高負荷商業(yè)運行當中,為國際國內(nèi)科研工作者提供超級計算服務?!?
關注我們
