黃仁勛:串行計算過時并行計算是未來
泡泡網(wǎng)顯卡頻道1月2日 上個月,NVIDIA公司聯(lián)合創(chuàng)始人、總裁兼首席執(zhí)行官黃仁勛先生親自來華,主持了2010年度GPU高性能計算峰會(GPU High Performence Forum 2010),并且親自帶領(lǐng)NVIDIA公司眾多員工和媒體記者朋友們,共同參觀了位于天津濱河新區(qū)的國家超級計算機(jī)天津中心。
詳細(xì)的報道大家可以參閱:
GPU計算峰會:黃仁勛自曝大學(xué)青澀照片
黃仁勛:GPU加速超級計算機(jī)實現(xiàn)民用化
最強(qiáng)超級計算機(jī)!天河一號A 內(nèi)部探秘
會后NVIDIA公司聯(lián)合創(chuàng)始人、總裁兼首席執(zhí)行官黃仁勛先生,以及國家超級計算天津中心劉光明主任和楊燦群教授,共同接受了媒體記者們的采訪,就GPU計算以及世界最強(qiáng)超級計算機(jī)“天河一號”等大家感興趣的內(nèi)容,做出了官方權(quán)威的申明。
下面筆者就將采訪內(nèi)容整理出來,供大家參考。
記者:天河一號A里面用了14336顆至強(qiáng)處理器,還用了7168顆的NVIDIA Tesla。我想請問一下,在HPC里頭,CPU和GPU數(shù)量的平衡是有什么因素來決定的?
劉光明:基本上,GPU負(fù)責(zé)一些復(fù)雜的并行計算,而CPU負(fù)責(zé)比較規(guī)整的計算。根據(jù)現(xiàn)在的應(yīng)用情況跟我們的實驗結(jié)果,這種配比比較合理,實際運行效果能達(dá)到2:1這是我們在去年9月份做了一個實驗之后,覺得這種配比比較合理。
記者:如果未來應(yīng)用有變化的話,這個比例還會有變化是嗎?
劉光明:現(xiàn)在這臺機(jī)器不會變了,因為硬件上已經(jīng)固定了。至于未來,現(xiàn)在是千萬億次,到了以后萬萬億次,百萬萬億次,這個結(jié)構(gòu)有可能會變,還要做研究才能下結(jié)論。
記者:你好!我想問一下天河一號A最大性能比上一代提升了4.4倍,系統(tǒng)的效能也從16.7%一直到53.3%,但是比傳統(tǒng)上的CPU能耗可以下降1/3。請問一下是采用了哪些的技術(shù)達(dá)到這樣的效果的?謝謝!
楊燦群:天河一號A這一代系統(tǒng)從實用性能到計算效率大幅度的提高,主要有一下幾個方面的原因。第一,我們采用了自己的高速度互聯(lián)網(wǎng)絡(luò),這個互聯(lián)網(wǎng)絡(luò)的性能大幅度的提高了,對應(yīng)的軟件優(yōu)化技術(shù)也提高了。這個軟件優(yōu)化主要是針對全系統(tǒng)的。
另外還有一個原因,我們能夠構(gòu)架這么大的系統(tǒng),系統(tǒng)也能夠穩(wěn)定運行。在天河一號A上,這一代計算機(jī)采用了NVIDIA的GPU,這款GPU是專門針對高性能計算或者通用計算所設(shè)計的。
記者:現(xiàn)在的GPU與最新的四核CPU相比的話,第二代TeslaGPU處理器能否以大約1/20的功耗以及1/10的成本實現(xiàn)同等級的性能?NVIDIA將來會有哪些方法來推廣Tesla產(chǎn)品?
黃仁勛:GPU+CPU這樣一個架構(gòu)一方面它的計算性能非常高,同時它的耗電量又非常低。這是一個常識,如果你用比較合適的處理器來處理一定的任務(wù)的話,那你的速度一定會更快一些。中國幾乎每一個孩子都知道,如果你玩計算機(jī)游戲的話,性能最高、最好的辦法就是用GPU。我們實際上推出的GPU產(chǎn)品是一個通用運算的GPU,因為我們在設(shè)計的時候就有一個想法,現(xiàn)在已經(jīng)實現(xiàn)了,不僅僅它可以用來玩游戲,另外還有一點,它可以解決高性能的數(shù)學(xué)的計算。
梁教授、劉教授,還有楊教授他們做的中心有一點,在幾年以前,他們就意識到科學(xué)計算的重要性。GPU在科學(xué)計算當(dāng)中,幾乎所有的人都認(rèn)識到如何用GPU去高性能計算是效率非常高的。在全球比較領(lǐng)先的關(guān)于高性能計算的一本雜志叫《HPC Wire》,他們就在這個星期發(fā)表了一篇文章,用GPU去進(jìn)行高性能計算是世界上現(xiàn)在最重要的趨勢。
現(xiàn)在這個使用CPU+GPU的異構(gòu)計算的趨勢已經(jīng)變得非常清晰,但是在兩年以前,使用現(xiàn)在的架構(gòu)風(fēng)險是非常大的。劉教授和楊教授在兩年以前就看到了這一點,就是從事視覺方面的嘗試,他們是非常有遠(yuǎn)見的。對于劉博士和楊博士非常的贊賞,在這里再一次恭喜他們,因為他們的遠(yuǎn)見,他們創(chuàng)造了世界上最快的超級計算機(jī)。
天河一號A現(xiàn)在已經(jīng)設(shè)定在世界上高性能計算機(jī)的一個新的標(biāo)準(zhǔn),也提升的人們對高性能計算的期望和期待值。中國政府非常有遠(yuǎn)見,一直在鼓勵高性能計算和利用高性能計算做科學(xué)的探索和發(fā)現(xiàn),在這方面不斷的投資,這是非常有遠(yuǎn)見的。
今天在高性能計算方面投資非常的重要,因為高性能計算實際上是科學(xué)探索和科學(xué)發(fā)展的一個有效的工具。在高性能計算方面投資,和我們現(xiàn)在在投資建立公路、投資汽車、投資互聯(lián)網(wǎng)一樣,對于未來非常重要。今天投資高性能計算可以引領(lǐng)我們不斷的發(fā)掘、探索新的科學(xué)和新的技術(shù)。今天科學(xué)家們在這里從事著高性能計算工作,不僅僅是對科學(xué)家來說非常的重要,對所有的業(yè)界都是非常重要的。
劉博士剛才提到,有很多在高性能計算方面的應(yīng)用,比如生命科學(xué),發(fā)現(xiàn)新的藥物,延續(xù)人們的生命,保護(hù)人們的生命。他也介紹了運用超級計算機(jī)設(shè)計更好的汽車。也介紹到我們可以利用高性能計算機(jī)去制造和創(chuàng)造今天的電影或者電視連續(xù)劇。所以很顯然,超級計算對于我們現(xiàn)在生活和工作當(dāng)中的各個方面都顯得非常重要。這也是為什么目前Tesla在全球所有主要的超級計算機(jī)當(dāng)中都有應(yīng)用,而且非常成功的原因。
我們的戰(zhàn)略是鼓勵所有的公司都在他們公司內(nèi)部開始使用基于Tesla的超級計算機(jī),通過這些,他們不僅僅可以加速和開發(fā)他們的產(chǎn)品和設(shè)計,也可以縮短他們的產(chǎn)品進(jìn)入市場所需的時間。目前,在全球前10個最高效的超級計算機(jī)中有7個是基于Tesla的。全球十大最高效的超級計算機(jī),其中有7臺是基于Tesla。所以這就呈現(xiàn)了一種趨勢,這個趨勢就是未來,越來越多的公司或者所有的公司,他們的超級計算機(jī)都會是基于Tesla的。我們相信Tesla超級計算機(jī)會占有很大的市場。這也是為什么我們和全球領(lǐng)先的公司,比如HP、IBM、戴爾公司、Cray,Silicon Graphic,還有浪潮,一起不僅把超級計算機(jī),也把基于Tesla的高性能工作站帶到市場上?,F(xiàn)在可以在全球任何一個國家,通過任何一家計算機(jī)廠商去購買基于Tesla的超級計算機(jī)。
希望回答了你的問題。謝謝!
記者:現(xiàn)在硬件的銷售越來越依賴于應(yīng)用方面的拓展,所以我想問一下,NVIDIA在應(yīng)用方面有沒有想要做一個平臺,類似于蘋果的應(yīng)用商店,把整個程序移植到和硬件的使用者聯(lián)系到一起?
黃仁勛:你說的不錯,在推廣新的硬件產(chǎn)品的時候,一定需要軟件的幫助。我們投入了大量的資源去傳播新的信息和技術(shù),就是怎么樣用并行的技術(shù)去編程。GPU是并行的,CPU是串行的,CPU每一次只能做一個工作, GPU可以同時做很多的工作。
一方面,我們要建立一個全新的架構(gòu),在并行計算當(dāng)中擁有非常高的效率。另外一方面,我們也要去推廣和教育全球所有的技術(shù)人員和編程人員怎么樣運用新的方法,通過并行計算進(jìn)行編程。針對CUDA的編程語言推廣已經(jīng)持續(xù)了一段時間,現(xiàn)在全球有400多個大學(xué)已經(jīng)開始把CUDA作為他們的教程?,F(xiàn)在針對CUDA的教學(xué)書籍和參考書籍也非常多,有漢語、日語英語,還有俄語,不同語言的版本。
現(xiàn)在全球目前有超過10萬余個CUDA的注冊編程人員。很多其他的主要領(lǐng)先軟件廠商,他們新的軟件也都支持CUDA,比如說像Adobe一個新的軟件叫Creative Sweet。第一個用于科學(xué)研究的計算軟件叫Matlab,他們也支持CUDA。全球業(yè)內(nèi)知名的工程設(shè)計以及模擬方面的軟件叫Ansys,他們也全線支持CUDA。另外全球先進(jìn)的流體力學(xué)模擬軟件Amber也支持CUDA。全球目前數(shù)字創(chuàng)作當(dāng)中最強(qiáng)的軟件3Ds MAX也支持CUDA。我們現(xiàn)在還有很多的開發(fā)工作在做,還有很多的軟件需要逐漸的擴(kuò)展到CUDA編程中去。
全球在CUDA軟件的開發(fā)和推廣方面,發(fā)展速度是非??斓摹,F(xiàn)在全球最快的超級電腦里面有CUDA,世界上最快的超級計算機(jī)里面有CUDA,日本的最快超級計算機(jī)里面有CUDA,俄國、美國的最快超級計算機(jī)都有CUDA。這個時候,軟件開發(fā)人員如果他們需要超級計算機(jī)做軟件的時候,他也需要了解和學(xué)習(xí)CUDA。另外一方面非常重要的是,全球幾乎所有的個人電腦里面都有CUDA的芯片。蘋果、聯(lián)想、戴爾、HP,幾乎所有的公司都推廣CUDA,如果你在這些商店去買計算機(jī)的話,里面都有CUDA的推廣人員。所以CUDA無處不在。
有一點非常的重要,在這些企業(yè)應(yīng)用當(dāng)中,有很多不同的應(yīng)用程序,但是一個或者兩個應(yīng)用程序占用了CPU 70%、80%、90%甚至更高的計算能力,一兩個程序幾乎使用了所有的計算能力。不是所有的程序都同樣的重要,如果能夠針對這一兩個非常重要的應(yīng)用提高它的效能,其實能夠整體極大的提高他們計算的效能。
記者:借助NVIDIA的Tesla,中國的超級計算機(jī)取得了世界領(lǐng)先的成績。我想中國要保持這種領(lǐng)先的成績,在未來,需要做哪些方面的努力和創(chuàng)新?第二個問題,NVIDIA在這個過程中,對中國未來的超級計算機(jī)將會提供哪些支持?謝謝!
劉光明:剛才我給大家講過,中國的要性能計算機(jī)的發(fā)展經(jīng)歷了將近30年的歷程,從78年開始,以銀河1號為代表,中國就全面開展了高性能計算機(jī)的研制,這個研制并不是為了在世界上去爭排名,確確實實是因為我們國家急需這樣的高性能計算機(jī)。作為天河來講,經(jīng)過32年的積累,在怎么做高性能計算機(jī),特別是研制承擔(dān)國家科技部“863”這個項目,千萬億次級別的高性能計算機(jī)研究過程中,遇到了一個世界性的難題,就是怎么去做。從2005年到2007年一直在研究,通用CPU我們這也有,我們的“飛騰1000”,在技術(shù)上怎么用別的有的稱為協(xié)處理器,有的稱為加速器,這種結(jié)構(gòu)也就叫做異構(gòu)的結(jié)構(gòu)去解決世界的難題。這里面過去實驗過我們自己的流處理器芯片,當(dāng)時叫“飛騰100”,去年我們用的是AMD的,最后發(fā)現(xiàn)了NVIDIA的芯片的性能更好。
有一點請各位朋友注意的是,超級計算機(jī)做出來運算峰值能做到4700萬億次,平均值2566萬億次,世界靠前。但這并不等于你能把這個機(jī)器在實際運作中,能用的非常好。實際上在高性能計算方面是兩個問題,第一個是怎么把這臺計算機(jī)做出來,綜合性能是不錯的,剛才楊教授介紹了,這就涉及到一個體系結(jié)構(gòu)的問題,涉及到我們計算部件的系統(tǒng)(計算子系統(tǒng)),包括高性能的通信系統(tǒng)。
第二個挑戰(zhàn)也是現(xiàn)在全世界都面臨的,就是它的應(yīng)用。也就是說,解決實際問題怎么去編程序。在這種通用CPU+GPU這種國際,國際上學(xué)術(shù)界稱為異構(gòu)協(xié)同、并行處理,或者叫異構(gòu)結(jié)構(gòu),它在編程上是非常困難的。這也是當(dāng)今世界上,人們面臨的第二個大的技術(shù)挑戰(zhàn),并不是所有的程序拿過來之后,都能夠在這個結(jié)構(gòu)上用的很好,包括國外。所以我們現(xiàn)在有一個很好的團(tuán)隊,像楊教授帶領(lǐng)的這么一個團(tuán)隊,從幾年前就在解決這個問題,應(yīng)該說現(xiàn)在已經(jīng)取得了非常好的成績。我們這一次能夠在實現(xiàn)4700萬億次情況下,能夠做到53%的計算效率,把平均值測到了2566萬億次,如果用同樣的結(jié)構(gòu)去給別的用戶測,測不到這個水平,因為我們過去一直嘗試從事體系結(jié)構(gòu)的研究,就是機(jī)器怎么做,芯片的研制,知道這個程序怎么劃分。
通俗的講,這樣一個結(jié)構(gòu)里面,大家算出來它的核,包括通用CPU的核,再包括GPU的核,幾十萬億次,18萬多個。什么概念?就是一件工作你把它分為1000個人好分,1000個人你好領(lǐng)導(dǎo),把一件工作分給18萬個人,而且要把他們協(xié)調(diào)起來,讓他們同步聽命令、聽指揮的干好這件事,這在國際上也是個難題,對我們現(xiàn)在也是個難題,但是我們現(xiàn)在不斷的去解決,解決過程中有NVIDIA CUDA這樣的一個編程環(huán)境支持,又使這個難題開始解決了一部分,核心問題還要對物理過程分析怎么去并行化,計算機(jī)一般有超級計算機(jī)有超級并行計算機(jī),所以也就是并行。很直觀的講,18萬個人去干同一件事,這個組織,令行禁止,然后統(tǒng)一的行動都是一個很難的事。大家可能知道,當(dāng)個小班長、當(dāng)個小團(tuán)隊的老總很好當(dāng),當(dāng)個大國企的領(lǐng)導(dǎo)就不好當(dāng)了,也就是這個道理。
所以現(xiàn)在我們也在花很大力氣把應(yīng)用,就是過去在通用CPU環(huán)境下的應(yīng)用不斷的移植到異構(gòu)結(jié)構(gòu),應(yīng)該說我們?nèi)〉昧撕芎玫某煽?,?dāng)然后面也還有大量的工作要去做,也請大家在宣傳的時候跟讀者們講清這個事。并不是說計算機(jī)做好之后就會用好,還需要我們進(jìn)一步的努力,把這機(jī)器在這樣的結(jié)構(gòu)情況下,在NVIDIA CUDA支持的情況下,還有新的技術(shù)上的突破、創(chuàng)新、進(jìn)步的基礎(chǔ)上,把應(yīng)用提升到一個更高、更實用的水平,使計算機(jī)天河一號A真正發(fā)揮它的實際用處。
黃仁勛:劉教授說的很對,并行計算是一個非常復(fù)雜、非常大規(guī)模的計算,它的困難非常的多,但實際上如果你解決了這些困難的話,它能夠帶來的收益和效率也是非??捎^的。并行計算今天遇到的問題是整個計算界在過去30年,一直不停想要解決的問題,但是過去30年一直都沒有成功過。
有多少個超級計算機(jī)的公司在全球真正開發(fā)出來異構(gòu)計算、并行計算的呢?過去從事并行計算的這些公司今天都已經(jīng)不再存在了,因為他們的技術(shù)和產(chǎn)品都沒有發(fā)揮作用。今天我們推出CUDA的新技術(shù),實際上是異構(gòu)計算,CPU+GPU的計算,一方面它很容易進(jìn)行推廣,另外一方面,它有非常強(qiáng)的擴(kuò)張能力。
革命性的一件事情是,花了NVIDIA公司很多年的時間來開發(fā)這個技術(shù),也花費了我們幾十億美元的投資。在這個世界上,沒有任何一家公司在并行計算當(dāng)中的投資能超過NVIDIA。我們今天可以看到,因為CUDA,并行計算有非常光明的前景。當(dāng)然,像劉博士剛才提到的,在這里我們還面臨著非常多的挑戰(zhàn)。在未來,我們需要不斷和劉博士及他的團(tuán)隊進(jìn)行合作,不斷地創(chuàng)造出更多或創(chuàng)造出下一代世界上最強(qiáng)的超級計算機(jī)。
中國已經(jīng)非常清楚地認(rèn)識到,開發(fā)和推廣超級計算機(jī)對于未來的知識、科學(xué)和技術(shù)的發(fā)展都有非常大的推動作用。我們公司非常榮幸,能夠和國內(nèi)很多的科學(xué)家、研究人員、很到公司,還有很多的超級計算機(jī)中心一起合作,為超級計算方面的發(fā)展提供支持。在中國,超級計算機(jī)領(lǐng)域的進(jìn)步以及中國在科學(xué)發(fā)展當(dāng)中不斷的進(jìn)步,會在全人類范圍內(nèi)給我們提供好處。
各位知道,世界已經(jīng)開始變得越來越小?,F(xiàn)在對于知識、技術(shù)、科學(xué)的探索,對于全球整個人類都非常有益。我們會讓我們公司最強(qiáng)的技術(shù)人員和最強(qiáng)的技術(shù)隊不斷支持劉博士和楊博士以及整個超級計算天津中心,我們會用我們最出色的軟件工程師幫助劉博士的團(tuán)隊開發(fā)和拓展新的軟件,在CUDA上發(fā)揮得更好。我們會盡我們所有的力量,不斷投入,保證在中國所有的大學(xué)都能教授CUDA的課程,中國所有的大學(xué)都有這方面的知識和能力去不斷的推廣和教授并行計算的新技術(shù)。我深信,所有的計算機(jī)科學(xué)家和工程人員,都要學(xué)習(xí)并行計算。串行計算已經(jīng)是一個過去時,并行計算才是未來。
劉光明:非常感謝各位朋友到我們天津中心來,也感謝NVIDIA的黃仁勛先生來現(xiàn)場和我們一起探討超級計算領(lǐng)域現(xiàn)有的技術(shù)以及未來的發(fā)展,給予我們很多新的啟示。從天河一號A得到世界靠前之后,獲得了世界和我們國家的關(guān)注,我們國家超級計算天津中心現(xiàn)在正在做兩件事兒,第一件事就是利用天河一號A,真正為濱海新區(qū)和天津地區(qū)的經(jīng)濟(jì)發(fā)展做好科技服務(wù),這是最關(guān)鍵的。未來,我們除了需要在高性能計算機(jī)方面做好科技服務(wù)之外,還會成立一個天津的云計算中心,盡管這是科學(xué)計算和數(shù)據(jù)服務(wù)兩件事,但我們會全方位服務(wù)于國家的發(fā)展。
第二方面,國家科技部在進(jìn)行“十二五”高性能計算機(jī)的發(fā)展規(guī)劃,根據(jù)我們現(xiàn)在研制高性能計算機(jī)的經(jīng)驗和積累的技術(shù),會規(guī)劃一個未來符合國家整體戰(zhàn)略發(fā)展的新的更大的計算機(jī),這一點在“十二五”期間肯定會實現(xiàn)。我也希望跟NVIDIA的合作過程中,不斷利用雙方的經(jīng)驗、技術(shù),為我們國家的高性能計算,為全世界高性能計算機(jī)的發(fā)展做出我們更大的貢獻(xiàn)。謝謝各位!■<
關(guān)注我們
