国产成人福利在线视频播放下载,成人无码www免费视频在线看,放荡的美妇在线播放,大地资源网最新更新,国产成人精品日本亚洲网站

泡泡網(wǎng)顯卡頻道 PCPOP首頁      /      顯卡     /      新聞    /    正文

專訪黃仁勛:CUDA-X86效率遠勝多核CPU

    泡泡網(wǎng)顯卡頻道9月25日 美國當(dāng)?shù)貢r間9月20日至23日,NVIDIA第二屆GTC2010 GPU技術(shù)大會在NVIDIA總部加利福尼亞州圣何塞市召開,NVIDIA公司首席執(zhí)行官黃仁勛在臺上做了精彩的演講,我們也第一時間為大家獻上了現(xiàn)場報道。

    GTC2010相關(guān)報道:都是物理學(xué)家!NV四代GPU架構(gòu)代號解讀
    GTC2010相關(guān)報道:探秘游戲之道!NVIDIA公司總部大揭密
    GTC2010相關(guān)報道:NVIDIA發(fā)布CUDA-X86!跑CUDA無須顯卡

NV下兩代GPU代號:開普勒和麥克斯韋

    GPU技術(shù)大會結(jié)束后,出席會議的記者們有幸對NVIDIA創(chuàng)始人、總裁兼首席執(zhí)行官黃仁勛先生進行了專訪,黃先生饒有興趣的為大家詳細解讀了NVIDIA的產(chǎn)品計劃和相關(guān)技術(shù),并耐心的一一解答了來自世界各地的媒體編輯的問題。下面筆者就將專訪相關(guān)內(nèi)容整理給大家:

專訪黃仁勛:群核GPU效率遠勝多核CPU

記者:您是否考慮研發(fā)基于X86架構(gòu)的CPU?

黃仁勛:我們在CPU領(lǐng)域的策略是Arm,我們已經(jīng)在Tegra中集成了Arm處理器。我選擇Arm是因為Arm是目前世界上成長最快的CPU產(chǎn)品;我們選擇Arm是因為Arm是目前世界上最重要的操作系統(tǒng)所適合的CPU產(chǎn)品,這些操作系統(tǒng)包括Android等;我們選擇Arm是因為在Arm上集中了全球最多的應(yīng)用編程人員;我們選擇Arm是因為Arm是代表未來的CPU產(chǎn)品,而不是代表過去的CPU。

    X86是平緩的上升曲線,而Arm的成長是垂直提升。而我們應(yīng)該選擇哪個與之合作呢?

記者:但是我們目前并沒有看到Arm在您業(yè)務(wù)中占有非常大的比重?

黃仁勛:你不能關(guān)注在目前的業(yè)務(wù)比重,而應(yīng)該關(guān)注在未來的業(yè)務(wù)比重。當(dāng)你前進的時候,一定要站在時代的前列,而不是人云亦云。

記者:您是否會考慮在GPU中集成X86的CPU?

黃仁勛:不會。我認為Tegra是我們成長最快的個人計算機業(yè)務(wù)。GeForce+Tegra的模式一定會成長。我不知道未來Windows未來會怎么發(fā)展,但是我注意到微軟已經(jīng)通過了對Arm的授權(quán)。微軟是一個軟件公司,而未來世界上最大的軟件市場將會在哪里?——Arm!

    我認為所有有遠見的公司都會在Arm進行投入,而不是在X86上進行投入。

記者:昨天我們看到了PGI發(fā)布了CUDA-X86編譯器,我們理解:面向x86平臺的PGI CUDA C編譯器(CUDA-x86)能讓開發(fā)人員在x86架構(gòu)工作站、服務(wù)器、集群上編譯、優(yōu)化和運行CUDA架構(gòu)應(yīng)用程序,有無NVIDIA GPU均可。從這個角度上說,CUDA X86編譯器的出現(xiàn)有何深遠意義?是希望將CUDA架構(gòu)進行更進一步的推廣和普及,還是為了讓編程人員看到CPU在硬件架構(gòu)上的不足而更青睞于進行GPU的編程方式?

另外,您也提到,PGI的CUDA-X86是商業(yè)項目,如果運行效率較低的情況下,您認為應(yīng)該以何種方式進行推廣?

黃仁勛:多核心的CPU解決方案的是不可能與擁有核群GPU的解決方案在延展性達到一樣的執(zhí)行效率的?,F(xiàn)實中很多應(yīng)用中并不能對多核心并行運算進行非常好的擴展性支持。造成這種情況的原因與GPU擁有的高帶寬及運算連貫性有關(guān),但是不止如此。

    即使實際的性能表現(xiàn)并不像使用GPU的擴展性那么好,在CPU使用CUDA X86進行編程還是可以較大幅度提升應(yīng)用運行的效率。如果CUDA可以在一個1000核心的CPU核心集群中運行,執(zhí)行的速度仍然會得到提升,仍然會帶來很多的優(yōu)勢。最重要的優(yōu)勢是CUDA應(yīng)用可以在任何配置下運行。

    PGI將會努力提升CUDA X86的性能,我也會努力提升這個編譯器的性能,因為我希望CUDA可以成功,那CUDA一定要在保證應(yīng)用在所有平臺上。

    PhysX可以在沒有NVIDIA芯片的iPhone、Xbox 360,PSP都能運行,同樣PhysX也可以在X86和CUDA上運行,我們?yōu)镻hysX在所有的平臺上進行優(yōu)化,因為我們希望PhysX成功。

記者:最了解NVIDIA的是NVIDIA自己,在Tegra上,如果您能提供一個很好的硬件,但是軟件是交給別的人在做,您在未來是否會考慮自己開發(fā)Tegra的操作系統(tǒng)?

    您怎么評價Intel的MeeGo,為什么?

    您是否會像Apple簡歷自己的Apple Store一樣建立一個自己的CUDA Store。

黃仁勛:第一個問題的答案是:不會。

    第二個問題的答案是:這不是個好主意。

    第三個問題的答案是:有可能

    第一個問題而言,首先,我們需要做一些對全世界有幫助,同時又是我們長項的事情。有很多的公司在開發(fā)操作系統(tǒng)這個領(lǐng)域上非常出色,例如API,Middle Ware,System Software等等。我們不會成為這個領(lǐng)域中的頂尖人物。下一個問題是,我們是否會對全世界有幫助,目前全世界已經(jīng)有很多很好的操作系統(tǒng),比如說蘋果的IOS、黑莓操作系統(tǒng)、Android、Symbian和Meego。

    就第二個問題而言,為什么Intel要做一個全球第六的操作系統(tǒng)?在操作系統(tǒng)中不存在第六名,沒有軟件工程師愿意為排名第六的操作系統(tǒng)寫應(yīng)用程序,你會愿意服務(wù)第五、第四嗎?不會!你會直接選擇第一或者是第二。那么為何Intel要開發(fā)一個Meego系統(tǒng)呢?問題是IOS、 Android、Symbian、Windows Mobile,所有這些操作系統(tǒng)都不知道X86架構(gòu)。如果Intel不做Meego,他們就是排名0!所以Intel沒有其他的選擇。X86在移動市場上沒有未來,X86是企業(yè)級的應(yīng)用。而NVIDIA更沒有必要去做排名第七的操作系統(tǒng)。

    如果NVIDIA不做自己的操作系統(tǒng),就可以去選擇用誰的CPU,我不容遲疑選擇了前五,也就是選擇了Arm的CPU。如果我選擇了對Tegra運行X86,那我就是第二個Intel了!X86是過去的操作系統(tǒng)。

    CUDA Store,也許吧,可能。

預(yù)熱ComputeX:黃仁勛揭秘NV展會主題

Tegra 2整合了Arm架構(gòu)的雙核CPU

記者:我們知道針對移動設(shè)備平臺的研發(fā)要比電腦要慢,那么您是否有計劃將CUDA引入Tegra?您是否準備在Tegra設(shè)備上引入3D立體?

黃仁勛:只要軟硬件準備完備,這將非???。

    3D立體這個想法非常好,我們將會有手持設(shè)備上的3D,并且是裸眼3D。非常完美。

記者:那您是否準備將基于Arm的產(chǎn)品作為臺式機替代品?

黃仁勛:盡管Arm是成長最快的CPU,但是Arm的性能對于處理日常工作而言還是太弱了。Arm的處理能力至少要提升2-4倍以上,才能達到這個要求。我們也需要針對Arm進行功能調(diào)整才能能將其裝入服務(wù)器等其他計算機。

    我認為這事時間的問題:10年,肯定沒問問題;5年,有可能;1年,絕對不可能!

基于Tegra 2 的NVIDIA公版平板搶先看

NVIDIA自己的Tegra平板電腦樣機

記者:你認為平板電腦替代普通臺式機的時間點在哪里?

黃仁勛:平板電腦沒有鍵盤,而PC(筆記本電腦)是在鍵盤之下的,這是因為筆記本電腦很熱,需要進行風(fēng)道、熱管等方面的設(shè)計和散熱,在設(shè)計上需要更大的空間。

    在未來,單片機(SOC)解決方案將會位于顯示屏之后,這意味著鍵盤下面什么都沒有,鍵盤只是個塑料片而已。所以在未來,SOC可能是筆記本的形式,也可能是平板電腦,也可能是一個外接的底座。

    從時間上來說,我預(yù)計:5年后,在座的沒有人會帶著PC過來;3年后,大部分人不會帶PC,1年后,有些人不會帶PC了。5年,將是PC行業(yè)的全部壽命。

記者:我想請您預(yù)測一下采用CUDA的圖像處理在未來將會有什么發(fā)展的趨勢?

黃仁勛:圖像處理還是會非常重要。圖像處理是最重要的采用并行計算的民用應(yīng)用。比如說,我們與Adobe的合作很成功,我們與Musemage在未來的Photoshop也十分成功。你也看到Adobe實驗室的可計算攝影功能,可計算攝影是攝影行業(yè)的未來!我認為這是一個很重要的領(lǐng)域,所以我們投入很大。

專訪黃仁勛:群核GPU效率遠勝多核CPU

Musemage:完全基于GPU的圖像處理元件

記者:現(xiàn)在基于GPU的圖像處理軟件越來越多,而無論對于軟件開發(fā)者還是最終用戶而言,也都是希望開發(fā)的軟件既能夠面對AMD和NVIDIA都能達到支持,那么您認為應(yīng)該如何影響普通消費者?

黃仁勛:我們希望先從游戲玩家開始進行影響。游戲玩家受到我們的影響。而普通消費者不同,他們會受到賣場促銷、OEM、朋友之類的影響,直接溝通游戲玩家更加直接。

NVIDIA的GPU云計算產(chǎn)品RealityServer

記者:您怎么看將GPU應(yīng)用于云計算?

黃仁勛:這對我們來說是個絕好的機會,我認為將GPU應(yīng)用于云計算,我們首先面對的問題是要解決云的提供者的解決方案。人們不能只買一片顯卡或者一個芯片,所以我們與IBM、HP、Dell有著合作伙伴關(guān)系。目前全球最大的三個服務(wù)器廠商均有Tesla的解決方案?,F(xiàn)在Amazon可以買這樣的解決方案。

    并且IBM、HP、Dell還發(fā)布了1U的刀片服務(wù)器,更加方便擴展。

記者:目前GPU的計算,目前主要應(yīng)用于學(xué)術(shù)界,主要是出于什么優(yōu)勢讓這些結(jié)構(gòu)選用了GPU?

黃仁勛:人們選用GPGPU的原因,主要分為幾類,有些人需要更多的性能,而這個性能是目前CPU集群無法提供的,比如這個房間就是你的機房,你能達到的極限性能就是用CPU填滿這個房間能到的極限性能,而采用GPGPU可以讓你在這個面積上在并行計算中達到10,20甚至50倍的性能提升。

    有些人需要移動性的需求,比如GE、西門子、東芝等,他們需要將整間房子的運算性能放進一個箱子里面,放在醫(yī)院或者醫(yī)生的辦公室里。這類用戶不需要性能提升,但是需要體積的減少。

    還有一類客戶更加嚴格,他們既需要性能的提升,也需要體積的減小,比如帶上飛機。

    還有一類客戶,需要擴展PC的性能,例如Adobe,他們可以用一個集群做可計算視覺效果,但是需要一個PC來剪輯視頻,這就是尺寸決定的。GPU也能可以滿足。

    還有一類客戶,需要降低成本,目前的系統(tǒng)可以滿足他們的需求,但是他們需要將這個系統(tǒng)分給很多人用,成本限定了他們需求,而GeForce可以幫助他們解決這類問題。

    原因多種多樣,但是總的來說GPGPU可以提升速度,降低成本!

記者:為何此次大會會要公布路線圖?

黃仁勛:因為人們很想知道。

專訪黃仁勛:群核GPU效率遠勝多核CPU

NVIDIA下兩代GPU路線圖

記者:昨天在開場的Keynote演講上你提到了下一代產(chǎn)品Kepler以及更下一代的產(chǎn)品的Maxwell,并且您也提到了針對Tesla產(chǎn)品,最終Maxwell在雙精度運算每瓦特性能上將會有16倍以上的提升,那么您對未來的GPU在雙精度運算性能與功耗之間的平衡是怎么看?

黃仁勛:現(xiàn)在的問題越來越有針對性了??赡苁?:0.5,也許是2:3,也許是其他的比例。這些都是可能的答案,因為我還需要等待最終的設(shè)計完成。如果結(jié)論是1:0.5的比例的話,也許我將會在GPU中不知更多的SM單元,但是如果每個SM不能夠充分的被利用,我也可能會減少SM單元,但是每個SM單元的效能上進行提升。

    再加上在制程以及顯存等方面的選擇,讓這個問題的答案更加復(fù)雜了。這個答案只有在打樣的一年到半年前左右才能夠真正揭曉。

記者:您談到Maxwell與Tesla的提升大約為16倍的性能功耗比,這個提升主要體現(xiàn)在性能上提升上還是功耗的控制上?

黃仁勛:不止16倍,Tesla到Fermi,大致提升3-4倍,F(xiàn)ermi到Kepler的提升大概3-4倍,Kepler到Maxwell的提升大致3-4倍。

這個提升主要體現(xiàn)在性能上,因為功耗一定的。對于整機而言,1000w是一個極限。我們的設(shè)計理念中不會過于強調(diào)晶體管的單個性能。這正是并行計算的優(yōu)勢所在,隨著工藝的提升,晶體管的功耗會越來越低,我們就可以放入更多的晶體管,每個晶體管的性能會有提升,但是并不是

記者:未來會不會將IO加入到GPU的設(shè)計之中?

黃仁勛:這是個好主意,我們也正在進行相關(guān)的嘗試。最大的問題不是物理上的接口問題,而是邏輯接口的問題,目前IO都是直接與系統(tǒng)存儲相連,點用數(shù)據(jù)是需要從系統(tǒng)內(nèi)存通過IO再到GPU,這個過程非常浪費。我認為PCI-E更為適合,PCI-E的貸款足夠進行大規(guī)模數(shù)據(jù)傳輸。主要的瓶頸還是系統(tǒng)內(nèi)存。我希望在未來可以從DMA直接到內(nèi)存,不通過CPU。性能提升不只一翻。

記者:和歐美游戲市場更重視對GPU性能要求較高的單機游戲不同,目前亞洲市場更傾向于對GPU性能要求不非常高的網(wǎng)絡(luò)游戲。對于這個情況,NVIDIA未來會不會在游戲項目合作開發(fā)商提供更多差異化的增值服務(wù)?

黃仁勛:我們在全球有游戲之道項目,前幾天我們在韓國與暴雪一起發(fā)布了星際二,在中國,我們所有主要游戲開發(fā)商建立了聯(lián)系,在美國,我們與暴雪保持緊密的溝通。我們創(chuàng)造了很多游戲開發(fā)商用得到的技術(shù),例如PhysX就是其中之一。另外還有很多顯示相關(guān)的技術(shù),像Tessellation等,之后游戲開發(fā)商憑借這些技術(shù)完美他們的游戲??偟膩碚f,我們并非只是做了游戲之道這個名稱,我們與游戲開發(fā)商一起推動這個產(chǎn)業(yè)。

專訪黃仁勛:群核GPU效率遠勝多核CPU

記者:事實上,目前游戲和圖形硬件的研發(fā)都圍繞微軟DirectX來設(shè)計。那么在未來,您認為NVIDIA能夠從規(guī)則的執(zhí)行者轉(zhuǎn)變?yōu)橐?guī)則的制定者,從硬件上對游戲發(fā)展進行一定程度的規(guī)劃?

黃仁勛:我們研究DirectX,我們也要OpenGL,但是越來越多的,這只是一個底線,越來越多的游戲需要更為復(fù)雜的引擎,我們有3D立體幻鏡引擎、PhysX引擎還有iRay引擎。除了API之外,這些引擎也是非常復(fù)雜的,我們需要為游戲開發(fā)商開發(fā)這些引擎。

    我們將支持大眾需要的API,如果DirectX不夠優(yōu)秀了,還會有OpenCL,OpenGL以及CUDA等很多引擎。我們支持所有的這些API,讓游戲開發(fā)商自己選擇適合的API。但是在未來,中間件變得越來越重要。PhysX和iRay對游戲開發(fā)商而言都太過于復(fù)雜了,我們需要將這些中間件做好提供給游戲開發(fā)商。

記者:您認為GPU的幾何單元和曲面細分還能在哪些方面起作用?

黃仁勛:最大的需要視覺計算的領(lǐng)域恰恰是PhysX。PhysX是接下來最主要的應(yīng)用。我們需要將PhysX變得簡單易用并且可擴展。還需要支持所有的物理效果。如果我們想讓游戲變得像電影一樣,那PhysX一定是必要的。

專訪黃仁勛:群核GPU效率遠勝多核CPU

記者:請您談?wù)凣PGPU與APU之間的區(qū)別?

黃仁勛:APU是CPU和GPU的結(jié)合體,而GPGPU是一個GPU與一個CPU分開的。

    集成不是個壞想法,但主要是針對降低成本的好辦法。集成之后就降低了創(chuàng)新的速度,所以一旦集成了,就面臨研發(fā)速度的下降。有些人需要非常好的CPU與非常好的GPU,但是一旦集成了,就會出問題。比如說Intel有很好的CPU,而AMD的GPU比Intel的要好,如果將Intel的CPU與AMD的GPU結(jié)合,那一定是一個不錯的APU!你需要很好的CPU和GPU,是因為你有需求,但是有些人不在乎。不過如果是不在乎CPU和GPU性能的人,我想他也一定不在乎APU。所以我認為在GPU和CPU密集的領(lǐng)域如游戲、高性能計算等方面,CPU和GPU還是獨立的。

    直到技術(shù)發(fā)展到瓶頸了,才會出現(xiàn)集成的想法,但是你看現(xiàn)在我們的Tesla、Fermi、Kepler、Maxwell的發(fā)展趨勢,不需要集成。

    并且APU的功耗很高,據(jù)稱有9w-25w,這在移動設(shè)備上幾乎就是個核電站,會非常熱!對于移動設(shè)備來說,最高的頂限是500mw,實在是太糟了!比太糟還要再糟十倍!■<

0人已贊

關(guān)注我們

泡泡網(wǎng)

手機掃碼關(guān)注