公交车上～嗯啊被高潮,xxxx性欧美高清

泡泡網(wǎng)顯卡頻道 PCPOP首頁 / 顯卡 / 新聞 / 正文

專訪黃仁勛:CUDA-X86效率遠勝多核CPU

2010年09月25日 00:09作者：孫敏杰編輯：孫敏杰文章出處：泡泡網(wǎng)原創(chuàng)

泡泡網(wǎng)顯卡頻道9月25日美國當(dāng)?shù)貢r間9月20日至23日，NVIDIA第二屆GTC2010 GPU技術(shù)大會在NVIDIA總部加利福尼亞州圣何塞市召開，NVIDIA公司首席執(zhí)行官黃仁勛在臺上做了精彩的演講，我們也第一時間為大家獻上了現(xiàn)場報道。

    GTC2010相關(guān)報道：都是物理學(xué)家!NV四代GPU架構(gòu)代號解讀
    GTC2010相關(guān)報道：探秘游戲之道！NVIDIA公司總部大揭密
    GTC2010相關(guān)報道：NVIDIA發(fā)布CUDA-X86！跑CUDA無須顯卡

GPU技術(shù)大會結(jié)束后，出席會議的記者們有幸對NVIDIA創(chuàng)始人、總裁兼首席執(zhí)行官黃仁勛先生進行了專訪，黃先生饒有興趣的為大家詳細解讀了NVIDIA的產(chǎn)品計劃和相關(guān)技術(shù)，并耐心的一一解答了來自世界各地的媒體編輯的問題。下面筆者就將專訪相關(guān)內(nèi)容整理給大家：

記者：您是否考慮研發(fā)基于X86架構(gòu)的CPU？

黃仁勛：我們在CPU領(lǐng)域的策略是Arm，我們已經(jīng)在Tegra中集成了Arm處理器。我選擇Arm是因為Arm是目前世界上成長最快的CPU產(chǎn)品；我們選擇Arm是因為Arm是目前世界上最重要的操作系統(tǒng)所適合的CPU產(chǎn)品，這些操作系統(tǒng)包括Android等；我們選擇Arm是因為在Arm上集中了全球最多的應(yīng)用編程人員；我們選擇Arm是因為Arm是代表未來的CPU產(chǎn)品，而不是代表過去的CPU。

X86是平緩的上升曲線，而Arm的成長是垂直提升。而我們應(yīng)該選擇哪個與之合作呢？

記者：但是我們目前并沒有看到Arm在您業(yè)務(wù)中占有非常大的比重？

黃仁勛：你不能關(guān)注在目前的業(yè)務(wù)比重，而應(yīng)該關(guān)注在未來的業(yè)務(wù)比重。當(dāng)你前進的時候，一定要站在時代的前列，而不是人云亦云。

記者：您是否會考慮在GPU中集成X86的CPU？

黃仁勛：不會。我認為Tegra是我們成長最快的個人計算機業(yè)務(wù)。GeForce+Tegra的模式一定會成長。我不知道未來Windows未來會怎么發(fā)展，但是我注意到微軟已經(jīng)通過了對Arm的授權(quán)。微軟是一個軟件公司，而未來世界上最大的軟件市場將會在哪里？——Arm！

我認為所有有遠見的公司都會在Arm進行投入，而不是在X86上進行投入。

記者：昨天我們看到了PGI發(fā)布了CUDA-X86編譯器，我們理解：面向x86平臺的PGI CUDA C編譯器(CUDA-x86)能讓開發(fā)人員在x86架構(gòu)工作站、服務(wù)器、集群上編譯、優(yōu)化和運行CUDA架構(gòu)應(yīng)用程序，有無NVIDIA GPU均可。從這個角度上說，CUDA X86編譯器的出現(xiàn)有何深遠意義？是希望將CUDA架構(gòu)進行更進一步的推廣和普及，還是為了讓編程人員看到CPU在硬件架構(gòu)上的不足而更青睞于進行GPU的編程方式？

另外，您也提到，PGI的CUDA-X86是商業(yè)項目，如果運行效率較低的情況下，您認為應(yīng)該以何種方式進行推廣？

黃仁勛：多核心的CPU解決方案的是不可能與擁有核群GPU的解決方案在延展性達到一樣的執(zhí)行效率的?，F(xiàn)實中很多應(yīng)用中并不能對多核心并行運算進行非常好的擴展性支持。造成這種情況的原因與GPU擁有的高帶寬及運算連貫性有關(guān)，但是不止如此。

即使實際的性能表現(xiàn)并不像使用GPU的擴展性那么好，在CPU使用CUDA X86進行編程還是可以較大幅度提升應(yīng)用運行的效率。如果CUDA可以在一個1000核心的CPU核心集群中運行，執(zhí)行的速度仍然會得到提升，仍然會帶來很多的優(yōu)勢。最重要的優(yōu)勢是CUDA應(yīng)用可以在任何配置下運行。

PGI將會努力提升CUDA X86的性能，我也會努力提升這個編譯器的性能，因為我希望CUDA可以成功，那CUDA一定要在保證應(yīng)用在所有平臺上。

PhysX可以在沒有NVIDIA芯片的iPhone、Xbox 360，PSP都能運行，同樣PhysX也可以在X86和CUDA上運行，我們?yōu)镻hysX在所有的平臺上進行優(yōu)化，因為我們希望PhysX成功。

記者：最了解NVIDIA的是NVIDIA自己，在Tegra上，如果您能提供一個很好的硬件，但是軟件是交給別的人在做，您在未來是否會考慮自己開發(fā)Tegra的操作系統(tǒng)？

您怎么評價Intel的MeeGo，為什么？

您是否會像Apple簡歷自己的Apple Store一樣建立一個自己的CUDA Store。

黃仁勛：第一個問題的答案是：不會。

第二個問題的答案是：這不是個好主意。

第三個問題的答案是：有可能

第一個問題而言，首先，我們需要做一些對全世界有幫助，同時又是我們長項的事情。有很多的公司在開發(fā)操作系統(tǒng)這個領(lǐng)域上非常出色，例如API，Middle Ware，System Software等等。我們不會成為這個領(lǐng)域中的頂尖人物。下一個問題是，我們是否會對全世界有幫助，目前全世界已經(jīng)有很多很好的操作系統(tǒng)，比如說蘋果的IOS、黑莓操作系統(tǒng)、Android、Symbian和Meego。

就第二個問題而言，為什么Intel要做一個全球第六的操作系統(tǒng)？在操作系統(tǒng)中不存在第六名，沒有軟件工程師愿意為排名第六的操作系統(tǒng)寫應(yīng)用程序，你會愿意服務(wù)第五、第四嗎？不會！你會直接選擇第一或者是第二。那么為何Intel要開發(fā)一個Meego系統(tǒng)呢？問題是IOS、 Android、Symbian、Windows Mobile，所有這些操作系統(tǒng)都不知道X86架構(gòu)。如果Intel不做Meego，他們就是排名0！所以Intel沒有其他的選擇。X86在移動市場上沒有未來，X86是企業(yè)級的應(yīng)用。而NVIDIA更沒有必要去做排名第七的操作系統(tǒng)。

如果NVIDIA不做自己的操作系統(tǒng)，就可以去選擇用誰的CPU，我不容遲疑選擇了前五，也就是選擇了Arm的CPU。如果我選擇了對Tegra運行X86，那我就是第二個Intel了！X86是過去的操作系統(tǒng)。

CUDA Store，也許吧，可能。

Tegra 2整合了Arm架構(gòu)的雙核CPU

記者：我們知道針對移動設(shè)備平臺的研發(fā)要比電腦要慢，那么您是否有計劃將CUDA引入Tegra？您是否準備在Tegra設(shè)備上引入3D立體？

黃仁勛：只要軟硬件準備完備，這將非?？?。

3D立體這個想法非常好，我們將會有手持設(shè)備上的3D，并且是裸眼3D。非常完美。

記者：那您是否準備將基于Arm的產(chǎn)品作為臺式機替代品？

黃仁勛：盡管Arm是成長最快的CPU，但是Arm的性能對于處理日常工作而言還是太弱了。Arm的處理能力至少要提升2-4倍以上，才能達到這個要求。我們也需要針對Arm進行功能調(diào)整才能能將其裝入服務(wù)器等其他計算機。

我認為這事時間的問題：10年，肯定沒問問題；5年，有可能；1年，絕對不可能！

NVIDIA自己的Tegra平板電腦樣機

記者：你認為平板電腦替代普通臺式機的時間點在哪里？

黃仁勛：平板電腦沒有鍵盤，而PC（筆記本電腦）是在鍵盤之下的，這是因為筆記本電腦很熱，需要進行風(fēng)道、熱管等方面的設(shè)計和散熱，在設(shè)計上需要更大的空間。

在未來，單片機（SOC）解決方案將會位于顯示屏之后，這意味著鍵盤下面什么都沒有，鍵盤只是個塑料片而已。所以在未來，SOC可能是筆記本的形式，也可能是平板電腦，也可能是一個外接的底座。

從時間上來說，我預(yù)計：5年后，在座的沒有人會帶著PC過來；3年后，大部分人不會帶PC，1年后，有些人不會帶PC了。5年，將是PC行業(yè)的全部壽命。

記者：我想請您預(yù)測一下采用CUDA的圖像處理在未來將會有什么發(fā)展的趨勢？

黃仁勛：圖像處理還是會非常重要。圖像處理是最重要的采用并行計算的民用應(yīng)用。比如說，我們與Adobe的合作很成功，我們與Musemage在未來的Photoshop也十分成功。你也看到Adobe實驗室的可計算攝影功能，可計算攝影是攝影行業(yè)的未來！我認為這是一個很重要的領(lǐng)域，所以我們投入很大。

Musemage：完全基于GPU的圖像處理元件

記者：現(xiàn)在基于GPU的圖像處理軟件越來越多，而無論對于軟件開發(fā)者還是最終用戶而言，也都是希望開發(fā)的軟件既能夠面對AMD和NVIDIA都能達到支持，那么您認為應(yīng)該如何影響普通消費者？

黃仁勛：我們希望先從游戲玩家開始進行影響。游戲玩家受到我們的影響。而普通消費者不同，他們會受到賣場促銷、OEM、朋友之類的影響，直接溝通游戲玩家更加直接。

NVIDIA的GPU云計算產(chǎn)品RealityServer

記者：您怎么看將GPU應(yīng)用于云計算？

黃仁勛：這對我們來說是個絕好的機會，我認為將GPU應(yīng)用于云計算，我們首先面對的問題是要解決云的提供者的解決方案。人們不能只買一片顯卡或者一個芯片，所以我們與IBM、HP、Dell有著合作伙伴關(guān)系。目前全球最大的三個服務(wù)器廠商均有Tesla的解決方案?，F(xiàn)在Amazon可以買這樣的解決方案。

并且IBM、HP、Dell還發(fā)布了1U的刀片服務(wù)器，更加方便擴展。

記者：目前GPU的計算，目前主要應(yīng)用于學(xué)術(shù)界，主要是出于什么優(yōu)勢讓這些結(jié)構(gòu)選用了GPU？

黃仁勛：人們選用GPGPU的原因，主要分為幾類，有些人需要更多的性能，而這個性能是目前CPU集群無法提供的，比如這個房間就是你的機房，你能達到的極限性能就是用CPU填滿這個房間能到的極限性能，而采用GPGPU可以讓你在這個面積上在并行計算中達到10,20甚至50倍的性能提升。

有些人需要移動性的需求，比如GE、西門子、東芝等，他們需要將整間房子的運算性能放進一個箱子里面，放在醫(yī)院或者醫(yī)生的辦公室里。這類用戶不需要性能提升，但是需要體積的減少。

還有一類客戶更加嚴格，他們既需要性能的提升，也需要體積的減小，比如帶上飛機。

還有一類客戶，需要擴展PC的性能，例如Adobe，他們可以用一個集群做可計算視覺效果，但是需要一個PC來剪輯視頻，這就是尺寸決定的。GPU也能可以滿足。

還有一類客戶，需要降低成本，目前的系統(tǒng)可以滿足他們的需求，但是他們需要將這個系統(tǒng)分給很多人用，成本限定了他們需求，而GeForce可以幫助他們解決這類問題。

原因多種多樣，但是總的來說GPGPU可以提升速度，降低成本！

記者：為何此次大會會要公布路線圖？

黃仁勛：因為人們很想知道。

NVIDIA下兩代GPU路線圖

記者：昨天在開場的Keynote演講上你提到了下一代產(chǎn)品Kepler以及更下一代的產(chǎn)品的Maxwell，并且您也提到了針對Tesla產(chǎn)品，最終Maxwell在雙精度運算每瓦特性能上將會有16倍以上的提升，那么您對未來的GPU在雙精度運算性能與功耗之間的平衡是怎么看？

黃仁勛：現(xiàn)在的問題越來越有針對性了?？赡苁?:0.5，也許是2:3，也許是其他的比例。這些都是可能的答案，因為我還需要等待最終的設(shè)計完成。如果結(jié)論是1:0.5的比例的話，也許我將會在GPU中不知更多的SM單元，但是如果每個SM不能夠充分的被利用，我也可能會減少SM單元，但是每個SM單元的效能上進行提升。

再加上在制程以及顯存等方面的選擇，讓這個問題的答案更加復(fù)雜了。這個答案只有在打樣的一年到半年前左右才能夠真正揭曉。

記者：您談到Maxwell與Tesla的提升大約為16倍的性能功耗比，這個提升主要體現(xiàn)在性能上提升上還是功耗的控制上？

黃仁勛：不止16倍，Tesla到Fermi，大致提升3-4倍，F(xiàn)ermi到Kepler的提升大概3-4倍，Kepler到Maxwell的提升大致3-4倍。

這個提升主要體現(xiàn)在性能上，因為功耗一定的。對于整機而言，1000w是一個極限。我們的設(shè)計理念中不會過于強調(diào)晶體管的單個性能。這正是并行計算的優(yōu)勢所在，隨著工藝的提升，晶體管的功耗會越來越低，我們就可以放入更多的晶體管，每個晶體管的性能會有提升，但是并不是

記者：未來會不會將IO加入到GPU的設(shè)計之中？

黃仁勛：這是個好主意，我們也正在進行相關(guān)的嘗試。最大的問題不是物理上的接口問題，而是邏輯接口的問題，目前IO都是直接與系統(tǒng)存儲相連，點用數(shù)據(jù)是需要從系統(tǒng)內(nèi)存通過IO再到GPU，這個過程非常浪費。我認為PCI-E更為適合，PCI-E的貸款足夠進行大規(guī)模數(shù)據(jù)傳輸。主要的瓶頸還是系統(tǒng)內(nèi)存。我希望在未來可以從DMA直接到內(nèi)存，不通過CPU。性能提升不只一翻。

記者：和歐美游戲市場更重視對GPU性能要求較高的單機游戲不同，目前亞洲市場更傾向于對GPU性能要求不非常高的網(wǎng)絡(luò)游戲。對于這個情況，NVIDIA未來會不會在游戲項目合作開發(fā)商提供更多差異化的增值服務(wù)？

黃仁勛：我們在全球有游戲之道項目，前幾天我們在韓國與暴雪一起發(fā)布了星際二，在中國，我們所有主要游戲開發(fā)商建立了聯(lián)系，在美國，我們與暴雪保持緊密的溝通。我們創(chuàng)造了很多游戲開發(fā)商用得到的技術(shù)，例如PhysX就是其中之一。另外還有很多顯示相關(guān)的技術(shù)，像Tessellation等，之后游戲開發(fā)商憑借這些技術(shù)完美他們的游戲?？偟膩碚f，我們并非只是做了游戲之道這個名稱，我們與游戲開發(fā)商一起推動這個產(chǎn)業(yè)。

記者：事實上，目前游戲和圖形硬件的研發(fā)都圍繞微軟DirectX來設(shè)計。那么在未來，您認為NVIDIA能夠從規(guī)則的執(zhí)行者轉(zhuǎn)變?yōu)橐?guī)則的制定者，從硬件上對游戲發(fā)展進行一定程度的規(guī)劃？

黃仁勛：我們研究DirectX，我們也要OpenGL，但是越來越多的，這只是一個底線，越來越多的游戲需要更為復(fù)雜的引擎，我們有3D立體幻鏡引擎、PhysX引擎還有iRay引擎。除了API之外，這些引擎也是非常復(fù)雜的，我們需要為游戲開發(fā)商開發(fā)這些引擎。

我們將支持大眾需要的API，如果DirectX不夠優(yōu)秀了，還會有OpenCL，OpenGL以及CUDA等很多引擎。我們支持所有的這些API，讓游戲開發(fā)商自己選擇適合的API。但是在未來，中間件變得越來越重要。PhysX和iRay對游戲開發(fā)商而言都太過于復(fù)雜了，我們需要將這些中間件做好提供給游戲開發(fā)商。

記者：您認為GPU的幾何單元和曲面細分還能在哪些方面起作用？

黃仁勛：最大的需要視覺計算的領(lǐng)域恰恰是PhysX。PhysX是接下來最主要的應(yīng)用。我們需要將PhysX變得簡單易用并且可擴展。還需要支持所有的物理效果。如果我們想讓游戲變得像電影一樣，那PhysX一定是必要的。

記者：請您談?wù)凣PGPU與APU之間的區(qū)別？

黃仁勛：APU是CPU和GPU的結(jié)合體，而GPGPU是一個GPU與一個CPU分開的。

集成不是個壞想法，但主要是針對降低成本的好辦法。集成之后就降低了創(chuàng)新的速度，所以一旦集成了，就面臨研發(fā)速度的下降。有些人需要非常好的CPU與非常好的GPU，但是一旦集成了，就會出問題。比如說Intel有很好的CPU，而AMD的GPU比Intel的要好，如果將Intel的CPU與AMD的GPU結(jié)合，那一定是一個不錯的APU！你需要很好的CPU和GPU，是因為你有需求，但是有些人不在乎。不過如果是不在乎CPU和GPU性能的人，我想他也一定不在乎APU。所以我認為在GPU和CPU密集的領(lǐng)域如游戲、高性能計算等方面，CPU和GPU還是獨立的。

直到技術(shù)發(fā)展到瓶頸了，才會出現(xiàn)集成的想法，但是你看現(xiàn)在我們的Tesla、Fermi、Kepler、Maxwell的發(fā)展趨勢，不需要集成。

并且APU的功耗很高，據(jù)稱有9w-25w，這在移動設(shè)備上幾乎就是個核電站，會非常熱！對于移動設(shè)備來說，最高的頂限是500mw，實在是太糟了！比太糟還要再糟十倍！■<

0人已贊

国产成人福利在线视频播放下载,成人无码www免费视频在线看,放荡的美妇在线播放,大地资源网最新更新,国产成人精品日本亚洲网站

專訪黃仁勛:CUDA-X86效率遠勝多核CPU

關(guān)注我們