国产成人福利在线视频播放下载,成人无码www免费视频在线看,放荡的美妇在线播放,大地资源网最新更新,国产成人精品日本亚洲网站

泡泡網(wǎng)顯卡頻道 PCPOP首頁      /      顯卡     /      新聞    /    正文

優(yōu)異專業(yè)卡降臨!CUDA市場總經(jīng)理專訪

    泡泡網(wǎng)顯卡頻道5月29日 近日NVIDIA舉行了一次專訪活動,在活動中NVIDIA公司CUDA市場總經(jīng)理Sanford Russell以及中國區(qū)公關(guān)經(jīng)理金洋為大家詳細講解了關(guān)于通用計算以及CUDA 4.0的一些相關(guān)技術(shù),令大家充分了解到了CUDA 4.0在通用計算市場所具備的優(yōu)勢。

111

● NVIDIA公司中國區(qū)公關(guān)經(jīng)理金洋:

    Sanford Russell是負責(zé)GPU計算的全球總監(jiān),簡單來說就是負責(zé)CUDA的。這次過來主要跟大家介紹一下CUDA4.0,再介紹一下CUDA這幾年在業(yè)界的變化,或者說整個公司,包括一些大學(xué)、一些利用CUDA賺錢的公司怎么看CUDA的,一些最新的變化跟大家分享一下。

111

● NVIDIA公司CUDA市場總經(jīng)理Sanford Russell:

    謝謝大家今天來參加這個活動。我是Sanford Russell,是CUDA的市場總監(jiān)。我從1997年就加入了NVIDIA公司,曾經(jīng)做過產(chǎn)品相關(guān)的工作,也做過開發(fā)者,所以在這個職位之前有一些其他方面的經(jīng)驗。從2007年開始,我們就開始了GPU計算方面的工作,當(dāng)時主要是了解客戶的需求,然后有逐步的架構(gòu)和軟件的進行。大家如果有什么問題,關(guān)于過去還有關(guān)于現(xiàn)在以及如何發(fā)展到今天這一步的問題,都可以問。

    我這個團隊所從事的主要工作是圍繞著整個硬件的生產(chǎn)系統(tǒng)所有的這些開發(fā)者、編程和合作伙伴,還有我們所支持的軟件開發(fā)出來的語言對于GPU計算的支持,包括像C/C++、Fortran、Direct等等這些。這張圖就可以說明我們?nèi)粘9ぷ鞯年P(guān)注內(nèi)容。

    三、四年之前,我們主要關(guān)注的工作是在語言、編譯器這一塊,最近一、兩年更多的工作放在了像數(shù)學(xué)庫,以及如何在整個平臺上實現(xiàn)成本的管理,特別是像娛樂集群,有些用戶會用非常多的GPU,可能是幾百臺,甚至可能是更大規(guī)模的集群,所以涉及到這上面兩塊,一個是集群的管理,還有工具和合作方、合作者這一塊有專門的團隊來負責(zé)這方面的工作,隨著我們的產(chǎn)品和技術(shù)的成熟,這方面工作的量也會越來越大。

    上面所指的涉及到的是與軟件開發(fā)公司之間的合作,這個在公司有另外一位高層來負責(zé)這方面的工作。針對于每一個具體的應(yīng)用行業(yè),像油氣、制造業(yè)、金融、化學(xué)、生物等等,這些專門的行業(yè)都有專門指定的人和相應(yīng)軟件的開發(fā)合作伙伴一起工作?,F(xiàn)在圍繞CUDA已經(jīng)有一個非常大的團隊,一開始只有4個人,現(xiàn)在有一個非常大的團隊,而且是分屬不同的業(yè)務(wù)部門。所以GPU計算對于我們公司來說是具有戰(zhàn)略性的,不僅僅是一個簡單的產(chǎn)品,可是你看到的只是一個簡單的東西,但是背后有很多的東西,包括軟件。

● NVIDIA公司中國區(qū)公關(guān)經(jīng)理金洋:

    NVIDIA并不像很多人認為的那樣,只是簡單地做Tesla,做CUDA,這是初期的事情?,F(xiàn)在考慮真正讓用戶將GPU的硬件和CUDA集成在一起。我們做了很多管理工作,做了很多支持工具和溝通工作,使得我們這邊的支持和服務(wù)讓用戶真正可以方便的應(yīng)用到GPU,而不僅僅簡單的說這是一個卡,我們真正從頭到尾一步一步給用戶支持,讓他真正實現(xiàn)利用GPU的性能。

● NVIDIA公司CUDA市場總經(jīng)理Sanford Russell:

    這個是過去兩年當(dāng)中,我們開展非常重要的工作方面,涉及到研究和教育方面。這對于現(xiàn)在GPU的工作來說是非常重要的一塊,因為在五、六年之前,可能這是比較新的領(lǐng)域,但是現(xiàn)在可以看到,已經(jīng)有很多大學(xué)他們已經(jīng)開設(shè)了GPU的課程。右邊是CUDA的教學(xué)中心,中間這個是CUDA的研究中心,左邊是CUDA的卓越中心,卓越中心在中國有兩個。從這個上面就可以看出,現(xiàn)在整個CUDA的研究還有教學(xué)增長非常迅速,規(guī)模也是越來越大。很多大學(xué)現(xiàn)在都有CUDA的相關(guān)課程,主要是使用C和C++語言,往往本來就有C語言的課程,現(xiàn)在再加入了與CUDA相關(guān)的內(nèi)容。全世界總共有400多家大學(xué)有與CUDA相關(guān)的教學(xué)課程,這樣從全世界的地域來說有一個很好的覆蓋性,同時通過這些大學(xué)畢業(yè)出來的學(xué)生,他們都掌握了GPU編程的能力。

    這些是一些與CUDA有關(guān)的書,左下角兩本是新出的,叫《GPU COMPUTING GEMS》,書很厚,有800頁左右。大學(xué)的教授要編這些書,就請大家提交相關(guān)材料,后來提交的相關(guān)文章太多了,結(jié)果就編了兩本書,因為如果一本書有1600頁就太多了,所以最終出了兩本書。

    從我們的角度來說,有一點希望大家能夠非常清晰的認識到,我們對于GPU計算的看法不是把CPU和GPU對立起來,應(yīng)該是CPU+GPU,從而實現(xiàn)非常好的的性能。為了實現(xiàn)非常好的的性能,就需要能夠充分利用CPU所有的核再加上GPU的能力。

    這就是GPU編程,對于GPU編程來說,就是把里面這些關(guān)鍵的功能可以用GPU進行加速的功能給挑出來,而這些應(yīng)用代碼現(xiàn)在主要都是用C語言來寫的。為什么CUDA的C語言會有這么多的人去用?因為它本來就是一個用的比較多的語言,我們所提供的是一個C語言的編譯器,使得這些編譯者可以直接對GPU進行編譯。除此以外,我們有一些合作方他們提供的解決辦法,像PGI的解決辦法,他們的做法是類似的,只是用的不是C語言,是Fortran語言?,F(xiàn)在主要用的比較多的是C語言和Fortran語言,而對于API來說,處于非常低層,因此現(xiàn)在要通過編程來使用是比較麻煩的。但是我們相信隨著時間的推移,可能這一點會有所改善。但是無論對于API還是對于語言本身,我們對會對它進行支持,這個是我的策略。所以現(xiàn)在支持的像C語言、C++、Fortran、OpenGL,還有Direct等等都有支持的,我們有合作伙伴在做.net的工作,這也讓我們感到非常振奮,因為這樣可以和微軟整個語言系列結(jié)合起來。

    這是我們的行業(yè)合作伙伴的圖片,大家可以看到,就從這個架構(gòu)上來說,我們看垂直的行業(yè),我們公司內(nèi)部的架構(gòu)上,也是把這個架構(gòu)跟這些垂直的行業(yè)匹配起來?,F(xiàn)在就行業(yè)和研究的覆蓋范圍已經(jīng)相當(dāng)大了,但隨著時間,我們希望把更多的行業(yè)和領(lǐng)域納入進來,這樣就要求以支持更多的語言或者支持更多的語言特性或者添加庫,這些就是我們現(xiàn)在要開展工作的地方。比較新的一個行業(yè)就是制造業(yè),制造業(yè)本身也是非常重量級的行業(yè),比如像汽車、飛機、火車,還有巴士、輪船等等,他們的設(shè)計很多都會用到這個軟件。

● NVIDIA公司CUDA市場總經(jīng)理Sanford Russell:

    簡單講一下CUDA 4.0,這個是最新的版本。很快就會出貨,現(xiàn)在還是屬于RC的階段(發(fā)行候選的階段),等待著開發(fā)者給我們提供一些建議。這個上面是我們出的各個不同的版本以及所針對的目標,1.0主要是針對研究者和一些比較早嘗試使用的人。在2.0的時候,就增加了一些雙精度的library,主要是針對一些科學(xué)界的人士和一些HPC的運動。在3.0的時候,就有了更多的library,我們也有了開發(fā)的工具,使得在這個階段就可以讓一些軟件的開發(fā)者也開始在使用。到4.0的時候,就使得整個使用更加的便利,所有的這些特性設(shè)計都有這一點考慮在內(nèi)。

    盡管CUDA 4.0有很多的特性,上面列出的三點對于現(xiàn)在的開發(fā)者來說是最為重要的。

    第一個就是虛擬地址。左邊這個就是原來的情況,對于原來的軟件來說,開發(fā)者得自己知道這個內(nèi)存到底在哪里。也就是說,對于每一個內(nèi)存空間都有相應(yīng)的獨特的地址。到右邊這個新的4.0就不一樣了,整個系統(tǒng)內(nèi)存,還有顯存是有一個單一的地址空間。這個就好像一個圖書館一樣,你把一本書放進去了,原來有幾個房間,你得記住到底在什么地方,現(xiàn)在就變成一個房間,所以對于開發(fā)者來說,尤其剛剛用CUDA的開發(fā)者來說,會變得簡單一些。要強調(diào)的是,所有這些新的改進特性都是基于我們所收到的客戶反饋,這就是為什么在CUDA C上面有這么快的轉(zhuǎn)變,我們收到反饋以后,做出一些調(diào)整,做出一些新的設(shè)計,新的設(shè)計讓他們?nèi)ピ囉?,再聽他們的意見,然后出去的結(jié)果再去試,再讓整個市場受益。

● NVIDIA公司中國區(qū)公關(guān)經(jīng)理金洋:

    NVIDIA并不是閉門造車,我們CUDA之所以被這么多的用戶所接受,是因為我們在開發(fā)的過程中跟他們進行溝通,他們的意見很大程度上都能在下一款的CUDA上得到改進。所以CUDA的目的以及CUDA在研發(fā)過程中,都是以用戶的需求為最根本的問題來解決。

● NVIDIA公司CUDA市場總經(jīng)理Sanford Russell:

    第二個特性就是GPUDirect v2.0,原來有多個GPU,希望在兩個GPU之間實現(xiàn)信息或者數(shù)據(jù)的傳輸,先需要把一個GPU的內(nèi)容傳到系統(tǒng)內(nèi)存里面,再從系統(tǒng)內(nèi)存考到另外一個GPU,然后還要釋放系統(tǒng)內(nèi)存,所以整個過程還是比較復(fù)雜的。2.0的不一樣之處是實現(xiàn)了數(shù)據(jù)在兩個GPU之間直接的傳輸,這樣顯然對于代碼來說,相對來說比之前要減少,而且速度也會加快。應(yīng)該說所有的這些改進都是以客戶需求為本的,所以所有的這些都是以客戶告訴我們他們需要什么,他們有什么問題,我們來提供解決辦法,幫助客戶、幫助行業(yè)來解決這個問題。

    現(xiàn)在可以看到,這個上面兩個版本的GPU Direct,1.0主要是同一個系統(tǒng)之間的;2.0是針對一個系統(tǒng)之內(nèi)。所以現(xiàn)在開始解決這種非常大的集群之內(nèi)的問題。

    接下來這張圖是Thrust,就是一個編程環(huán)境,類似于C++里面的標準模板庫,這里只不過是在GPU里面提供了這么一個Thrust。這是我們所支持的一種非常標準的C++的編程模式。原來是來自于NVIDIA的研究項目,我們支持的open google這個項目有一年多的時間,后來把它拿到了我們這個產(chǎn)品當(dāng)中,作為其中的特性之一。也很好的實現(xiàn)了CPU和GPU之間的合作,通過Thrust這個設(shè)計,可以讓更適合的處理器完成相應(yīng)的工作,主要看這個處理器有沒有能力完成這項相應(yīng)的工作而來分配這項任務(wù)。

    剛才只是簡單的講了CUDA 4.0的三個特性,實際上有很多的特性,但我認為這三個是最重要的,有助于大家理解CUDA 4.0一些比較新的地方。

    簡單的理解,CUDA架構(gòu)就是讓之前只能處理圖像渲染的GPU通用化處理任何類型的計算,而能夠?qū)崿F(xiàn)任意類型計算的處理器只有CPU,但CPU的計算能力相對于CPU來說很弱,尤其是在處理一些高性能計算的時候CPU的性能明顯不足。GPU的通用化可以讓需要高性能計算的時候直接調(diào)用GPU進行計算,CPU僅僅是處理程序本身的一些工作。

開創(chuàng)視覺計算帝國GTX280/260權(quán)威評測

    目前,支持CUDA的GPU銷量已逾1億,數(shù)以千計的軟件開發(fā)人員正在使用免費的CUDA軟件開發(fā)工具來解決各種專業(yè)以及家用應(yīng)用程序中的問題。這些應(yīng)用程序從視頻與音頻處理和物理效果模擬到石油天然氣勘探、產(chǎn)品設(shè)計、醫(yī)學(xué)成像以及科學(xué)研究,涵蓋了各個領(lǐng)域。目前市面上已經(jīng)部署了超過一億顆支持CUDA的GPU,數(shù)以千計的軟件開發(fā)人員正在使用免費的CUDA軟件工具來為各種應(yīng)用程序加速。

開創(chuàng)視覺計算帝國GTX280/260權(quán)威評測

● CUDA 4.0架構(gòu)版本其它特性與功能:

    MPI與CUDA應(yīng)用程序相結(jié)合,當(dāng)應(yīng)用程序發(fā)出MPI收發(fā)調(diào)用指令時,例如OpenMPI等改編的MPI軟件可通過Infiniband與顯卡顯存自動收發(fā)數(shù)據(jù)。

    GPU多線程共享,多個CPU主線程能夠在一顆GPU上共享運行環(huán)境,從而使多線程應(yīng)用程序共享一顆GPU變得更加輕松。

    單CPU線程共享多GPU,一個CPU主線程可以訪問系統(tǒng)內(nèi)的所有GPU。 開發(fā)人員能夠輕而易舉地協(xié)調(diào)多顆GPU上的工作負荷,滿足應(yīng)用程序中“halo”交換等任務(wù)的需要。

    全新的NPP圖像與計算機視覺庫,其中大量圖像變換操作讓開發(fā)人員能夠快速開發(fā)出成像以及計算機視覺應(yīng)用程序。

點擊下載開發(fā)包

    去年NVIDIA給我們帶來其首款DX11產(chǎn)品Fermi的時候,全新的架構(gòu)設(shè)計與近乎完美的執(zhí)行效率讓我們深刻的感受到NVIDIA在技術(shù)上的強大。NVIDIA的工程師為了讓顯卡能夠真正體現(xiàn)出優(yōu)勢,并沒有像AMD那樣僅僅是對上一代產(chǎn)品的架構(gòu)進行升級,而是采用了全新的架構(gòu)設(shè)計。不得不說,F(xiàn)ermi確實是一款非常優(yōu)秀的產(chǎn)品。

111

    上一代GF100核心擁有多達30億個晶體管,堪稱史上最復(fù)雜的GPU,超大的晶體管規(guī)模導(dǎo)致GF100核心功耗偏高。所以,最后當(dāng)時NVIDIA決定在GF100核心的基礎(chǔ)上屏蔽了一組流處理器(從512個降到了480個),以控制顯卡的整體功耗。因此當(dāng)時基于GF100核心的桌面級以及專業(yè)級的優(yōu)異產(chǎn)品流處理器均為480個。

111

    隨著GF100改進版本——GF110的發(fā)布,彌補了GF100在流處理器數(shù)量上的遺憾,從480個流處理器提升到了512個流處理器,這樣在顯卡的3D以及通用計算性能上就有進一步的提升?;贕F110的桌面級產(chǎn)品已于去年正式發(fā)布,而目前面向于專業(yè)級的產(chǎn)品也已經(jīng)發(fā)布——M2090。

    對于NVIDIA以及任何芯片設(shè)計公司來說,改進工藝都是他們非常重視的一件事情,也同樣是芯片生產(chǎn)廠商(這里特指臺積電)非常重視的事情。改進工藝可以讓生產(chǎn)效率得以提高、可以讓良品率更有保障、甚至可以讓芯片的性能更加出色。M2090就是一款采用改進的40nm工藝制程的產(chǎn)品,改進后的工藝帶來了更低的功耗、更低的溫度以及更好的執(zhí)行效率。

    記者:我想問幾個關(guān)于硬件方面的問題,關(guān)于NVIDIA最近的Tegra產(chǎn)品比較火爆,請問NVIDIA是否有計劃將關(guān)于CUDA方面一些比較便捷的應(yīng)用移植到Tegra產(chǎn)品系列中來?

    NVIDIA公司CUDA市場總經(jīng)理Sanford Russell:現(xiàn)在講未來計劃可能還是不行,但是對于公司來說,毫無疑問,CUDA是一項具有戰(zhàn)略意義的產(chǎn)品。

111

    記者:下一步NVIDIA工作的重點將如何在CUDA的運算上和在圖形渲染方面做出平衡?下一代硬件會像之前480那樣,推出一種通用型的架構(gòu)核心,還是專門針對Tesla和GeForce研發(fā)出來兩種不同的核心呢?

    NVIDIA公司CUDA市場總經(jīng)理Sanford Russell:現(xiàn)在我們是用統(tǒng)一的核,這個策略現(xiàn)在還是非常成功的。但是對于高性能計算,有一些專門的版本,但是核的架構(gòu)還是一樣的。而這一點對于開發(fā)者來說也非常重要,這樣使得他們可以針對于現(xiàn)在已經(jīng)有的2億5000萬個具有CUDA GPU進行編程。對于我們來說,我們認為最關(guān)鍵的就是對于適當(dāng)市場的關(guān)注必須要確保,對重要的特性我們是需要支持的,比如像對于高性能計算這個市場,比如說像錯誤修正,還有雙精度,這些對于Tesla這個產(chǎn)品系列顯然是非常重要的。我們的架構(gòu)師是非常聰明的,所以他們可以幫助我們來實現(xiàn)這一點。

    記者:我的最后一個問題,之前NVIDIA放出了一個關(guān)于光線追蹤的demo,基于CUDA并行計算的光線追蹤何時能進入到一個平民化和實用化的階段?是否有計劃CUDA與游戲開發(fā)廠商合作來推出一種游戲圖形引擎呢?

    NVIDIA公司CUDA市場總經(jīng)理Sanford Russell:現(xiàn)在AutoDesk就在用我們的產(chǎn)品,他們的demo應(yīng)該是一年前就有了,現(xiàn)在也已經(jīng)開始出貨了,其他的一些合作方應(yīng)該也有,但我現(xiàn)在還不能說。

    NVIDIA公司中國區(qū)公關(guān)經(jīng)理金洋:光線追蹤我們真正在做的是引擎,iRay,我們收購這家公司之前他是基于CPU的,效率比較低?,F(xiàn)在把iRay用CUDA,現(xiàn)在iRay光線追蹤引擎在GPU上跑的速度非常快,而這個引擎被業(yè)界非常多的公司所采納,像AutoDesk。NVIDIA不會推出一個實際的產(chǎn)品給用戶,我們還是做引擎,站在客戶后面,像AutoDesk,像其他一些公司利用這個引擎去做光線追蹤,光線追蹤已經(jīng)在NVIDIA幫助之下,已經(jīng)實現(xiàn)實用化了。

    NVIDIA公司CUDA市場總經(jīng)理Sanford Russell:對于游戲來說,CUDA最大的使用是在物理引擎,因為它需要對編語言,在物理引擎方面,是使用CUDA是最多的一部分。

    NVIDIA公司中國區(qū)公關(guān)經(jīng)理金洋:所有的PhysX都使用CUDA,PhysX就是CUDA在游戲、物理計算方面的一個表現(xiàn)。CUDA或者說整個GPU并行的計算體系在PhysX上是得到最大的體現(xiàn)。大家看PhysX和CUDA是兩個不同的東西,其實PhysX是基于CUDA去做的,CUDA最成熟、集成度廣的就是PhysX。

    NVIDIA公司CUDA市場總經(jīng)理Sanford Russell:對于PhysX的開發(fā)來說,是用C語言進行的,所以對于開發(fā)者來說,CUDA C就是他們非常自然的一個選擇。

    NVIDIA公司中國區(qū)公關(guān)經(jīng)理金洋:我們提供非常多的選擇給游戲開發(fā)商,游戲開發(fā)商會不會基于CUDA編寫這個游戲是取決于他們自己,可能現(xiàn)在并不是他們所需要的,對于游戲開發(fā)商來說,他們熟悉的是OpenGL,還有Direct X,這些方面是他們熟悉的工具,同時還有PhysX,非常方便的利用到CUDA的性能。如果有一天有一個游戲開發(fā)商說不需要Open GL,想用CUDA,這個沒問題?,F(xiàn)在就提供他最習(xí)慣用的解決方案?!?

0人已贊

關(guān)注我們

泡泡網(wǎng)

手機掃碼關(guān)注