專訪黃仁勛:CUDA-X86效率遠(yuǎn)勝多核CPU
記者:為何此次大會會要公布路線圖?
黃仁勛:因為人們很想知道。
NVIDIA下兩代GPU路線圖
記者:昨天在開場的Keynote演講上你提到了下一代產(chǎn)品Kepler以及更下一代的產(chǎn)品的Maxwell,并且您也提到了針對Tesla產(chǎn)品,最終Maxwell在雙精度運算每瓦特性能上將會有16倍以上的提升,那么您對未來的GPU在雙精度運算性能與功耗之間的平衡是怎么看?
黃仁勛:現(xiàn)在的問題越來越有針對性了??赡苁?:0.5,也許是2:3,也許是其他的比例。這些都是可能的答案,因為我還需要等待最終的設(shè)計完成。如果結(jié)論是1:0.5的比例的話,也許我將會在GPU中不知更多的SM單元,但是如果每個SM不能夠充分的被利用,我也可能會減少SM單元,但是每個SM單元的效能上進(jìn)行提升。
再加上在制程以及顯存等方面的選擇,讓這個問題的答案更加復(fù)雜了。這個答案只有在打樣的一年到半年前左右才能夠真正揭曉。
記者:您談到Maxwell與Tesla的提升大約為16倍的性能功耗比,這個提升主要體現(xiàn)在性能上提升上還是功耗的控制上?
黃仁勛:不止16倍,Tesla到Fermi,大致提升3-4倍,F(xiàn)ermi到Kepler的提升大概3-4倍,Kepler到Maxwell的提升大致3-4倍。
這個提升主要體現(xiàn)在性能上,因為功耗一定的。對于整機而言,1000w是一個極限。我們的設(shè)計理念中不會過于強調(diào)晶體管的單個性能。這正是并行計算的優(yōu)勢所在,隨著工藝的提升,晶體管的功耗會越來越低,我們就可以放入更多的晶體管,每個晶體管的性能會有提升,但是并不是
記者:未來會不會將IO加入到GPU的設(shè)計之中?
黃仁勛:這是個好主意,我們也正在進(jìn)行相關(guān)的嘗試。最大的問題不是物理上的接口問題,而是邏輯接口的問題,目前IO都是直接與系統(tǒng)存儲相連,點用數(shù)據(jù)是需要從系統(tǒng)內(nèi)存通過IO再到GPU,這個過程非常浪費。我認(rèn)為PCI-E更為適合,PCI-E的貸款足夠進(jìn)行大規(guī)模數(shù)據(jù)傳輸。主要的瓶頸還是系統(tǒng)內(nèi)存。我希望在未來可以從DMA直接到內(nèi)存,不通過CPU。性能提升不只一翻。
關(guān)注我們
