三張新顯卡齊發(fā)布!一文總結(jié)英偉達RTX 40系列顯卡亮點何在
9月20日的晚上11點,英偉達召開了主題為“AI 和元宇宙時代的加速計算大會”的GTC活動。在此次的GTC活動上,英偉達在時隔兩年后,正式發(fā)布了新一代的顯卡產(chǎn)品——RTX 40系列顯卡。
此次英偉達發(fā)布的RTX40系列顯卡共有三款產(chǎn)品,分別是RTX 4090、RTX 4080 16GB、RTX 4080 12GB三款顯卡,這三款顯卡都換用了全新的核心架構(gòu),其架構(gòu)命名延續(xù)了英偉達從歷史知名科學(xué)人物上取材的命名傳統(tǒng),定名為Ada Lovelace (艾達·洛夫萊斯)架構(gòu)。
關(guān)于Ada Lovelace (艾達·洛夫萊斯):這一位女性是著名英國詩人拜倫之女,數(shù)學(xué)家。計算機程序創(chuàng)始人,建立了循環(huán)和子程序概念,被認為是計算機程序的創(chuàng)始人。
關(guān)于此次發(fā)布的RTX 40系列顯卡:
英偉達在這一次發(fā)布的RTX 40系列顯卡采用的是全新的Ada Lovelace (艾達·洛夫萊斯)架構(gòu)核心,這核心采用的是來自臺積電的4nm工藝制造,擁有760億個晶體管和超過18000個CUDA核心,相比較于上一代Ampere架構(gòu)核心多了70%。
作為此次發(fā)布的RTX 40系列顯卡核心,Ada Lovelace 核心將其中的SM多單元處理器、RT Core(光追核心)以及Tensor Core(可理解為AI核心)都進行了換代升級,其中的RT Core(光追核心)擁有兩倍的光線與三角形求交性能,并且通過全新的引擎來減少了開銷,Tensor Core則是提升了性能。
Ada Lovelace 核心性能提升的一大關(guān)鍵是來自于SM多單元處理器方面的升級,英偉達全新引入了Shader Execution Reordering這一項著色器執(zhí)行重排序技術(shù),通俗的話說起來就是讓GPU的處理過程也有了類似于CPU處理過程中的亂序處理能力,可以有效的提升性能,可獲得2-3倍的光線追蹤性能提升。
而RTX 40系列顯卡除了換用全新的Ada Lovelace 核心獲得性能提升以外,還加入了DLSS 3.0技術(shù),DLSS 3.0技術(shù)包含四項組件,而在其中最為關(guān)鍵的是新加入的AI幀生成器。而這一個技術(shù)相比較于DLSS 2.0此前采用AI在高幀率幀和低幀率幀中進行讀取重渲染的過程而生成中間幀的過程有所區(qū)別,DLSS 3.0是利用深度學(xué)習(xí)的AI在像素級幀到幀方向的運動、速度信息基礎(chǔ)上進行預(yù)測并通過一系列的處理在不影響原有游戲處理管線的情況下進行中間幀的生成,大幅度提高了游戲的幀數(shù)表現(xiàn)。這一個DLSS 3.0技術(shù)在英偉達的演示中,表現(xiàn)非常出色,也是此次發(fā)布的三張RTX 40系列顯卡原有極大性能提升的一個關(guān)鍵。
在具體的參數(shù)規(guī)格上,由于目前尚未更多的信息流出,例如RT核心數(shù)量、Tensor Core數(shù)量等信息,所以筆者匯總的這一個表格是RTX 40系列顯卡的部分關(guān)鍵參數(shù),大致可以作為參考。
從英偉達公布的參數(shù)以及筆者收集到的參數(shù)信息可知,RTX 4090使用AD102-300核心 臺積電4nm制程,配備24GB的美光GDDR6X顯存擁有384bit顯存位寬,顯存帶寬為1008GB/s。其核心配備的CUDA數(shù)量為16384,核心頻率基準(zhǔn)頻率為2230MHz,BOOST頻率為2520MHz,設(shè)計TGP為450W,定價為1599美刀,國內(nèi)建議12999元起步。
RTX 3080 16GB使用AD103-300核心,臺積電4nm制程,配備16GB的美光GDDR6X顯存擁有256bit顯存位寬,顯存帶寬為720GB/s。其核心配備的CUDA數(shù)量為9728,核心頻率基準(zhǔn)頻率為2210MHz,BOOST頻率為2505MHz,設(shè)計TGP為350W,定價為1199美刀,國內(nèi)建議9199元起步。
RTX 3080 12GB使用AD103-400核心,臺積電4nm制程,配備16GB的美光GDDR6X顯存擁有192bit顯存位寬,顯存帶寬為504GB/s。其核心配備的CUDA數(shù)量為7680,核心頻率基準(zhǔn)頻率為2310MHz,BOOST頻率為2610MHz,設(shè)計TGP為285W,定價為899美刀,國內(nèi)建議7199元起步。
(個人認為這一個RTX 4080 12GB的規(guī)格更像是RTX 4070 Ti級別或者70級別的規(guī)格,但是老黃這波拉到80級別了,價格也是非常感人)。
以上是老黃發(fā)布的三款全新顯卡參數(shù)以及價格,那么相比較于RTX 30系列同級別的顯卡,這三種顯卡提升在哪?
相比較RTX 30系列同級別顯卡:
此次發(fā)布的RTX 40系列顯卡從參數(shù)上一眼可知的就是其CUDA數(shù)量的大幅度升級,以及頻率上的極大提升。這部分提升應(yīng)該是得益于英偉達的設(shè)計改進以及臺積電4nm工藝的組合,因此在性能方面,RTX 40系列的升級相比較于RTX 30系列的升級肯定是有,但具體的多少還需要實際測試才知道。
個人認為RTX 40系列相比較于RTX 30系列最大的升級來自于全新的SM多單元處理器、RT Core、Tensor Core加上DLSS 3.0技術(shù)帶來的提升。個人的想法是,RTX 40系列顯卡核心所配備的SM多單元處理器加入的Shader Execution Reordering帶來了處理能力上的提升,RT Core則在光追性能上帶來了升級。最為關(guān)鍵的提升應(yīng)該是Tensor Core帶來的AI算力、深度學(xué)習(xí)能力提升,以及建構(gòu)在AI性能上DLSS 3.0帶來的渲染中間幀性能升級,從而帶來了游戲性能的提升(具體等待實測)。
相比較于RTX 30系列顯卡,RTX 40系列可謂是在Shader+RT Core+Tensor Core+DLSS 3.0都擁有了全方位的提升,特別是其中Tensor Core+DLSS 3.0的升級,也符合了英偉達在后續(xù)提出的生產(chǎn)力以及自動駕駛等方面技術(shù)的一大基點(AI性能的需求升級)。除此之外,RTX 40系列的能耗比根據(jù)英偉達的說法,也是升級了不少,從RTX 4090系列相比較于RTX 3090僅提升100W的TGP而理論性能提升近翻倍的情況下,確實控制得還算可以。
RTX 40系列顯卡相比較于RTX 30系列顯卡的升級,個人認為提升應(yīng)該是較為明顯的,但需要實測進一步來體現(xiàn),對于游戲玩家來說,還需要等待一系列游戲適配支持,來充分發(fā)揮顯卡的性能優(yōu)勢。而對于面向渲染、AI之類的學(xué)習(xí)來說,RTX 40系列的也是相比較于RTX 30好上不少。
當(dāng)然RTX 40系列的價格也是相比較于RTX 30系列高上挺多,RTX 4080 12GB的價格居然要拉到899美刀起售,國內(nèi)建議零售價為7199元起,這個價格,擺明了老黃想繼續(xù)清RTX 30系列顯卡的心態(tài)了。
總結(jié)一下想法:
其實看完發(fā)布會全程,可以發(fā)現(xiàn),老黃對于顯卡的介紹匆匆?guī)н^,后續(xù)講的很多的內(nèi)容都是圍繞本次大會的主題:“AI 和元宇宙時代的加速計算大會”,重點講述了英偉達Omniverse在元宇宙這一方面的強力作用。AI在自動駕駛領(lǐng)域等方面的應(yīng)用等,整一場大會的核心內(nèi)容是To B端的,RTX 40系列更像是在To B過程中拿出一部分的技術(shù)進行下放帶給To C用戶的內(nèi)容,RTX 40系列顯卡上升級非常明顯的Tensor Core加上DLSS 3.0或許就是來源于To B的技術(shù)。
重點轉(zhuǎn)向To B,加上此前傳聞RTX 30系列顯卡擁有過多的擠壓庫存,或許就是此次RTX 40系列顯卡定價高昂的一大原因,單價的提升有利于英偉達在市場整體需求下降的情況下,可以用更高的利潤率來獲得相近的收入,而我們也可以看到,相比較于往年的80/70級別顯卡,此次的RTX 4080顯卡定價可謂非常高。在今晚發(fā)布的三張RTX 4090系列顯卡中,RTX 4090顯卡或?qū)碛凶罡叩男詢r比,對于極致發(fā)燒的游戲玩家、渲染工作的用戶、需要AI能力來“煉丹”的用戶來說,RTX 4090相比較于RTX 3090提價并不多,性價比應(yīng)該是最高的。(但是這一代顯卡的價格是真貴啊,不知道有多少計劃購買80/70級別顯卡的游戲玩家這波要被勸退,DIY市場太難了)
英偉達在這一次GTC大會提出的部分觀點個人也是比較認可的,隨著顯卡性能的提升,未來的游戲可以無預(yù)先的烘焙,而是來自實時的烘焙渲染技術(shù)而來的,未來的游戲世界將是仿真的世界。因此希望無論是游戲也好、元宇宙也罷,隨著技術(shù)的發(fā)展,可以為我們帶來另一種平行世界的時空體驗吧。
關(guān)注我們


