引爆游戲視覺革命!NV助力游戲業(yè)發(fā)展
七個月之后,NVIDIA發(fā)布了GF100核心的改進版本——GF110,直接對應的零售產品就是GTX580。大家已經(jīng)知道,GTX580從某種角度上來說是GTX480的改進版本,首先是彌補了GTX480在流處理器數(shù)量上的遺憾,從GTX480的480個流處理器提升到了512個流處理器,這樣在顯卡的3D性能上就有進一步的提升。
GTX480是通過在GF100核心上屏蔽了一組SM流處理器簇將原本的512個流處理器降到480個的。而在這個架構中,一個SM并不只是有32個流處理器,還包含16/48KB的動態(tài)分配緩存、4個紋理單元和一個多形體引擎。所以,GTX580相對于GTX480從硬件規(guī)格上來看并不僅僅是提升了32個流處理器,準確的說是提升了一個SM。看過我們之前的GTX480架構解析的朋友應該知道,GTX480是通過在GF100核心上屏蔽了一組SM(流處理器簇)將原本的512個流處理器降到480個的。而在這個架構中,一個SM并不只是有32個流處理器,還包含16/48KB的動態(tài)分配緩存、4個紋理單元和一個多形體引擎。所以,GTX580相對于GTX480從硬件規(guī)格上來看并不僅僅是提升了32個流處理器,準確的說是提升了一個SM。
● 16/48KB動態(tài)分配緩存
GF100/GF110核心的緩存設計非常有意思,采用的是L1和共享緩存動態(tài)分配總容量為64KB緩存的設計,這部分緩存可配置為16KB的一級緩存+48KB共享緩存,或者是48KB一級緩存+16KB共享緩存。這種劃分方式完全是動態(tài)執(zhí)行的,一個時鐘周期之后可自動根據(jù)任務需要即時切換而不需要程序主動干預。
一級緩存與共享緩存是互補的,共享緩存能夠為明確界定存取數(shù)據(jù)的算法提升存取速度,而一級緩存則能夠為一些不規(guī)則的算法提升存儲器存取速度。在這些不規(guī)則算法中,事先并不知道數(shù)據(jù)地址。
● 4個紋理單元
顧名思義,紋理單元就是專門用于渲染3D物體表面紋理的模塊,在圖形紋理越來越復雜的今天,紋理單元的重要性不言而喻。GTX580因為相對于GTX480增加了一組SM,所以紋理單元數(shù)量也得到了相應的增加。
在GF100/110架構中,每一組SM中包含4個紋理單元,完整版的核心中一共有16個SM,所以GTX580一共擁有64個紋理單元,而GTX480由于屏蔽了一組SM,所以只有60個紋理單元。
值得一提的是,GF100/110架構中的紋理單元直接集成到了SM內部,且每組SM中擁有獨立的紋理緩存(4個紋理單元共享這部分獨立的紋理緩存),這樣的設計打破了之前紋理單元一直被設計在SM外圍的傳統(tǒng),有效的提升了紋理效率。雖然從紋理單元的數(shù)量方面來說看起來比GT200架構還少,但實際效率卻高很多。
關注我們
