終極旗艦降臨!NV黑版TITAN首發(fā)測試
Kepler GK110 中的新功能,如 CUDA 內核能夠利用 Dynamic Parallelism 在 GPU 上直接啟動工作,需要 Kepler 中 CPU‐to‐GPU 工作流提供比 Fermi 設計增強的功能。Fermi中,線程塊的Grid可由CPU啟動,并將一直運行到完成,通過 CUDA Work Distributor (CWD) 單元創(chuàng)建從主機到SM的簡單單向工作流。Kepler GK110目的是通過GPU有效管理CPU和CUDA創(chuàng)建的工作負載來改進 CPU‐到‐GPU 的工作流。
我們討論了 Kepler GK110 GPU 允許內核直接在GPU上啟動工作的能力,重要的是要理解在Kepler GK110 架構所做的變化,促成了這些新功能。Kepler 中,Grid 可從 CPU 啟動,就和Fermi 的情況一樣,但是新 Grid 還可通過編程由 CUDA 在 Kepler SMX 單元中創(chuàng)建。要管理CUDA 創(chuàng)建的 Grid 和主機生成的 Grid,在 Kepler GK110 中引入新 Grid Management Unit (GMU)。該控制單元管理并優(yōu)先化傳送到 CWD 要發(fā)送到 SMX 單元執(zhí)行的 Grid。
Kepler 中的 CWD 保留準備好調度的 Grid,并能調度 32 個活動的 Grid,這是 Fermi CWD 容量的兩倍。Kepler CWD 通過雙向鏈接進行通信,允許 GMU 暫停新 Grid 的調度并保留掛起和暫停的 Grid,直到需要。GMU 也有到 Kepler SMX 單元的直接連接,允許 Grid 通過 Dynamic Parallelism 在 GPU 上啟動其他工作,以將新工作傳回到 GMU 進行優(yōu)先化和調度。如果暫停調度的額外工作量的內核,GMU 將保持其為不活動,知道以來工作完成。
重新設計的 Kepler HOST 到 GPU 的工作流顯示新 Grid Management Unit,允許其管理主動調度的 Grid、暫停調度、保留掛起和暫停的 Grid。
NVIDIA GPUDirect
當處理大量的數據時,提高數據吞吐量并降低延遲,對于提高計算性能是至關重要的。Kepler GK110 支持NVIDIA GPUDirect 中的 RDMA,目的是通過允許第三方設備,如 IB 適配器、NIC 和 SSD,直接訪問 GPU 內存‐來提高性能。使用 CUDA 5.0 時,GPUDirect 提供以下重要功能:
無需 CPU方面的數據緩沖, NIC 和 GPU 之間的直接內存存取 (DMA)
顯著改善 GPU和其他網絡節(jié)點之間的 MPISend/ MPIRecv 效率。
消除了 CPU 帶寬和延遲的瓶頸
與各種第三方網絡、捕獲和存儲設備一起工作
如逆時偏移(用于石油和天然氣勘探地震成像)這樣的應用程序,將大量影像數據分布在多個GPU。數以百計的 GPU 必須合作,以緊縮的數據,經常通信中間結果 GPUDirect 利用 P2P 和RDMA 功能為服務器內或服務器之間“ GPU‐ 到‐GPU” 的通信的情況分配更高的總帶寬。
Kepler GK110 還支持其他功能 GPUDirect,如 Peer‐to‐Peer 和 GPUDirect for Video。
GPUDirect RDMA 允許網絡適配器這樣的第三方設備訪問GPU內存,轉換為跨節(jié)點GPU之間直接傳輸。
關注我們



