国产成人福利在线视频播放下载,成人无码www免费视频在线看,放荡的美妇在线播放,大地资源网最新更新,国产成人精品日本亚洲网站

泡泡網顯卡頻道 PCPOP首頁      /      顯卡     /      評測    /    正文

泰坦的孿生兄弟!NVIDIA GTX 780首測

    在混合 CPU‐GPU 系統(tǒng)中,由于 GPU 的性能/ 功率比提高,使應用程序中大量并行代碼完全在GPU 高效運行,提高了可擴展性和性能。為了加快應用程序的額外并行部分的處理,GPU必須支持更加多樣化的并行工作負載類型。

    Dynamic Parallelism 是 Kepler GK110 引入的新功能,能夠讓 GPU 在無需 CPU 介入的情況下,通過專用加速硬件路徑為自己創(chuàng)造新的工作,對結果同步,并控制這項工作的調度。

    在內核啟動時,如果問題的規(guī)模和參數已知,那么 Fermi 在處理大型并行數據結構時效果非常好。所有的工作是從主機 CPU 啟動,會運行到完成,并返回結果返回到 CPU。結果將被用來作為最終的解決方案的一部分,或通過 CPU 進行分析,然后向 GPU 發(fā)送額外的處理請求以進行額外處理。

    在 Kepler GK110中,任何一個內核都可以啟動另一個內核,并創(chuàng)建處理額外的工作所需的必要流程、事件以及管理依賴,而無需主機 CPU 的介入。T 該架構能讓開發(fā)人員更容易創(chuàng)建和優(yōu)化遞歸和數據依賴的執(zhí)行模式,并允許更多的程序直接運行在 GPU 上??梢詾槠渌蝿蔗尫畔到y(tǒng)CPU,或可以用功能少的 CPU 配置系統(tǒng)以運行相同的工作負載。

1

    Dynamic Parallelism 允許應用程序中更多的并行代碼直接由 GPU 本身啟動(右側圖像),而不需要 CPU 的干預(左側圖像)。

    Dynamic Parallelism 允許更多種并行算法在 GPU 上執(zhí)行,包括不同數量的并行嵌套循環(huán)、串行控制任務線程的并行隊或或卸載到 GPU 的簡單的串行控制代碼,以便促進應用程序的并行部分的數據局部化。

    因為內核能夠根據GPU 中間結果啟動額外工作負載,程序員現(xiàn)在可以智能處理負載平衡的工作,以集中其大量資源在需要處理能力最大或與解決方案最有關的問題上。

    一個例子是動態(tài)設置數值模擬的 Grid。 通常 Grid 主要集中在變化最大的地區(qū),需要通過數據進行昂貴的前處理。另外,均勻粗 Grid 可以用來防止浪費的 GPU 資源,或均勻細 Grid 可以用來確保捕獲所有功能,但這些選項的風險是在不太被注意的地區(qū)缺少模擬功能或“過度消費”的計算資源。

    有了 Dynamic Parallelism,可以在運行時以數據依賴形式動態(tài)確定‐Grid解決方案。以粗 Grid開始,模擬“放大”注意的區(qū)域,同時避免在變化不大區(qū)域中不必要的計算。雖然這可以通過使用一系列的 CPU 啟動的內核來完成,但是通過分析數據、作為單個模擬內核部分啟動額外工作讓 GPU 細化 Grid 本身要簡單的多,消除了 CPU 的中斷以及CPU和GPU之間的數據傳輸。

1

    上面的例子說明了在數值模擬,采用動態(tài)調整 Grid 的好處。為了滿足峰值的精度要求,固定的分辨率仿真必須運行在整個模擬域過于精細的分辨率上,而多分辨率 Grid 根據當地的變化為每個區(qū)域應用正確的模擬分辨率。

0人已贊

關注我們

泡泡網

手機掃碼關注