AMD的雄心:32核APU32GB內(nèi)存、7nm工藝
AMD最近也提出了百億億次計算的計劃,使用的是自家的32核APU,每個APU都具備10TFLOPS(1TFLPS=一萬億次),10萬個這樣的節(jié)點就能實現(xiàn)百億億次計算了。
中國與美國在超級計算機領(lǐng)域存在或明或暗的競爭,在禁止對中國出口高性能計算機芯片之后,奧巴馬政府推出了新的超級計算機計劃,希望在2025年研發(fā)出百億億次超級計算機,奪回世界最快的稱號。官方的計劃還有10年時間,不過美國的科技公司有可能提前實現(xiàn)這個目標(biāo),AMD最近也提出了百億億次計算的計劃,使用的是自家的32核APU,每個APU都具備10TFLOPS(1TFLPS=一萬億次),10萬個這樣的節(jié)點就能實現(xiàn)百億億次計算了。
自從AMD 9年前收購ATI之后就開始考慮CPU、GPU融合計算的事了,這么多年來AMD的APU總算開始上道了,不過跟AMD設(shè)想的還有點遠(yuǎn)。7月中旬,AMD的研究人員在IEEE發(fā)表了“通過異構(gòu)計算實現(xiàn)百億億次計算”的論文,他們希望通過使用APU這樣的異構(gòu)處理器來實現(xiàn)計算性能的大跨越。
AMD的10萬億次性能APU架構(gòu)
具體來說就是,AMD未來推出的APU至少擁有32個CPU內(nèi)核,并搭配AMD研發(fā)的堆棧式緩存以及大容量非易失性內(nèi)存,計算性能達到10TFLOPS(10萬億次)的高性能APU,具備極高的帶寬及低開銷、高速度的網(wǎng)絡(luò)。
目前雙精度浮點性能最強的加速卡之一是AMD的FirePro S9170,但性能也不過是2.62TFLOPS,Intel新一代的Xeon Phi加速卡雙精度性能可達3TFLOPS,AMD未來的APU性能是10TFLOPS,差不多是目前水平的三到四倍,這樣實現(xiàn)百億億次計算只需要10萬個APU節(jié)點就可以了。
但是先別高興的太早,這些都還是AMD的論文提出的設(shè)想,即便AMD內(nèi)部有了這樣的規(guī)劃,實現(xiàn)起來也不是那么容易,目前見諸網(wǎng)絡(luò)報道的32核、32GB HBM2.0顯存、3072個流處理器單元等具體數(shù)據(jù)實際上也不是確定的,唯一能夠確定的是這款A(yù)PU可能要到2020年才能問世,而非報道中提及的2016-2017年,所以它也不是面向14nm甚至10nm節(jié)點的,未來將使用7nm節(jié)點,CPU架構(gòu)至少也得是Zen架構(gòu)的改進版Zen+甚至Zen+之后的新一代了。■
關(guān)注我們
