IBM Research稱,已經開發(fā)出了一種內存計算新方法,可以為微軟和谷歌尋求的高性能和機器學習應用的硬件加速器提供答案。
在近日Nature Electronics期刊上發(fā)表的一篇論文中,IBM研究人員描述了這種新的“混合精度內存計算”方法。
IBM關注傳統(tǒng)計算體系結構的不同看法,在這種體系結構中,軟件需要在單獨的CPU和RAM單元之間進行數據傳輸。
據IBM稱,這種被稱為“馮·諾依曼”的體系結構設計,為數據分析和機器學習應用制造了一個瓶頸,這些應用需要在處理單元和內存單元之間進行更大的數據傳輸。傳輸數據也是一個耗能的過程。
應對這一挑戰(zhàn),IBM給出的一種方法是模擬相變內存(PCM)芯片,該芯片目前還處于原型階段,500萬個納米級PCM器件組成500×2000交叉陣列。
PCM的一個關鍵優(yōu)勢是可以處理大多數密集型數據處理,而無需將數據傳輸到CPU或GPU,這樣以更低的能量開銷實現更快速的處理。
IBM的PCM單元將作為CPU加速器,就像微軟用于加速Bing和加強機器學習的FPGA芯片一樣。
據IBM稱,研究表明在某些情況下,其PCM芯片能夠以模擬的方式進行操作,執(zhí)行計算任務,并提供與4位FPGA存儲器芯片相當的準確度,但能耗降低了80倍。
模擬PCM硬件并不適合高精度計算。所幸的是,數字型CPU和GPU是適合的,IBM認為混合架構可以實現更高性能、更高效率和更高精度的平衡。
這種設計將大部分處理留給內存,然后將較輕的負載交給CPU進行一系列的精度修正。
根據IBM蘇黎世實驗室的電氣工程師、也是該論文的主要作者Manuel Le Gallo稱,這種設計有助于云中的認知計算,有助于釋放對高性能計算機的訪問。
Le Gallo表示:“憑借我們現在的精確度,我們可以將能耗降低到是使用高精度GPU和CPU的1/6?!?/p>
“所以我們的想法是,為了應對模擬計算中的不精確性,我們將其與標準處理器結合起來。我們要做的是將大量計算任務轉移到PCM中,但同時得到最終的結果是精確的?!?/p>
這種技術更適合于如數字圖像識別等應用,其中誤解少數像素并不會妨礙整體識別,此外還有一些醫(yī)療應用。
“你可以用低精度完成大量計算——以模擬的方式,PCM會非常節(jié)能——然后使用傳統(tǒng)處理器來提高精度?!?/p>
對于只有1兆字節(jié)大小的IBM原型內存芯片,現在還處于初期階段。為了適用于現代數據中心的規(guī)模化應用,它需要達到千兆字節(jié)的內存量級,分布在數萬億個PCM中。
盡管如此,IBM認為可以通過構建更大規(guī)模的PCM設備或使其中PCM并行運行來實現這一目標。