IBM開發(fā)出內存計算新方法,機器學習能耗降低80倍

時間:2018-04-23

來源:網絡轉載

導語:IBM Research稱,已經開發(fā)出了一種內存計算新方法,可以為微軟和谷歌尋求的高性能和機器學習應用的硬件加速器提供答案。

IBM Research稱,已經開發(fā)出了一種內存計算新方法,可以為微軟和谷歌尋求的高性能和機器學習應用的硬件加速器提供答案。

在近日Nature Electronics期刊上發(fā)表的一篇論文中,IBM研究人員描述了這種新的“混合精度內存計算”方法。

IBM關注傳統(tǒng)計算體系結構的不同看法,在這種體系結構中,軟件需要在單獨的CPU和RAM單元之間進行數據傳輸。

據IBM稱,這種被稱為“馮·諾依曼”的體系結構設計,為數據分析和機器學習應用制造了一個瓶頸,這些應用需要在處理單元和內存單元之間進行更大的數據傳輸。傳輸數據也是一個耗能的過程。

應對這一挑戰(zhàn),IBM給出的一種方法是模擬相變內存(PCM)芯片,該芯片目前還處于原型階段,500萬個納米級PCM器件組成500×2000交叉陣列。

PCM的一個關鍵優(yōu)勢是可以處理大多數密集型數據處理,而無需將數據傳輸到CPU或GPU,這樣以更低的能量開銷實現更快速的處理。

IBM的PCM單元將作為CPU加速器,就像微軟用于加速Bing和加強機器學習的FPGA芯片一樣。

據IBM稱,研究表明在某些情況下,其PCM芯片能夠以模擬的方式進行操作,執(zhí)行計算任務,并提供與4位FPGA存儲器芯片相當的準確度,但能耗降低了80倍。

模擬PCM硬件并不適合高精度計算。所幸的是,數字型CPU和GPU是適合的,IBM認為混合架構可以實現更高性能、更高效率和更高精度的平衡。

這種設計將大部分處理留給內存,然后將較輕的負載交給CPU進行一系列的精度修正。

根據IBM蘇黎世實驗室的電氣工程師、也是該論文的主要作者Manuel Le Gallo稱,這種設計有助于云中的認知計算,有助于釋放對高性能計算機的訪問。

Le Gallo表示:“憑借我們現在的精確度,我們可以將能耗降低到是使用高精度GPU和CPU的1/6?!?/p>

“所以我們的想法是,為了應對模擬計算中的不精確性,我們將其與標準處理器結合起來。我們要做的是將大量計算任務轉移到PCM中,但同時得到最終的結果是精確的?!?/p>

這種技術更適合于如數字圖像識別等應用,其中誤解少數像素并不會妨礙整體識別,此外還有一些醫(yī)療應用。

“你可以用低精度完成大量計算——以模擬的方式,PCM會非常節(jié)能——然后使用傳統(tǒng)處理器來提高精度?!?/p>

對于只有1兆字節(jié)大小的IBM原型內存芯片,現在還處于初期階段。為了適用于現代數據中心的規(guī)模化應用,它需要達到千兆字節(jié)的內存量級,分布在數萬億個PCM中。

盡管如此,IBM認為可以通過構建更大規(guī)模的PCM設備或使其中PCM并行運行來實現這一目標。

中傳動網版權與免責聲明:

凡本網注明[來源:中國傳動網]的所有文字、圖片、音視和視頻文件,版權均為中國傳動網(www.connectcrack.com)獨家所有。如需轉載請與0755-82949061聯系。任何媒體、網站或個人轉載使用時須注明來源“中國傳動網”,違反者本網將追究其法律責任。

本網轉載并注明其他來源的稿件,均來自互聯網或業(yè)內投稿人士,版權屬于原版權人。轉載請保留稿件來源及作者,禁止擅自篡改,違者自負版權法律責任。

如涉及作品內容、版權等問題,請在作品發(fā)表之日起一周內與本網聯系,否則視為放棄相關權利。

關注伺服與運動控制公眾號獲取更多資訊

關注直驅與傳動公眾號獲取更多資訊

關注中國傳動網公眾號獲取更多資訊

最新新聞
查看更多資訊

熱搜詞
  • 運動控制
  • 伺服系統(tǒng)
  • 機器視覺
  • 機械傳動
  • 編碼器
  • 直驅系統(tǒng)
  • 工業(yè)電源
  • 電力電子
  • 工業(yè)互聯
  • 高壓變頻器
  • 中低壓變頻器
  • 傳感器
  • 人機界面
  • PLC
  • 電氣聯接
  • 工業(yè)機器人
  • 低壓電器
  • 機柜
回頂部
點贊 0
取消 0