采用仿真驗證技術(shù)提高AI數(shù)據(jù)中心部署效率

時間:2025-05-23

來源:電子技術(shù)應用

導語:人工智能技術(shù)的發(fā)展催生了大規(guī)模數(shù)據(jù)中心建設需求,提高日趨復雜的數(shù)據(jù)中心建設部署效率,正在成為算力行業(yè)的競爭焦點。

  編者按:人工智能技術(shù)的發(fā)展催生了大規(guī)模數(shù)據(jù)中心建設需求,提高日趨復雜的數(shù)據(jù)中心建設部署效率,正在成為算力行業(yè)的競爭焦點。日前,是德科技推出了全新的KAI系列仿真驗證解決方案,通過仿真真實世界的AI工作負載來驗證數(shù)據(jù)中心集群組件,從而在數(shù)據(jù)中心實際部署前洞察系統(tǒng)設計性能,提高數(shù)據(jù)中心部署效率。

  作為人工智能技術(shù)落地的重要基礎(chǔ)設施,大規(guī)模AI數(shù)據(jù)中心是一個復雜的系統(tǒng),計算、存儲和網(wǎng)絡通信功能實現(xiàn)包含了芯片、電纜、互連、交換機、服務器和圖形處理單元(GPU)等硬件以及操作系統(tǒng)、驅(qū)動程序等軟件,而讓信息流和任務流在所有硬件之間、軟件之間以及軟硬件協(xié)同地高效流動,考驗著數(shù)據(jù)中心建設工程師智慧與能力。

  為了避免被動調(diào)整建設方案并提高部署效率,在工程設計階段面向組件級和系統(tǒng)級分別開展仿真驗證,通過使用全棧工作負載仿真補充物理層測試,識別單獨測試組件時未發(fā)現(xiàn)的漏洞,客戶可以更快地提取峰值A(chǔ)I性能,更快地增加容量,最大化在AI集群上的投資回報。

  日前,全球知名的測試測量企業(yè),是德科技整合了在網(wǎng)絡流量仿真、網(wǎng)絡組件、網(wǎng)絡合規(guī)驗證以及最新行業(yè)標準方面的深厚經(jīng)驗,通過模擬、驗證數(shù)據(jù)中心在AI計算、網(wǎng)絡、互連和能源效率等方面的性能,面向當下火熱的AI數(shù)據(jù)中心建設需求,推出了全新KAI系列解決方案,旨在幫助數(shù)據(jù)中心迎接大帶寬、高速率的數(shù)據(jù)傳輸挑戰(zhàn)。

  是德科技大中華區(qū)高速數(shù)字市場部經(jīng)理李堅表示,是德科技對AI產(chǎn)業(yè)發(fā)展持非常樂觀的態(tài)度,AI該產(chǎn)業(yè)正處于成長期,AI數(shù)據(jù)中心網(wǎng)絡還存在很多的需要解決的問題,業(yè)界需要全面地從物理層到網(wǎng)絡層,憑借模擬真實環(huán)境的仿真系統(tǒng)來探尋解決問題的方法。

  全新的KAI系列解決方案,可以幫助AI提供商、半導體制造商和網(wǎng)絡設備制造商均獲得創(chuàng)新能力。

  據(jù)李堅介紹,“KAI”是是德科技面向AI產(chǎn)業(yè)而推出的創(chuàng)新解決方案,旨在加速AI數(shù)據(jù)中心復雜系統(tǒng)的設計和部署,提高建設效率和降低成本。

  首先是加速設計進程,通過調(diào)試先進的高速數(shù)字設計,滿足或超過最新的PCIe、DDR和CXL等標準。

  其次是加速系統(tǒng)開發(fā),驗證組件級合規(guī)性,包括高速互連、電纜和芯片組,并在系統(tǒng)級層面驗證工作負載性能。

  第三可以加速部署和運營,通過對整個數(shù)據(jù)中心驗證和優(yōu)化系統(tǒng)級性能,使用端到端仿真在大規(guī)模部署前找出系統(tǒng)性能問題,降低工作負載失敗的風險。

  是德科技此次推出的三款新產(chǎn)品可助力客戶應對AI數(shù)據(jù)中心部署的行業(yè)挑戰(zhàn)。

  KAI數(shù)據(jù)中心構(gòu)建器

  AI服務提供商使用各種并行處理策略來加速AI模型訓練,將模型并行與AI集群拓撲和配置協(xié)同可以提高訓練性能。

  AI網(wǎng)絡通信有兩個非常重要的特點,一是節(jié)點之間要進行大量的數(shù)據(jù)交換,每個神經(jīng)元之間,每個GPU之間在這個超級節(jié)點里都要進行大量的數(shù)據(jù)交換;二是“突發(fā)”即在短時間里進行大規(guī)模數(shù)據(jù)交換。如何通過軟件仿真真實的數(shù)據(jù)中心流量和通信特征,發(fā)現(xiàn)提高GPU和網(wǎng)絡利用效率系統(tǒng)部署方案,正是數(shù)據(jù)中心建構(gòu)工程師希望得到的“錦囊”。

  李堅表示,KAI數(shù)據(jù)中心構(gòu)建器的工作負載仿真解決方案可以再現(xiàn)真實AI訓練任務的網(wǎng)絡通信模式,加速模型訓練優(yōu)化所需的學習曲線,并更深入洞察性能下降的原因,這些是現(xiàn)實AI訓練任務過程中難以獲得的。

  KAI數(shù)據(jù)中心構(gòu)建器的工作負載模擬功能將大型語言模型(LLM)和其他人工智能(AI)模型訓練所需要的工作負載集成到AI基礎(chǔ)設施組件的設計和驗證中——包括網(wǎng)絡、主機和加速器,實現(xiàn)了硬件設計、協(xié)議、架構(gòu)和AI訓練算法之間的更緊密協(xié)同,提升系統(tǒng)性能。

  互連與網(wǎng)絡性能測試儀

  一直以來,驗證網(wǎng)絡互連性能需要手動操作,耗費大量時間,自動化程度有限或根本無法實現(xiàn),該過程還缺乏一個集中系統(tǒng)來整理和存儲互連數(shù)據(jù)及報告,因此很難跟蹤和復制測試和配置。隨著AI和數(shù)據(jù)中心互連的多樣性和規(guī)模不斷增加,這些傳統(tǒng)測試方法無法準確預測和衡量當今復雜AI網(wǎng)絡的可靠性。

  李堅表示,新的互連和網(wǎng)絡性能測試系統(tǒng)通過INPT-1600GE搭配ITS軟件,可以作為一個整體系統(tǒng),智能地組織、存儲和使用數(shù)據(jù),實現(xiàn)高速以太網(wǎng)網(wǎng)絡和AI數(shù)據(jù)中心中的互連自動化驗證。

  DCA-M采樣示波器

  為了應對高速數(shù)據(jù)傳播需求,業(yè)界普遍采用1.6T光互連解決方案,而該方案在AI數(shù)據(jù)中心網(wǎng)絡的快速部署帶來了顯著的測量挑戰(zhàn)。在制造過程中,自動化測試必須高效、可擴展且精確,以驗證大量關(guān)鍵參數(shù),確保高吞吐量和產(chǎn)量,同時滿足數(shù)據(jù)中心要求并符合行業(yè)標準。

  數(shù)據(jù)速率極高且信號完整性要求嚴格,工程師需要在廣泛的操作條件下對收發(fā)器的性能進行表征和驗證,這需要具有卓越帶寬、低噪聲和高靈敏度的精確測試設備。

  據(jù)李堅介紹,DCA-M采樣示波器提供高達224 Gbps/通道的高速光信號分析,專為滿足1.6T收發(fā)器光學測試的嚴格要求而設計,具有高光學測量靈敏度和集成時鐘恢復功能,支持高達120 GBaud的數(shù)據(jù)速率,完全滿足數(shù)據(jù)中心AI集群的下一代光互連的研發(fā)和制造需求。


中傳動網(wǎng)版權(quán)與免責聲明:

凡本網(wǎng)注明[來源:中國傳動網(wǎng)]的所有文字、圖片、音視和視頻文件,版權(quán)均為中國傳動網(wǎng)(www.connectcrack.com)獨家所有。如需轉(zhuǎn)載請與0755-82949061聯(lián)系。任何媒體、網(wǎng)站或個人轉(zhuǎn)載使用時須注明來源“中國傳動網(wǎng)”,違反者本網(wǎng)將追究其法律責任。

本網(wǎng)轉(zhuǎn)載并注明其他來源的稿件,均來自互聯(lián)網(wǎng)或業(yè)內(nèi)投稿人士,版權(quán)屬于原版權(quán)人。轉(zhuǎn)載請保留稿件來源及作者,禁止擅自篡改,違者自負版權(quán)法律責任。

如涉及作品內(nèi)容、版權(quán)等問題,請在作品發(fā)表之日起一周內(nèi)與本網(wǎng)聯(lián)系,否則視為放棄相關(guān)權(quán)利。

關(guān)注伺服與運動控制公眾號獲取更多資訊

關(guān)注直驅(qū)與傳動公眾號獲取更多資訊

關(guān)注中國傳動網(wǎng)公眾號獲取更多資訊

最新新聞
查看更多資訊

娓娓工業(yè)

廣州金升陽科技有限公司

熱搜詞
  • 運動控制
  • 伺服系統(tǒng)
  • 機器視覺
  • 機械傳動
  • 編碼器
  • 直驅(qū)系統(tǒng)
  • 工業(yè)電源
  • 電力電子
  • 工業(yè)互聯(lián)
  • 高壓變頻器
  • 中低壓變頻器
  • 傳感器
  • 人機界面
  • PLC
  • 電氣聯(lián)接
  • 工業(yè)機器人
  • 低壓電器
  • 機柜
回頂部
點贊 0
取消 0