2025年6月9日,中國上?!驹煞?芯原,股票代碼:688521.SH)今日宣布其高性能、可擴展的GPGPU-AI計算IP的最新進展,這些IP現(xiàn)已為新一代汽車電子和邊緣服務(wù)器應用提供強勁賦能。通過將可編程并行計算能力與人工智能(AI)加速器相融合,這些IP在熱和功耗受限的環(huán)境下,能夠高效支持大語言模型(LLM)推理、多模態(tài)感知以及實時決策等復雜的AI工作負載。
芯原的GPGPU-AI計算IP基于高性能通用圖形處理器(GPGPU)架構(gòu),并集成專用AI加速器,可為AI應用提供卓越的計算能力。其可編程AI加速器與稀疏感知計算引擎通過先進的調(diào)度技術(shù),可加速Transformer等矩陣密集型模型的運行。此外,這些IP支持用于混合精度計算的多種數(shù)據(jù)格式,包括INT4/8、FP4/8、BF16、FP16/32/64和TF32,并支持多種高帶寬接口,包括3D堆疊內(nèi)存、LPDDR5X、HBM、PCIe Gen5/Gen6和CXL。該IP還支持多芯片、多卡擴展部署,具備系統(tǒng)級可擴展性,滿足大規(guī)模AI應用的部署需求。
芯原的GPGPU-AI計算IP原生支持PyTorch、TensorFlow、ONNX和TVM等主流AI框架,覆蓋訓練與推理流程。此外,它還支持與主流的GPGPU編程語言兼容的通用計算語言(GPCL),以及主流的編譯器。這些能力高度契合當前大語言模型在算力和可擴展性方面的需求,包括DeepSeek等代表性模型。
“邊緣服務(wù)器在推理與增量訓練等場景下對AI算力的需求正呈指數(shù)級增長。這一趨勢不僅要求極高的計算效率,也對架構(gòu)的可編程性提出了更高要求。芯原的GPGPU-AI計算處理器在架構(gòu)設(shè)計上實現(xiàn)了GPGPU通用計算與AI加速器的深度融合,可在極細粒度層面實現(xiàn)高效協(xié)同,相關(guān)優(yōu)勢已在多個高性能AI計算系統(tǒng)中得到驗證?!毙驹紫瘧?zhàn)略官、執(zhí)行副總裁、IP事業(yè)部總經(jīng)理戴偉進表示,“近期DeepSeek的技術(shù)突破進一步凸顯出提升AI計算效率以應對日益復雜工作負載的重要性。我們最新一代GPGPU-AI計算IP已全面優(yōu)化,可高效支持專家混合(MoE)模型,并提升了核間通信效率。同時,通過與多家領(lǐng)先AI計算客戶的深度合作,我們已對處理器架構(gòu)進行了優(yōu)化,以充分利用3D堆疊存儲技術(shù)所提供的充足帶寬。芯原將持續(xù)攜手生態(tài)合作伙伴,加速推動這些先進技術(shù)在實際應用中的規(guī)模化落地?!?/p>