昆侖芯2的性能、通用性、易用性較1代產品均有顯著增強。該芯片采用全球領先的7nm制程,搭載自研的第二代XPU架構,相比1代性能提升2-3倍。整數精度(INT8)算力達到256 TeraOPS,半精度(FP16)為128 TeraFLOPS,而最大功耗僅為120W。
硬件設計上,該芯片是國內首款采用顯存的通用AI芯片,對于推動國內AI芯片技術研發(fā)和商業(yè)落地都具有重要價值。此外,昆侖芯2還高度集成了ARM CPU算力,并支持高速互聯、安全和虛擬化。軟件架構上,昆侖芯2大幅迭代了編譯引擎和開發(fā)套件,支持C和C++編程,可編程性國內領先、對標全球業(yè)界最先進水平。
場景上,昆侖芯2領先的設計使產品可以適用云、端、邊等多場景,可應用于互聯網核心算法、智慧城市、智慧工業(yè)等領域,并還將賦能高性能計算機集群、生物計算、智能交通、無人駕駛等更廣泛空間。
值得關注的是,昆侖芯AI芯片除了擁有自研XPU架構及多項自主設計,也已與飛騰等多款國產通用處理器、麒麟等多款國產操作系統以及百度自研的飛槳深度學習框架完成了端到端的適配,擁有軟硬一體的全棧國產AI能力。
當前,AI已經成為了新一輪科技革命和產業(yè)變革的重要驅動力量,而AI芯片作為推動AI發(fā)展的核心生產力,其價值毋庸置疑。十四五規(guī)劃中就明確提出“要聚焦高端芯片領域”。但芯片研發(fā)的復雜程度注定了這是一場時間與耐力的比拼,百度昆侖芯起步早、進展快,已經成為了AI芯片行業(yè)的領軍玩家。
百度在2011年就已經開始布局AI芯片領域。2018年,百度自研的中國第一款云端全功能AI芯片——“百度昆侖1”問世。截至目前,這款芯片已在百度搜索引擎、小度等業(yè)務中部署超過2萬片,服務50多家外部客戶,是國內唯一一款支撐了互聯網大規(guī)模核心推薦算法的AI芯片,在最嚴苛的考驗中驗證了技術實力。昆侖芯2則更進一步,將國內AI芯片研發(fā)的技術和商業(yè)化推向了更高的水平。
昆侖芯AI芯片技術和業(yè)務進展迅速,既得益于百度AI技術的全棧、深厚布局,更受益于百度全面、繁榮的AI應用場景。昆侖芯AI芯片作為百度大腦的“算力引擎”,實現了對語音、視覺、自然語言處理、智能推薦等全類別算法的支持,并與百度自研的飛槳深度學習框架天然適配。更重要的是,百度作為AI平臺型公司,擁有數億用戶規(guī)模的“國民級”產品百度搜索等,以及服務千行百業(yè)的百度智能云,這為百度昆侖芯的發(fā)展提供了業(yè)界少有的頂尖場景歷練機會和優(yōu)勢。
與此同時,百度昆侖AI芯片的快速發(fā)展也使百度大腦的軟硬一體化能力愈加完備,為百度在AI領域加速技術創(chuàng)新、加快應用落地提供了更加強大的算力支撐。
“芯片是需要花很長時間,不怕孤獨、不怕寂寞,埋下身去,認認真真的做,才能做出來的技術和成果。”李彥宏表示。