日前,硅谷芯片技術(shù)研討會HOT CHIPS上,特斯拉硬件工程師Emil Talpes公開了特斯拉Dojo超算指令集結(jié)構(gòu)細節(jié),并展示了Dojo的數(shù)據(jù)格式、系統(tǒng)網(wǎng)絡(luò)、軟件系統(tǒng)繞行死節(jié)點能力等。
所謂 Dojo,是特斯拉自研的超級計算機,可利用海量視頻數(shù)據(jù),完成“無人監(jiān)管”的標注和訓(xùn)練。
在去年的AI Day上,特斯拉就已發(fā)布Dojo超級計算機,但當時其“羽翼未豐”,尚只有第一個芯片及訓(xùn)練塊,公司仍在推動構(gòu)建完整的Dojo Exapod。
而特斯拉也表示,理論上,Dojo ExaPod將是世界上最快的AI訓(xùn)練超級計算機。
如今,Dojo Exapod也終于揭開面紗——從本次研討會上Talpes的展示來看,每個Dojo ExaPod集成120個訓(xùn)練模塊,內(nèi)置3000個D1芯片,擁有超過100萬個訓(xùn)練節(jié)點,算力達到1.1EFLOP*(每秒千萬億次浮點運算)。
微架構(gòu)方面,每個Dojo節(jié)點都有一個內(nèi)核,是一臺具有CPU專用內(nèi)存和I/O接口的成熟計算機。
Dojo Exapod的核心,便是特斯拉自研的D1芯片。該芯片由臺積電制造,采用7nm工藝,擁有500億個晶體管,芯片面積為645mm2,小于英偉達的A100(826 mm2)和AMD Arcturus(750 mm2)。
值得注意的是,有望在下個月現(xiàn)身的特斯拉人形機器人“擎天柱”大腦所使用的,便是Dojo D1超級計算芯片,每個D1芯片之間無縫連接,相鄰芯片之間的延遲極低,訓(xùn)練模塊最大程度上實現(xiàn)了帶寬的保留。
特斯拉之前已透露,Tesla Bot“擎天柱”頭部將配備與自家汽車相同的智能駕駛攝像頭,并與汽車共用AI系統(tǒng)——換言之,特斯拉人形機器人延續(xù)了以視覺為主的傳感技術(shù)路線。
得益于龐大數(shù)據(jù)庫的支撐、AI預(yù)測能力與算法,特斯拉認為,純視覺方案也能較好地彌補深度傳感器缺失所帶來的不足。目前,其基于視覺的神經(jīng)網(wǎng)絡(luò)技術(shù)已在汽車FSD上獲得實戰(zhàn)驗證,華安證券27日報告指出,該技術(shù)有望借助Dojo超算加速訓(xùn)練升級。