【ARM此舉直接沖擊英特爾老巢?】在連續(xù)創(chuàng)造驚人的數(shù)字之后,ARM的目光更為長遠。據(jù)最新數(shù)據(jù)顯示,截止2017年底基于Arm的芯片出貨量已達1200億片,約占整體市場四成份額。Arm資深市場營銷總監(jiān)IanSmythe表示,到目前為止基于Arm的芯片出貨量應(yīng)已突破1300億,未來將邁向2000億。2035年預計將有一萬億的互聯(lián)設(shè)備,而5G、AI、安全、全計算等技術(shù)將大行其道,以為用戶提供更自由更互連的浸入式體驗。基于此ArmIP產(chǎn)品線再添生力軍,在CPU和GPU層面均實現(xiàn)躍升,除著力渲染可將智能手機實現(xiàn)PC性能之外,染指筆記本電腦市場的野心愈加明晰。
Cortex-A76的野心
去年Arm發(fā)布的Cortex-A75針對AI和ML能力進行了特別優(yōu)化,同時引入了TrustZone技術(shù)(芯片級安全技術(shù))和DynamIQbig.LITTLE拓撲特性。而今年Arm宣布最新旗艦CPU——Cortex-A76,相比上一代在性能上實現(xiàn)了35%的提升,同時降低了40%的功耗,并在機器學習能力上提升了4倍。
“實現(xiàn)上述進步的原因在于,Cortex-A76雖采用和前一代相同的v8.2指令集,但內(nèi)建的微處理器架構(gòu)則是從頭開始研發(fā),實現(xiàn)了諸多重大改進,包括解耦合分支預測與指令預取、譯碼寬度更大、更高的整數(shù)與向量與浮點運算單元等。同時,Cortex-A76是針對7nm工藝定制的全新架構(gòu),在搭配7nm工藝時主頻可達到3.0GHz?!盜anSmythe強調(diào)。
這一性能相當于PC端英特爾旗下的酷睿i5-7300,如果SoC廠商緩存設(shè)計得更好,其性能甚至可以媲美i7。聯(lián)想到此前新一代高通驍龍1000版Windows10ARM筆記本,表明Arm正著力染指PC市場,但能否借Cortex-A76挑戰(zhàn)英特爾/AMD在PC領(lǐng)域的權(quán)威還待合作伙伴的力道以及生態(tài)的配合。同時Cortex-A76還意欲為智能手機帶來筆記本級別的性能,過發(fā)揮比前一代產(chǎn)品高達4倍的機器學習性能,解決云端持續(xù)互動衍生出的延遲以及安全方面的問題。Cortex-A76可謂“身兼重任”。
此外,Arm還提供獨特的POP技術(shù)。IanSmythe提及,基于臺積電16FFC的Cortex-A76POPIP,可提供目前最佳性能;而對于那些尋求頂尖制程并鎖定高端應(yīng)用的客戶,使用臺積電7FF制程的Cortex-A76和Cortex-A55POPIP將于2018年第四季度上市。ArmPOPIP可加速產(chǎn)品的實現(xiàn),縮短上市時間,并充分利用DynamIQbig.LITTLE的靈活性。
GPU和VPU的跨越
GPU可說是Arm未來要發(fā)展AI計算生態(tài)的主要角色,從第一代BiFrost架構(gòu)開始,就已經(jīng)針對AI計算所需要的各種場景,包含機器學習中的訓練以及推理加速等進行優(yōu)化。時間節(jié)點到了2018年中,Mali-G76新晉成為Arm最新旗艦GPU。
“Mali-G76仍采用Bifrost架構(gòu),總核配置上限從32核降為20核,每個核心仍然是3個執(zhí)行單元,但執(zhí)行單元的線程數(shù)增加到8條,也就是每核心24條線程。加上配備texturemapper以及緩存器的優(yōu)化等,再度提升了30%的性能密度以及30%的能源效率。在7nm工藝的加持下,其性能可提升1.5-2倍?!盜anSmythe介紹說,“而且新GPU通過支持int8dot實現(xiàn)了強大的機器學習功能,表現(xiàn)足足是Mali-G72的2.7倍?!?/p>
除在GPU領(lǐng)域精進之外,面向未來的8K視覺體驗,Arm推出了最新的高端視頻處理器(VPU)Mali-V76來占領(lǐng)先機。
IanSmythe介紹,8K60規(guī)格串流需要4K60格式的視頻4倍的帶寬,為此Arm通過加入額外的AXI總線,使處理量增加一倍。此外還將行緩沖區(qū)從4096個像素增加到8192個,從而帶來額外的效能提升,使得Mali-V76不僅支持8k60解碼和8k30編碼,性能亦幾乎是上一代產(chǎn)品的兩倍。
即使是當前的高端設(shè)備,4K仍未成為標準配備,那么為何市場已開始提前鎖定8K?IanSmythe認為,產(chǎn)業(yè)局勢瞬息萬變,Arm必須針對未來設(shè)備的需求提前準備。在未來的高端電視以及更高分辨率的AR/VR頭顯領(lǐng)域,Mali-V76將發(fā)揮更大作用。而對于一個8K視頻流的替代方案而言,可選擇支持4個60fps的4K視頻流。
AI仍“借力使力”
雖然在AI布局上,Arm看似慢了半拍。但事實上,ARM早在2016年就已經(jīng)把觸手伸進多個AI應(yīng)用領(lǐng)域同時發(fā)展,包含號稱針對機器學習優(yōu)化的BifrostGPU架構(gòu),以及針對高端服務(wù)器芯片的SVE延伸指令集。隨著相關(guān)方案陸續(xù)成熟,采用者也逐漸增加,Arm在今年2月推出ProjectTrillium,結(jié)合開發(fā)環(huán)境、算法與各大主流機器學習框架,布局從終端到云端所有AI應(yīng)用開發(fā)生態(tài)。
而此次推出的無論是CPU還是GPU,在AI性能上均實現(xiàn)了大幅提升,表明Arm的AI布局亦在穩(wěn)妥推進。
至于沒有推出單獨的AI加速器原因,IanSmythe特意指出,目前AI還處于初級階段,雖然某些廠商選擇配備單獨的AI加速器,但仍有一些合作伙伴配備GPU來對AI方案進行調(diào)適,以其靈活性來進行定制化設(shè)計,并可獲得Arm生態(tài)體系的廣泛支持。
在近兩年的AI熱潮中,各家新創(chuàng)產(chǎn)業(yè)紛紛推出自有的AI加速器,群雄并起。但Arm仍如此“氣定神閑”沒有染指AI加速器內(nèi)核,或許有更深的考量。但是,無論是對算法的承載,對計算的優(yōu)化,對AI生態(tài)的構(gòu)建,Arm的時間或許沒有想象那么從容。