一年前,CanyonBridge收購了Imagination,這使得該公司在財務上穩(wěn)健了很多,Imagination銷售和市場營銷執(zhí)行副總裁DavidMcBrien表示,我們的母公司CanyonBridge會持續(xù)推高我們的研發(fā)水平,對一家IP公司來說,要想在市場競爭中領先,持續(xù)的投入是非常重要的。因此,我們很開心CanyonBridge收購我們,此外,未來我們在中國的投入也會非常大。
關于競爭,DavidMcBrien表示,移動應用是我們的主要市場,我們的目標是幫助客戶跟高通在GPU上競爭,因此,要確保合作伙伴得到SoC的最佳性能,要想實現這一點,除了GPUIP之外,軟件和固件也要有絕佳的性能,因此,我們在研發(fā)人員數量上會持續(xù)投入,包括我們的現場應用工程師,從而實現以最專業(yè)的態(tài)度服務我們的客戶。
Imagination最強的產品線是PowerVRGPU,其在手機市場呼風喚雨了多年。隨著應用的發(fā)展和市場的變化,特別是手機市場的疲軟,以及汽車電子和AI的興起,使得IP廠商必須調整發(fā)展策略,以應對各種挑戰(zhàn)。目前來看,該公司的PowerVRIP系列主要分為兩部分:PowerVRGPU和PowerVR視覺和AI。
近期,Imagination推出了新的GPU、視覺和AIIP,分別是神經網絡加速器PowerVRSeries3NX,以及第九代(Series9)GPU系列。
神經網絡加速器PowerVRSeries3NX
面向人工智能(AI)應用的神經網絡加速器(NNA)PowerVRSeries3NX,是在該公司去年推出的2NX基礎上更新的產品。據悉,新版Series3NX提供了更強的可擴展性,使SoC制造商能夠針對汽車、移動設備、智能視頻監(jiān)控和物聯網邊緣設備等一系列嵌入式市場去優(yōu)化計算能力和性能。
據Imagination視覺和人工智能產品管理高級總監(jiān)NealForse介紹,2NX是該公司第一代神經網絡加速器,已有兩個中國手機廠商和其簽了約,國內一家主營汽車芯片廠商也選擇了該公司的NNA產品。在國際廠商方面,瑞薩電子和德州儀器是Imagination的長期合作伙伴,特別是在汽車電子應用領域,還在不斷加強、加深合作。手機和汽車行業(yè)是該公司重點關注的兩個市場,3NX可以進一步加強和鞏固其在移動和汽車行業(yè)的市場地位,進一步提升市場份額。
據悉,單個Series3NX內核的性能涵蓋0.6~10萬億次操作/秒(TOPS),同時其多核實現可擴展到160TOPS以上。得益于包括無損壓縮等在內的技術,Series3NX的性能可在相同的芯片面積上較上一代產品提升40%,使SoC制造商可在性能效率方面提高近60%,且?guī)捫枨蠼档土?5%。
作為Series3NX架構的一部分,Imagination還發(fā)布了PowerVRSeries3NX-F(Flexible),以提供功能性和靈活性平衡,采用Series3NX-F的客戶可以通過OpenCL來實現差異化設計。
為了迎合快速發(fā)展的市場,新的PowerVR工具也進行了多項擴展,從而能夠最優(yōu)化地去映射新興的網絡模型、提供靈活性和性能優(yōu)化。通過使用該公司的專用深度神經網絡(DNN)API,開發(fā)人員可以針對Series3NX架構以及現有PowerVRGPU編寫人工智能應用程序。該API可以在多種SoC配置上工作,以便在現有設備上完成原型設計。
據NealForse介紹,之前2NX有兩個IP核,現在的3NX有5個新的NNA核。最高達4KMAC/clk,算力可達10TOPS/s,這是單核的能力。這樣的能力是通過功耗和性能方面的改進實現的,和上一代相比,它的每秒推理次數提升了70%,每平方毫米每秒的推理次數提升了40%,和上一版相比是非常大的提升。同時,每平方毫米帶寬降低了35%的,系統帶寬降低35%的幅度是非常大的。新特性還包括無損壓縮,先進的安全使能,還有很重要的一點,就是可編程的擴展性,這讓客戶可以進行差異化設計。
內核方面,3NX系列是基于之前2NX的,2NX的系列里面有AX2145(1TOPS的算力)和AX2185(4.1TOPS),而3NX增加了AX3145內核,算力是1.2TOPS,還增加了一個AX3385,是5TOPS的,這兩個新核在面積和性能兩個維度都進行了改善,通過核的架構優(yōu)化實現。此外,還有新的內核補充,一共有5個,用于低端的核算力是0.6TOPS,非常適用于功率和性能有局限的設計,這是非常重要的。中檔的核是AX3365,算力是2.4TOPS,在高端部分有單核AX3595,算力可以達到10TOPS,這些算力都是單核提供的能力,通過組合還能提供更高的算力。
該公司也提供多核方案,把10TOPS算力的單核AX3595采取多核重用的方式,最高算力達到160TOPS,NealForse介紹,我們很多客戶要求有這樣的能力,要求有這樣的密度。我們挑戰(zhàn)的是160TOPS,不光是算力,還要管理和優(yōu)化核之間的帶寬。
與2NX相比,3NX在安全方面也有提升,客戶能夠在半導體層面建立原生的安全性。
3NX-F中的F代表靈活性。3NX-F把高效運算NNA的網絡結合在一起,其內嵌了NNPU神經網絡處理單元。這個單元是基于GPU的,但又不僅僅是GPU,通過在功耗和面積方面進行優(yōu)化,利用該公司在這個領域20多年的經驗積累,針對NNA加速器對GPU進行了優(yōu)化。
增加可編程的擴展性可以優(yōu)化硬件。當然這不是免費的。NealForse表示,我們要增加可編程的可擴展性,有兩方面的原因:一是讓客戶做差異化設計,在單核上做差異化,利用IP核構建NNA,而不是把第三方的GPU整合在一起。在競爭激烈的市場,差異化是非常重要的,我們客戶可以用他們喜歡的內核構建SoC。二是現在神經網絡發(fā)展?jié)u入佳境,PowerVR過去幾年進入了該市場,也有些新的技術、新的神經網絡、新的框架不斷進入該市場??删幊痰臄U展性可以讓客戶面向未來設計SoC,可以構建一個OpenCL的內核,允許將來把現在還不知道的東西結合在一起,這是非常好的架構設計,和這個行業(yè)的發(fā)展趨勢是密切相關的。
目前,市場上有多種不同架構的神經網絡產品,開始進入競爭階段,對此,NealForse表示,每家廠商的起點不同,大家有不同的歷史傳承,有些競爭對手可能用可編程架構、DSP做神經網絡方案,再加上指令級。我們的想法是考慮現在和未來業(yè)務的發(fā)展方向,我們的做法是通過計算優(yōu)化的方案實現,通過最優(yōu)的計算引擎來把神經網絡映射到硬件上。所以我們的優(yōu)化是來自線下的編譯,而不是在線的執(zhí)行。
在客戶拓展方面,Imagination副總裁兼中國區(qū)總經理劉國軍(JamesLiu)表示,大概有10個客戶計劃采用我們的NNA,目前正處于評估階段。這些客戶有的做監(jiān)控、移動手機、物聯網,有的應用很有趣,如在健身儀器上可能會用到一些對人體的測試和監(jiān)控,大部分和圖像相關。我們NNA的下一步要延展生態(tài)線,特別是汽車電子應用這塊,原來的汽車電子大部分是后裝的,而今后的發(fā)展會有所不同,本地的汽車芯片要進入前裝市場,進入車廠的車規(guī)里面,因此,我們正在籌劃本地汽車電子的生態(tài)建設工作,把我們的GPU和NNA放到車規(guī)的生態(tài)里。
更新三款GPU
除了用于AI的NNA之外,Imagination還推出了其第九代(Series9)GPU系列新品PowerVR9XEP、9XMP和9XTP。這三款Series9GPU覆蓋了從入門級到高端市場,并結合了效率的改進和新功能。
PowerVRSeries9XEP基于Rogue架構,該內核延續(xù)了這一類別PowerVRGPU的單位面積填充率優(yōu)勢。具有PVRIC4視覺無損壓縮功能,以便確保帶寬和內存占用的降低,從而以最低的系統成本為用戶提供GUI、人機界面(HMI)和休閑游戲方面的最佳用戶體驗。其目標系統產品包括機頂盒、數字電視、低成本移動設備、中檔汽車儀表盤和車載信息娛樂系統(IVI)。
9XMP計算密度(GFLOPS/mm2)比9XEP顯著提高,主要針對中端移動設備、機頂盒和數字電視應用,可提供很好的計算和游戲體驗,并為在GPU上實現人工智能和神經網絡處理提供了基礎。
9XTP基于Furian架構開發(fā),屬于該系列的高端產品,顯著提高了游戲/計算密度,并在整體設計上有更全面的功耗/性能/面積(PPA)的優(yōu)化,使其成為高端移動設備和高端車載信息娛樂系統,以及跨計算/服務器細分市場應用的理想選擇。
PowerVRSeries9采用了PVRIC4技術,這是Imagination的新一代圖像壓縮技術,可實現隨機訪問視覺無損圖像壓縮,確保了帶寬和內存占用率至少節(jié)省50%,并使系統能夠克服性能帶寬限制。與上一代GPU相比,新的GPU系列提供了更強的PPA和時序優(yōu)化。
PowerVRSeries9可以與PowerVRSeries3NX神經網絡加速器配對使用,利用GPU來管理經典的視覺和預處理算法,并使用Series3NX來實現高度優(yōu)化的定點神經網絡處理。另外,在最近發(fā)布的PowerVR汽車技術包中的多項優(yōu)化可以應用于所有PowerVRSeries9內核。
在軟件工具方面,Imagination為開發(fā)人員提供了免費獲得跨平臺PowerVRSDK的服務,該SDK可支持3D圖形應用開發(fā)的所有方面,并提供了可簡化3D圖形和GPU計算應用開發(fā)的工具和實用程序。
用于新GPU的PhysicalDesignOptimisationKits(DOKs)設計優(yōu)化工具包括優(yōu)化的參考設計流程、來自于合作伙伴經過調整優(yōu)化的邏輯庫、特性標定數據和文檔,這些靈活的優(yōu)化工具能優(yōu)化客戶設計的PPA。
幫助客戶應對高通和英偉達
目前,市場上做GPUIP的公司并不多,除了Imagination之外,就是高通和Arm了,而高通的業(yè)務模式又與Imagination、Arm有所不同,它既向Arm購買IP,也自行研發(fā)GPU的IP,主要用于自家的手機處理器SoC。Imagination公司PowerVR圖形處理商務運營副總裁GrahamDeacon表示,我們在這個行業(yè)是做得最好的,我們就是要幫助客戶和高通競爭。
在汽車芯片方面,英偉達利用其強大的GPU性能,占據了市場先機。對此,NealForse表示,英偉達機器學習做得很好,他們是開源的,我們的模式跟他們不一樣,在客戶支持方面我們做得更好。關于機器學習,我們的相關技術和產品公開發(fā)布情況還未確定。總體來講,英偉達強在機器學習上,我們強在推算能力上。
Imagination公司PowerVR產品管理和技術營銷高級總監(jiān)KristofBeets補充說:“英偉達是一家很成功的GPU公司,在汽車行業(yè)他們做的都是高端應用,但是往中低端走的并不順利,特別是在芯片的面積和功耗方面,降下來比較難。我們一直在跟德州儀器和瑞薩合作,可以提供比較全的方案,從低端、中端到高端,有不同的填充率,在GPU方面和英偉達差不多,加上我們的神經網絡加速器,我們的解決方案可以覆蓋得更全面。”