今日,Arm生態(tài)系統(tǒng)合作伙伴華為于北京召開發(fā)布會(huì),正式在國(guó)內(nèi)發(fā)布搭載10nm工藝制程的年度旗艦處理器麒麟970,同時(shí)也是全球首款內(nèi)置神經(jīng)元網(wǎng)絡(luò)單元(NPU)的智能芯片。
在核心配置方面,麒麟970采用了4*Cortex-A73+4*Cortex-A53的大小核設(shè)計(jì),其中A73大核主頻為2.4GHz,A53小核主頻為1.8GHz。在GPU上,麒麟970為Mali-G72 MP12,在視頻方面首次支持HDR10,支持4K@60fps視頻解碼。相機(jī)雙ISP,支持人工智能場(chǎng)景識(shí)別、人臉追焦、智能運(yùn)動(dòng)場(chǎng)景檢測(cè),夜拍效果得到加強(qiáng)。
作為Arm今年新發(fā)的高端GPU,Mali-G72已“裝機(jī)”麒麟970,它有哪些強(qiáng)大之處?它又是如何對(duì)人工智能與機(jī)器學(xué)習(xí)算法進(jìn)行支持的呢?
機(jī)器學(xué)習(xí)與GPU技術(shù)的完美Match人工智能的最近一次浪潮起源于 2011 年前后深度學(xué)習(xí)(Deep Learning)引起的大發(fā)展。在其背后,快速發(fā)展的 GPU 功不可沒(méi)。機(jī)器學(xué)習(xí)作為人工智能領(lǐng)域的一個(gè)小分支,如今已是移動(dòng)計(jì)算的關(guān)鍵應(yīng)用場(chǎng)景之一。通常而言,機(jī)器學(xué)習(xí)在云端上進(jìn)行,運(yùn)用訓(xùn)練神經(jīng)網(wǎng)絡(luò)的大量數(shù)據(jù)集實(shí)現(xiàn)智能連接,但越來(lái)越多的數(shù)據(jù)也需要在設(shè)備端進(jìn)行,比如像翻譯這樣的簡(jiǎn)單任務(wù),通過(guò)云端持續(xù)傳送大量數(shù)據(jù),不但增加成本,而且速度也很慢,這也是為何業(yè)界開始研究“將機(jī)器學(xué)習(xí)界面放到設(shè)備本身”的原因。
搭載了Mali-G71的華為Mate 9便是一次不錯(cuò)的嘗試,它其中的機(jī)器學(xué)習(xí)算法會(huì)找出你最常用的應(yīng)用程序,并對(duì)其能耗性能進(jìn)行優(yōu)先設(shè)置,保證實(shí)現(xiàn)最優(yōu)性能,其中,基于Bifrost架構(gòu)的Mali-G71功不可沒(méi),而Mali-G72性能則更優(yōu)。相比Mali-G71,Mali-G72性能提升了40%、能效提升25%、每平方毫米的芯片面積效能提升20%,并針對(duì)機(jī)器學(xué)習(xí)進(jìn)行了優(yōu)化,為機(jī)器學(xué)習(xí)效率帶來(lái)17%的提升,從而使得Arm能夠在整個(gè)SoC上更高效地現(xiàn)實(shí)分布式智能。期待搭載Mali-G72的新機(jī)華為Mate 10的上市。
為何Mali-G72這么牛?除了繼續(xù)保持Bifrost架構(gòu)最主要的高效能特色外,像是CPU與GPU彼此間完整的系統(tǒng)一致性、索引式定位著色器等,Mali-G72同時(shí)還有多項(xiàng)新武器。Arm增加了區(qū)塊緩沖存儲(chǔ)器(tile buffer memory),以便讓GPU在每個(gè)運(yùn)行區(qū)塊(tile)支持更多的儲(chǔ)存空間,也重新平衡了執(zhí)行引擎的數(shù)據(jù)路徑,移除某些鮮少使用的指令,并以更簡(jiǎn)單的指令順序取而代之。同時(shí),Arm針對(duì)更多復(fù)雜運(yùn)算進(jìn)行了優(yōu)化,為了進(jìn)一步降低帶寬,增加了一級(jí)緩存與寫回緩存的大小,同時(shí)也改變指令緩存邏輯,以便在不增加整體面積與耗電情況下進(jìn)行更佳利用,并減少對(duì)復(fù)雜內(nèi)容產(chǎn)生的緩存遺漏情況。綜上,Mali-G72算法優(yōu)化及增加的高速緩存已經(jīng)非常成熟,借由此大幅降低帶寬,可以實(shí)現(xiàn)機(jī)器學(xué)習(xí)最大的效率與效能。
Arm GPU架構(gòu)使用發(fā)展史
2007年Arm推出基于Utgard架構(gòu)的Mali-200,當(dāng)時(shí)面向的設(shè)備分辨率較低,內(nèi)容比較簡(jiǎn)單。Utgard架構(gòu)的特點(diǎn)是并非像現(xiàn)代GPU設(shè)計(jì)那樣采用了統(tǒng)一渲染引擎,它依舊是一個(gè)典型的頂點(diǎn)和像素分離式渲染的產(chǎn)物。
2010年末,Arm推出基于Midgard架構(gòu)構(gòu)建的首款GPU Mali-T604,面向的設(shè)備可達(dá)1080p HD的分辨率,內(nèi)容變得越來(lái)越復(fù)雜了。從架構(gòu)上來(lái)看,Midgard是之前Utgard的繼承者,但是統(tǒng)一渲染架構(gòu)和分離式渲染架構(gòu)的差異如此之大,使得這兩個(gè)架構(gòu)又不能直接比較。當(dāng)然,Midgard還是繼承了不少Utgard中優(yōu)秀的部分,尤其是部分周圍功能模塊。
2016年,隨著內(nèi)容變得越來(lái)越精細(xì),越來(lái)越復(fù)雜,在GPU渲染的角度來(lái)說(shuō)會(huì)有更復(fù)雜光影的處理,包括全局光照的處理。從顯示面板的角度來(lái)看,未來(lái)4K的面板也會(huì)大量涌現(xiàn)。為滿足這樣的市場(chǎng)需求,Arm推出了基于嶄新GPU架構(gòu)Bifrost的產(chǎn)品。雖然Bifrost架構(gòu)看上去與Midgard類似,但其內(nèi)部的功能模塊均有顯著的提升,基于前面提到的各種各樣的應(yīng)用場(chǎng)景,包括設(shè)備的需求,以及面對(duì)的挑戰(zhàn),Bifrost架構(gòu)都可以解決這樣的問(wèn)題。
-
gpu
+關(guān)注
關(guān)注
28文章
4910瀏覽量
130660 -
AI
+關(guān)注
關(guān)注
87文章
34223瀏覽量
275387 -
Huawei
+關(guān)注
關(guān)注
1文章
179瀏覽量
20684
原文標(biāo)題:揭秘華為首款移動(dòng)AI芯片麒麟970背后的GPU技術(shù)創(chuàng)新
文章出處:【微信號(hào):arm_china,微信公眾號(hào):Arm芯聞】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
發(fā)布評(píng)論請(qǐng)先 登錄
AI新境技術(shù)創(chuàng)新與發(fā)展論壇圓滿落幕

評(píng)論