盡管相當數(shù)量的人工智能服務,是由云計算網(wǎng)絡提供,但在響應低延遲、保護隱私、應用場景等方面,手機AI芯片無可替代。例如人臉解鎖,圖像增強、識別,智能助手,拍照場景識別,這些你我每天都會接觸的功能,離不開手機神經(jīng)引擎的加持。
AI-Benchmark測評
AI-Benchmark是蘇黎世聯(lián)邦理工學院(ETH Zürich)計算機視覺實驗室Andrey Ignatov開發(fā)的AI基準測試程序,它不依賴于每個SoC供應商自己的SDK工具和API基準,能更客觀地展示終端性能。
其測試任務包括以下9項(http://ai-benchmark.com/tests.html):
目標識別/分類:這是一個非?;A但很強大的神經(jīng)網(wǎng)絡,能夠基于一張照片識別1000個不同的對象類別,準確率約為70%。經(jīng)過量化,其大小可小于 5MB,再加上低耗內(nèi)存,可在幾乎所有現(xiàn)有智能手機上使用。
精確目標識別/分類:這是對上一個網(wǎng)絡的進一步擴展,更加精確,但代價是規(guī)模是原來的4倍,且對計算的要求較高。一個明顯的優(yōu)勢是——它可以處理分辨率更高的圖像,這意味著更精確的識別和更小目標的檢測。
人臉識別:實現(xiàn)方式為,對于每個人臉圖像,神經(jīng)網(wǎng)絡會對人臉編碼并生成128維的特征向量,該特征向量不隨縮放、移動或旋轉而改變。然后在數(shù)據(jù)庫中檢索和此向量最匹配的特征向量(以及對應的身份),數(shù)據(jù)庫里包含數(shù)億個此類信息。
圖像去模糊:模糊是通過一種最原始、最簡單、最輕量級的神經(jīng)網(wǎng)絡 SRCNN(只有 3 個卷積層)去除的。即便如此,它仍然顯示出相當令人滿意的結果。
圖像超分辨率:使用一個19層的VGG-19網(wǎng)絡。盡管目前來看,該網(wǎng)絡的表現(xiàn)并不驚艷,也不能重建高頻部分。但它對于繪畫仍是理想的解決方案,因為該網(wǎng)絡可以讓圖像變得更加清晰、平滑。
另一種圖像超分辨率:任務同上,但完成方法略有不同,如果使用其他神經(jīng)網(wǎng)絡訓練我們的神經(jīng)網(wǎng)絡會如何?我們安排兩個網(wǎng)絡去完成兩個不同的任務:網(wǎng)絡嘗試解決上面提到的超分辨率問題,網(wǎng)絡B觀察其結果,嘗試找到其中的缺陷并懲罰網(wǎng)絡A。
語義圖像分割:根據(jù)車載攝像頭拍攝的照片檢測19類目標(如車、行人、路、天空等)。
圖像增強:經(jīng)過恰當訓練的神經(jīng)網(wǎng)絡可以讓舊手機上的照片看起來更時髦。
內(nèi)存極限:任務4使用的SRCNN是最輕便、簡單的神經(jīng)網(wǎng)絡之一,這項測試的目的是找到設備的極限,即這個最簡易的網(wǎng)絡到底能處理多大的圖像。
一騎絕塵 or 不分勝負
在剛出爐的2019年2月排行中,高通驍龍855位列榜首,緊隨其后是聯(lián)發(fā)科Helio P90處理器。而華為最強手機處理器麒麟980(去年9月發(fā)布),在這項測試中,已被驍龍855大幅甩開35%。
驍龍855(總分19769)對浮點和量化神經(jīng)網(wǎng)絡都能提供出色的硬件加速——前者依靠Adreno 640 GPU,而量化網(wǎng)絡則運行在Hexagon 690 DSP中。這種組合省略了AI獨立運算單元,依舊是傳統(tǒng)的CPU/GPU及DSP/ISP兼職處理AI任務。這種設計思路,令SoC更小巧,也更容易開發(fā),但原本用于圖形任務設計的GPU,在更遠的未來可能會觸及架構瓶頸,難免還要面對芯片架構的一次大調(diào)整。
芯片之爭既是長跑,也是沖刺。
關于量化網(wǎng)絡
開發(fā)神經(jīng)網(wǎng)絡時最大的挑戰(zhàn)是讓其真正起效,訓練一般希望速度快準確率高。使用浮點算法是保持結果精確最簡單的方式——GPU擁有加速浮點算法庫,所以不需要過多關注其他數(shù)值格式。
而隨著大量神經(jīng)網(wǎng)絡模型投入實際應用。訓練計算需求隨研究者數(shù)目線性增長,預測所需的周期與用戶數(shù)目成正比。這意味著純預測效率迫在眉睫。
這就是量化神經(jīng)網(wǎng)絡的用武之地:量化網(wǎng)絡最初的動機是減小模型文件尺寸,在模型載入后仍然轉換回浮點數(shù),這樣你已有的浮點計算代碼無需改動即可正常運行,另一個量化的動機是降低預測過程的計算資源需求。
雖然只是中端芯片,但聯(lián)發(fā)科P90(總分18231)的實際AI性能,幾乎與驍龍旗艦處理器不分伯仲(雖然P90理論GMAC參數(shù)占下風),它采用了獨立的AI芯片——其設計來自GPU“魔改”,以優(yōu)化深度學習任務。與競爭對手相比,這款芯片的不足在于CPU性能弱了30%,GPU也差強人意。
華為麒麟980(總分14646)發(fā)布已近半年,雖然賬面成績遜一籌,但值得指出的是,它的浮點性能與兩個對手不分勝負,這意味著運行浮點神經(jīng)網(wǎng)絡任務,亦相差無幾——這是當下AI研究和開發(fā)的主流技術,而且每個網(wǎng)絡架構,都能以浮點模型訓練。反之則不然,能轉換為量化模型的網(wǎng)絡較少,且常常伴隨著準確度大幅下降。所以在2019年初,華為麒麟980仍算強大。
回顧歷史,早在2004年,華為開始組建手機芯片研發(fā)隊伍,經(jīng)過5年研發(fā),到2009年,才拿出第一款海思K3。到2014年初,推出麒麟910,首次采用28nm制程,才有自己的名聲。整個2014年,華為不停的迭代,一共發(fā)布了6款芯片,終于有了長足進步。
再到2015年11月,麒麟950 SoC發(fā)布,采用16nm FinFET Plus工藝,勉強追上高通。而在950之后,華為又在2016年發(fā)布了960,2017年發(fā)布970,再到2018年7月發(fā)布710、8月發(fā)布980,終于開始領跑——之后的一個季度,華為麒麟970/980家族幾乎壟斷了AI-Benchmark商用設備榜單。
那么,目前地表最強的移動AI處理器最終花落驍龍855?隔壁蘋果家的A12X Bionic可能并不同意(AI-Benchmark目前只支持Android平臺)。
-
神經(jīng)網(wǎng)絡
+關注
關注
42文章
4772瀏覽量
100845 -
人工智能
+關注
關注
1791文章
47352瀏覽量
238771 -
AI芯片
+關注
關注
17文章
1889瀏覽量
35064
原文標題:手機芯片誰是AI之王?高通、聯(lián)發(fā)科均超華為
文章出處:【微信號:rgznai100,微信公眾號:rgznai100】歡迎添加關注!文章轉載請注明出處。
發(fā)布評論請先 登錄
相關推薦
評論