小編比較了目前主流“AI處理器”的技術(shù)和市場(chǎng)發(fā)展,并用表格的形式列出了它們的制程、架構(gòu)及應(yīng)用。
人工智能大熱,國內(nèi)外芯片開發(fā)商競(jìng)相發(fā)布自己的AI處理器智能芯片。小編比較了目前主流“AI處理器”的技術(shù)和市場(chǎng)發(fā)展,并用表格的形式列出了它們的制程、架構(gòu)及應(yīng)用。
寒武紀(jì)Cambricon-1A:核心的核心
寒武紀(jì)科技的Cambricon-1A是一款深度學(xué)習(xí)專用處理器芯片(NPU),其高性能硬件架構(gòu)及軟件支持Caffe、Tensorflow、MXnet等主流AI開發(fā)平臺(tái)。據(jù)稱這是國際上首個(gè)成功商用的深度學(xué)習(xí)處理器IP產(chǎn)品,可廣泛應(yīng)用于計(jì)算機(jī)視覺、語音識(shí)別、自然語言處理等智能處理關(guān)鍵領(lǐng)域。專注于人工智能產(chǎn)業(yè)發(fā)展的美國權(quán)威媒體CB Insights最新發(fā)布全球AI 100榜單,寒武紀(jì)以其深度學(xué)習(xí)專用處理器入選,是中國大陸唯一一家上榜的AI硬件創(chuàng)業(yè)公司。
寒武紀(jì)目前有三條產(chǎn)品線:首先是智能終端處理器IP授權(quán),智能IP指令集可授權(quán)集成到手機(jī)、安防、可穿戴設(shè)備等終端芯片中,客戶包括國內(nèi)頂尖SoC廠商,現(xiàn)已開始投入市場(chǎng)。其次,在智能云服務(wù)器芯片領(lǐng)域,作為PCIE加速卡插在云服務(wù)器上,客戶主要是國內(nèi)的知名服務(wù)器廠商。第三,家用智能服務(wù)機(jī)器人芯片:從智能玩具、智能助手入手,使服務(wù)機(jī)器人獨(dú)立具備看聽說的能力。客戶是各類下游機(jī)器人廠商,產(chǎn)品的推出將比智能云服務(wù)器芯片更晚一些。
華為麒麟970:號(hào)稱全球首款A(yù)I處理器
華為聲稱麒麟970是全球第一款人工智能系統(tǒng)級(jí)芯片,Kirin 970選擇了異構(gòu)計(jì)算架構(gòu)來大幅提升AI的運(yùn)算能力,內(nèi)置獨(dú)立的神經(jīng)網(wǎng)絡(luò)處理單元。據(jù)說這種專用硬件處理單元源自寒武紀(jì)NPU IP授權(quán),專門用于機(jī)器學(xué)習(xí)和一般的AI應(yīng)用程序。
Kirin970采用臺(tái)積電10ns芯片組制程技術(shù)(耗電量減少20%,體積減少 40%),主要規(guī)格如下:8 核心 CPU(時(shí)脈最高達(dá)2.4GHz),新世代12核心GPU(Mali G72MP12)、Kirin NPU(1.92T FP16 OPS)、Image DSP(512bit SIMD)、Dual Camera ISP(具備臉部、動(dòng)作偵測(cè))、HiFi Audio(32bit/384k)、UFS 2.1、安全引擎(inSE&TEE)、全球通用4.5G數(shù)據(jù)機(jī)(1.2Gbps@LTE Cat 18)、4K影像(HDR10)、LPDDR 4X、i7感應(yīng)處理器。
華為宣布將在美國上市的Huawei Mate 10 Pro會(huì)搭載麒麟970芯片,另外華為榮耀(Honor V10)也會(huì)采用。相較之下,高通驍龍845也把大部分焦點(diǎn)集中在AI,而普及率無疑會(huì)比麒麟970高,驍龍845支持眾多Android 旗艦智能手機(jī),當(dāng)中包括三星、Sony、LG 和小米的高端產(chǎn)品。
與華為麒麟970芯片不同的是,高通是在通用平臺(tái)內(nèi)做內(nèi)核優(yōu)化,它沒有獨(dú)立的神經(jīng)網(wǎng)絡(luò)引擎單元,而是更彈性的機(jī)器學(xué)習(xí)架構(gòu),分布在CPU、GPU、DPS等每個(gè)單元上,從而可以針對(duì)不同移動(dòng)終端彈性調(diào)用各個(gè)處理單元。
對(duì)于兩者方向的不同,高通方面認(rèn)為集成更加有效。但華為認(rèn)為,鑒于手機(jī)對(duì)能耗的要求,獨(dú)立NPU處理單元未來一定是手機(jī)處理器的必由之路,從現(xiàn)在看只有蘋果和華為做了獨(dú)立的NPU。
最近從微博流出Kirin 970與Snapdragon 845跑分對(duì)比,聲稱前者跑分比后者還要高出7%,但麒麟970、驍龍845的差異其實(shí)不大,且網(wǎng)絡(luò)還只秀出幾個(gè)獨(dú)立測(cè)試結(jié)果,并非完整跑分的平均值,顯示差距甚至可能比表面看來還小。同樣地,就算處理器的跑分很高,實(shí)地運(yùn)作的績(jī)效還是不一定,尤其在差距如此微小的情況下。話雖如此,外泄的跑分結(jié)果依舊暗示華為旗艦處理器的運(yùn)算能力有可能很快會(huì)追上高通。
高通驍龍845:今年將在高端Android手機(jī)中廣泛應(yīng)用
驍龍845采用最新的八核Kryo 385定制架構(gòu),性能比驍龍835的Kryo 280提升25%,三星第二代10nm工藝制程,主頻最高為2.8GHz;其次驍龍845集成的Adreno 630 GPU性能比驍龍835的Adreno 540提升30%,功耗降低30%。另外,驍龍845集成了第二代千兆級(jí)LTE Modem——X20調(diào)制解調(diào)器,比驍龍835的X16速度提升20%,其集成的全新Hexagon 685 DSP與Spectra 280 ISP全面提升拍照功能。
從微博發(fā)布的驍龍845和麒麟970參數(shù)規(guī)格對(duì)比看出,驍龍845核心發(fā)生巨大升級(jí),采用全新高端大核心A75與A53組合,GPU升級(jí)為Adreno 630,三星10nm LPE制程工藝。而麒麟970繼續(xù)采用A73核心與A53核心,GPU型號(hào)未知,同樣采用10nm工藝,由臺(tái)積電代工。
三星Exynos 9810:蘋果A11的最強(qiáng)對(duì)手?
三星Exynos9810處理器采用其第三代自研M3架構(gòu),擁有4個(gè)2.9GHz的M3大核和4個(gè)1.9GHz的A55小核,依然是10nm(FinFET)的制程工藝。10nm也是目前蘋果A11、驍龍845和麒麟970都在采用的制程工藝。
GPU方面,Exynos9810采用最新的Mali-G72,采用了18顆核心(MP18),預(yù)計(jì)工作頻率在700MHz。Mali-G72是ARM去年發(fā)布的基于Bifrost架構(gòu)的圖形處理器,在更小面積與更低功耗的基礎(chǔ)上,提供更強(qiáng)大的效能。采用Mali-G72的設(shè)備,整體圖形性能是前一代的1.4倍。能效提升25%,芯片面積效能提升20%,機(jī)器學(xué)習(xí)效率提升17%。
在人工智能方面,支持人臉檢測(cè)的Bixby變得更加聰明?;谏窠?jīng)網(wǎng)絡(luò)的深度學(xué)習(xí),新的處理器能夠通過快速圖像搜索和分類精確識(shí)別照片中的人或物,以進(jìn)行快速圖像搜索或分類,或者通過深度感測(cè),在3D中掃描用戶的臉部以進(jìn)行混合式人臉檢測(cè)。通過利用硬件和軟件,混合式人臉檢測(cè)功能可以實(shí)現(xiàn)真實(shí)的人臉跟蹤檢測(cè),從而在使用人臉進(jìn)行設(shè)備解鎖時(shí)候更加安全。
英偉達(dá)DRIVE Xavier:為自動(dòng)駕駛提供強(qiáng)勁驅(qū)動(dòng)力
在CES會(huì)展上搶盡風(fēng)頭的英偉達(dá)展示了DRIVE Xavier,這個(gè)AI芯片由一個(gè)特別定制的8核CPU、一個(gè)全新的512核Volta GPU、一個(gè)全新深度學(xué)習(xí)加速器、全新計(jì)算機(jī)視覺加速器、以及全新8K HDR視頻處理器而打造。DRIVE Xavier可以提供更高的處理能力,運(yùn)行功率更低,每秒可運(yùn)行30 萬億次計(jì)算,功耗卻僅為30瓦,能效比上一代架構(gòu)高出15倍。TensorCore、視頻識(shí)別和流處理、物體定位、路徑規(guī)劃等所有AI計(jì)算任務(wù)都能在上面飛快跑起來,據(jù)稱首批樣品2018年第一季度就可以交付給客戶。英偉達(dá)CEO黃仁勛表示,中國市場(chǎng)是全球最大市場(chǎng),所有的系統(tǒng)在設(shè)計(jì)時(shí)都考慮到了本地化和中國客戶的需求,比如百度的每輛自動(dòng)駕駛車輛都搭載了Drive Xavier。
Intel Loihi:挑戰(zhàn)神經(jīng)擬態(tài)計(jì)算難題
為了抵御NVIDIA在人工智能領(lǐng)域的強(qiáng)勢(shì)進(jìn)攻,Intel先后收購了FPGA芯片巨頭Altera、AI初創(chuàng)公司Nervana Systems,以及以色列自動(dòng)駕駛芯片公司Mobileye等。Intel在CES上向各界展示了其自主學(xué)習(xí)神經(jīng)擬態(tài)芯片“Loihi”,這是在收購以上技術(shù)公司并匯集眾多研究成果后推出的神經(jīng)擬態(tài)芯片。
AI芯片可以分為兩類,一類為人工神經(jīng)網(wǎng)絡(luò),而另一類為神經(jīng)擬態(tài)計(jì)算,理論上來說神經(jīng)擬態(tài)計(jì)算效能更好,但芯片開發(fā)難度更大,Intel的Loihi采用神經(jīng)擬態(tài)計(jì)算這條更難的道路可以看出它希望逆襲NVIDIA的野心。
Loihi采用了架構(gòu)到芯片建模、異步設(shè)計(jì)流程以及基于FPGA仿真的圓形算法驗(yàn)證,具有非常節(jié)能的特點(diǎn),擁有128個(gè)核+3個(gè)低功耗X86核、可編程的學(xué)習(xí)規(guī)則等特點(diǎn)。
Intel介紹Loihi芯片擁有自主學(xué)習(xí)功能,并且可以利用數(shù)據(jù)來學(xué)習(xí)和推斷,隨著時(shí)間延長能變得更加智能,可以應(yīng)用于汽車和工業(yè)生產(chǎn)等領(lǐng)域,不過說了這么多優(yōu)點(diǎn),這一切還需要在現(xiàn)實(shí)中應(yīng)用以證明它是否具有這些能力,這恰恰是Intel相較NVIDIA的弱點(diǎn),因?yàn)楫?dāng)前在全球的神經(jīng)網(wǎng)絡(luò)訓(xùn)練系統(tǒng)大多數(shù)都采用NVIDIA的芯片,Intel需要加大力度推廣以在市場(chǎng)份額上趕上NVIDIA。
瑞芯微RK3399Pro:首次采用CPU+GPU+NPU硬件結(jié)構(gòu)設(shè)計(jì)
瑞芯微電子(Rockchip)在CES上發(fā)布旗下首款性能超強(qiáng)的AI處理器RK3399Pro,為人工智能領(lǐng)域提供一站式Turnkey解決方案,其NPU運(yùn)算性能高達(dá)2.4TOPs,具高性能、低功耗、開發(fā)易等優(yōu)勢(shì)。
RK3399Pro AI芯片采用big.LITTLE大小核CPU架構(gòu),雙核Cortex-A72+四核Cortex-A53,在整體性能、功耗方面具技術(shù)領(lǐng)先性;四核ARM高端GPU Mali-T860,集成更多帶寬壓縮技術(shù),整體性能優(yōu)異。RK3399Pro具備極強(qiáng)的AI運(yùn)算性能,是瑞芯微首次采用CPU+GPU+NPU硬件結(jié)構(gòu)設(shè)計(jì)的AI芯片,其集成的NPU融合了瑞芯微在機(jī)器視覺、語音處理、深度學(xué)習(xí)等領(lǐng)域的多年經(jīng)驗(yàn)。相較傳統(tǒng)芯片,典型深度神經(jīng)網(wǎng)絡(luò)Inception V3、ResNet34、VGG16等模型在RK3399Pro芯片上的運(yùn)行效果表現(xiàn)出眾。
聯(lián)發(fā)科NeuroPilot:廣泛用于消費(fèi)性產(chǎn)品
聯(lián)發(fā)科在CES發(fā)布了NeuroPilot人工智能(AI)平臺(tái),主攻智能手機(jī)、智能家庭、自駕車的終端邊緣運(yùn)算。聯(lián)發(fā)科表示,目前1年約有15億臺(tái)消費(fèi)電子產(chǎn)品采用聯(lián)發(fā)科芯片,2018年將整合AI處理器與NeuroPilot SDK軟件開發(fā)套件技術(shù),將AI帶入廣泛的消費(fèi)性產(chǎn)品中。
聯(lián)發(fā)科已在2018年新款Helio手機(jī)芯片中加入AI運(yùn)算核心,現(xiàn)在已為智能語音助理、智能電視、自駕車打造AI解決方案,并在CES中展示具體跨平臺(tái)應(yīng)用,包括Amazon Echo智能語音助理、Android O智能電視、BelkinWemo智能型插座、以及聯(lián)發(fā)科全網(wǎng)覆蓋家庭路由器等。
華夏芯“北極星”:完全自主知識(shí)產(chǎn)權(quán)的AI芯片平臺(tái)
華夏芯發(fā)布全自主IP的AI芯片平臺(tái)——“北極星”,這是國內(nèi)首次發(fā)布的CPU、DSP和AI全部具有自主知識(shí)產(chǎn)權(quán)的平臺(tái)型人工智能芯片。“北極星”是一款面向多種應(yīng)用的SoC芯片,不但有負(fù)責(zé)神經(jīng)網(wǎng)絡(luò)和深度學(xué)習(xí)的AI專用處理器,還集成了高性能的CPU/DSP,其能力可以延伸到多個(gè)產(chǎn)品領(lǐng)域,諸如智能輔助駕駛、智能安防監(jiān)控、機(jī)器人、計(jì)算機(jī)視覺、車載和商用雷達(dá)探測(cè)、語音識(shí)別等嵌入式人工智能應(yīng)用。此外,還能延伸到工業(yè)4.0、現(xiàn)場(chǎng)控制、邊緣計(jì)算、智能硬件、智慧家居等在內(nèi)的多個(gè)其它領(lǐng)域,是一款市場(chǎng)適應(yīng)性極強(qiáng)的異構(gòu)計(jì)算和人工智能平臺(tái)型芯片。
“北極星”可以在單芯片上采用編程擴(kuò)展的方法實(shí)現(xiàn)復(fù)雜度很高的現(xiàn)場(chǎng)控制與決策、數(shù)字信號(hào)處理、圖像信號(hào)處理、基于神經(jīng)網(wǎng)絡(luò)的深度學(xué)習(xí)和特征提取、多線程并行計(jì)算等多種功能。“北極星”芯片采用臺(tái)積電28nm工藝制程,將于2018年上半年量產(chǎn)。
地平線“征程”和“旭日”:嵌入式人工智能視覺芯片
去年獲得Intel一億美元投資的地平線推出了征程(Journey)和旭日(Sunrise)兩款處理器,都屬于嵌入式人工智能視覺芯片,分別面向智能駕駛和智能攝像頭。
這兩款芯片性能可達(dá)到1Tops,實(shí)時(shí)處理1080P@30幀,每幀可同時(shí)對(duì)200個(gè)目標(biāo)進(jìn)行檢測(cè)、跟蹤、識(shí)別。典型功耗做到1.5W。兩款芯片采用關(guān)注模型(Attention Engine)+認(rèn)知模型(Cognition Engine)的數(shù)據(jù)處理流模式。通過這一個(gè)組合算法,芯片的計(jì)算速度可以10倍以上。通過邊緣學(xué)習(xí),模型可以不斷提升自己,錯(cuò)誤率降低在50%以上。此外,兩款芯片利用彈性張量計(jì)算核,地平線人工智能處理器的乘法器利用率接近100%。
征程1.0處理器具備同時(shí)對(duì)形容、機(jī)動(dòng)車、非機(jī)動(dòng)車、車道線、交通標(biāo)志牌、紅綠燈等多類目標(biāo)進(jìn)行精準(zhǔn)實(shí)時(shí)檢測(cè)與識(shí)別的處理能力,可支持L2級(jí)別的輔助駕駛系統(tǒng)
旭日1.0系列處理器集合了深度學(xué)習(xí)算法,支持在前段實(shí)現(xiàn)大規(guī)模人臉檢測(cè)跟蹤、視頻結(jié)構(gòu)化,可應(yīng)用于智能城市、智能商業(yè)等場(chǎng)景。
-
三星電子
+關(guān)注
關(guān)注
34文章
15863瀏覽量
181015 -
華為
+關(guān)注
關(guān)注
216文章
34437瀏覽量
251738 -
寒武紀(jì)
+關(guān)注
關(guān)注
11文章
186瀏覽量
73890 -
AI處理器
+關(guān)注
關(guān)注
0文章
92瀏覽量
9491
原文標(biāo)題:寒武紀(jì)/華為/高通等十款A(yù)I處理器對(duì)比,誰更強(qiáng)?
文章出處:【微信號(hào):WW_CGQJS,微信公眾號(hào):傳感器技術(shù)】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
評(píng)論