0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

邊緣AI處理器拼的只是算力和功耗嗎

lPCU_elecfans ? 來(lái)源:電子發(fā)燒友網(wǎng) ? 作者: 周凱揚(yáng) ? 2021-11-02 11:10 ? 次閱讀

電子發(fā)燒友網(wǎng)報(bào)道(文/周凱揚(yáng))AI應(yīng)用如同燃起的野火一般,從消費(fèi)級(jí)的手機(jī)端,出現(xiàn)在了工業(yè)級(jí)的超級(jí)游輪和航空級(jí)的空間站上。然而在邊緣端,這些應(yīng)用遇上了傳統(tǒng)應(yīng)用也掙扎了數(shù)年的需求:更高的性能、更大的容量和更低的功耗。

更糟糕的是,機(jī)器學(xué)習(xí)模型正在以指數(shù)級(jí)的速度增長(zhǎng),每3到5個(gè)月就會(huì)翻一番。要想應(yīng)用這些模型的話(huà),傳統(tǒng)的計(jì)算芯片已經(jīng)難以利用有限的內(nèi)存資源和功率提供高性能,連數(shù)據(jù)中心都在AI工作負(fù)載上感到吃力了,更不用說(shuō)在邊緣側(cè)運(yùn)行的大型模型。為此,邊緣AI處理器成了不少芯片大廠和初創(chuàng)企業(yè)的發(fā)力方向。然而在處理器的選取上,并不是僅僅看算力、功耗和成本而已。

邊緣AI處理器的選擇

首先,AI芯片公司不僅要有硬件開(kāi)發(fā)實(shí)力,也要具備強(qiáng)大的AI軟件棧和工具。比如英特爾英偉達(dá)之類(lèi)的廠商,其CPUGPU設(shè)計(jì)早已為TensorFlow、Caffe或Pytorch等框架提供了支持,但初創(chuàng)企業(yè)自研架構(gòu)的AI處理器往往需要打造自己的編譯器來(lái)支持這些框架。

其次,是處理器支持的神經(jīng)網(wǎng)絡(luò)精度。多數(shù)邊緣AI處理器精度并不高,這是因?yàn)閷⑸窠?jīng)網(wǎng)絡(luò)轉(zhuǎn)換為低精度簡(jiǎn)化了硬件設(shè)計(jì),同時(shí)也極大地降低了功耗。要想保持高精度的話(huà),往往需要重新訓(xùn)練神經(jīng)網(wǎng)絡(luò)。

Nvidia - Jetson Xavier NX

英偉達(dá)于2019年公布了一款名為“Jetson Xavier NX”的AI處理器,專(zhuān)門(mén)用于邊緣系統(tǒng)和嵌入式應(yīng)用。Jetson Xavier NX只有70mm x 45mm的大小,卻可以在15W的功耗下提供21 TOPS(INT8)的AI算力。

Jetson Xavier NX集成了6核CPU、384核GPU、48個(gè)Tensor核心、2個(gè)NVDLA深度學(xué)習(xí)加速器和7路VLIW視覺(jué)處理器加速器。其中CPU選用了英偉達(dá)Carmel Arm核心,GPU則是基于Volta架構(gòu)。該處理器還配備了8GB 128位的LDDR4x內(nèi)存,可提供59.7GB/s的帶寬性能。

英偉達(dá)已經(jīng)為用戶(hù)提供了開(kāi)發(fā)者套件,可以創(chuàng)建高性能的AI應(yīng)用,并快速部署深度神經(jīng)網(wǎng)絡(luò)模型和常見(jiàn)的機(jī)器學(xué)習(xí)框架,比如Tensorflow和Pytorch等,除此之外也可以用到cuDNN、TensorRT和DeepStream等一系列軟件庫(kù)和加速工具。

Jetson Xavier NX最大的優(yōu)勢(shì)在于其Jetson產(chǎn)品線全部基于同一軟件棧,所以可以直接套用更強(qiáng)大的Jetson AGX Xavier上的AI應(yīng)用,只不過(guò)算力要稍低一截而已。憑借其21TOPS的AI算力,加上加速器提供的視頻處理器性能,可以毫無(wú)壓力地完成人體識(shí)別、自研語(yǔ)言處理、姿勢(shì)檢測(cè)和注視檢測(cè)等AI應(yīng)用,適用于自動(dòng)光學(xué)檢測(cè)和智能攝像頭等一系列邊緣IoT設(shè)備。

Hailo - Hailo-8

Hailo是一家來(lái)自于以色列的AI芯片公司,不少核心開(kāi)發(fā)成員來(lái)自于以色列國(guó)防科技部門(mén),主要負(fù)責(zé)為邊緣設(shè)備開(kāi)發(fā)高性能的AI處理器。早在2019年,Hailo就公布了其自研的邊緣AI處理器Hailo-8,其算力可達(dá)26TOPS(INT8),但該處理器的典型功耗僅有2.5W。在完成了多輪融資后,Hailo也在今年開(kāi)始了Hailo-8的量產(chǎn)。

55d3c90a-3b84-11ec-82a9-dac502259ad0.png

Hailo-8與Jetson產(chǎn)品的對(duì)比 / Hailo

與傳統(tǒng)的CPU、GPU、DSP或硬件加速器的架構(gòu)不同,Hailo在這款處理器上運(yùn)用了自研的結(jié)構(gòu)定義數(shù)據(jù)流架構(gòu)。在ResNet-50的神經(jīng)網(wǎng)絡(luò)測(cè)試中,Hailo-8取得了1330FPS@3.2W的成績(jī)。Hailo還在官網(wǎng)曬出出了Hailo-8與英偉達(dá)Jetson Nano與Xavier NX在ResNet和SSD_MobileNet等模型下的預(yù)期表現(xiàn)對(duì)比,我們從上圖可以看出,Hailo-8在性能上優(yōu)勢(shì)明顯,能耗比更是讓英偉達(dá)的兩款Jetson處理器望塵莫及。

Hailo還準(zhǔn)備好了開(kāi)源的Model Zoo,其中囊括了物體識(shí)別、分類(lèi)、人臉檢測(cè)識(shí)別等60多種計(jì)算機(jī)視覺(jué)任務(wù)的深度學(xué)習(xí)模型。開(kāi)發(fā)者利用這些預(yù)訓(xùn)練的Tensorflow和ONNX模型,只需用上自己的數(shù)據(jù)重新訓(xùn)練,即可在Hailo設(shè)備上迅速創(chuàng)建好原型。

Mythic - M1076

美國(guó)德州的初創(chuàng)公司Mythic推出了利用存內(nèi)計(jì)算技術(shù)的M1076模擬矩陣處理器(AMP)。單個(gè)M1076芯片的面積只有360mm2,卻可以在3W至4W的功耗下提供35 TOPS的算力,與常見(jiàn)的SoC或GPU方案相比,功耗低了10倍以上。

但這并不是M1076的最大特色,與傳統(tǒng)數(shù)字計(jì)算方式不同,Mythic在M1076上運(yùn)用了模擬計(jì)算。模擬計(jì)算雖然理論上要要與數(shù)字計(jì)算,但長(zhǎng)久以來(lái)收到尺寸的限制,在速度與擴(kuò)展性上一直提不上去。然而Mythic通過(guò)將模擬運(yùn)算與嵌入式閃存結(jié)合,選擇了存內(nèi)計(jì)算的方式。

M1076同時(shí)支持INT4、INT8和INT16三種數(shù)據(jù)類(lèi)型,非常適合作為TinyML的開(kāi)發(fā)平臺(tái)。Mythic也為客戶(hù)提供了物體識(shí)別/分類(lèi)、圖像分割和姿勢(shì)評(píng)估等模型,可用于AR/VR中的智能健身和游戲等應(yīng)用。

小結(jié)

云計(jì)算在邊緣端的弱勢(shì)使得邊緣AI處理器有了崛起的機(jī)會(huì),在工業(yè)4.0、自動(dòng)化系統(tǒng)和智能IoT的潮流下,邊緣AI還需要繼續(xù)開(kāi)拓應(yīng)用場(chǎng)景,而不僅僅是用于機(jī)器視覺(jué)任務(wù)。邊緣AI處理器廠商也必須繼續(xù)提供更多的模型,幫助開(kāi)發(fā)者加速邊緣AI應(yīng)用的落地。

聲明:本文由電子發(fā)燒友原創(chuàng),轉(zhuǎn)載請(qǐng)注明以上來(lái)源。如需入群交流,請(qǐng)?zhí)砑游⑿舉lecfans999,投稿爆料采訪需求,請(qǐng)發(fā)郵箱huangjingjing@elecfans.com。

編輯:jq

聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 處理器
    +關(guān)注

    關(guān)注

    68

    文章

    19329

    瀏覽量

    230132
  • 芯片
    +關(guān)注

    關(guān)注

    456

    文章

    50908

    瀏覽量

    424439
  • AI
    AI
    +關(guān)注

    關(guān)注

    87

    文章

    31025

    瀏覽量

    269363
  • 機(jī)器學(xué)習(xí)

    關(guān)注

    66

    文章

    8423

    瀏覽量

    132744

原文標(biāo)題:邊緣AI處理器拼的不僅是算力和功耗

文章出處:【微信號(hào):elecfans,微信公眾號(hào):電子發(fā)燒友網(wǎng)】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏

    評(píng)論

    相關(guān)推薦

    企業(yè)AI租賃模式的好處

    構(gòu)建和維護(hù)一個(gè)高效、可擴(kuò)展的AI基礎(chǔ)設(shè)施,不僅需要巨額的初期投資,還涉及復(fù)雜的運(yùn)維管理和持續(xù)的技術(shù)升級(jí)。而AI
    的頭像 發(fā)表于 12-24 10:49 ?138次閱讀

    未來(lái)邊緣GPU在車(chē)聯(lián)網(wǎng)中的創(chuàng)新應(yīng)用(下)

    數(shù)據(jù),實(shí)現(xiàn)高效的通信和數(shù)據(jù)處理。邊緣GPU力作為一種高性能的計(jì)算設(shè)備,能夠在本地處理和分析來(lái)自車(chē)輛傳感和外部環(huán)境的數(shù)據(jù),為車(chē)聯(lián)網(wǎng)應(yīng)用提供
    的頭像 發(fā)表于 12-19 11:16 ?192次閱讀
    未來(lái)<b class='flag-5'>邊緣</b>GPU<b class='flag-5'>算</b><b class='flag-5'>力</b>在車(chē)聯(lián)網(wǎng)中的創(chuàng)新應(yīng)用(下)

    企業(yè)AI租賃是什么

    企業(yè)AI租賃是指企業(yè)通過(guò)互聯(lián)網(wǎng)向?qū)I(yè)的提供商租用所需的計(jì)算資源,以滿(mǎn)足其AI應(yīng)用的需求。
    的頭像 發(fā)表于 11-14 09:30 ?724次閱讀

    【「芯片 | 高性能 CPU/GPU/NPU 微架構(gòu)分析」閱讀體驗(yàn)】--全書(shū)概覽

    、GPU、NPU,給我們剖析了芯片的微架構(gòu)。書(shū)中有對(duì)芯片方案商處理器的講解,理論聯(lián)系實(shí)際,使讀者能更好理解芯片。 全書(shū)共11章,
    發(fā)表于 10-15 22:08

    超緊湊模塊提供高達(dá) 39 TOPS AI

    的 XDNA? NPU 和強(qiáng)大的 Radeon RDNA 3? 圖形處理器,可為AI推理提供高達(dá)39 TOPS的驚人。 ? ?? 這使得全新conga-TCR8 Type 6模塊在
    發(fā)表于 09-25 13:46 ?1323次閱讀
     超緊湊模塊提供高達(dá) 39 TOPS <b class='flag-5'>AI</b> <b class='flag-5'>算</b><b class='flag-5'>力</b>

    米爾STM32MP2核心板首發(fā)新品上市!高性能+多接口+邊緣

    的工業(yè)4.0應(yīng)用賦能。 機(jī)器視覺(jué) 先進(jìn)的邊緣AI STM32MP25內(nèi)置高達(dá)1.35 TOPS的NPU邊緣
    發(fā)表于 09-20 18:24

    基于全志V853處理器的智能輔助駕駛算法介紹

    全志V853處理器,是專(zhuān)為智慧視覺(jué)領(lǐng)域設(shè)計(jì)的AI處理器,配備了高效的NPU和豐富的外設(shè)接口,能夠提供穩(wěn)定的
    的頭像 發(fā)表于 09-14 09:23 ?764次閱讀
    基于全志V853<b class='flag-5'>處理器</b>的智能輔助駕駛算法介紹

    使用邊緣AI和Sitara處理器進(jìn)行關(guān)鍵字檢測(cè)

    電子發(fā)燒友網(wǎng)站提供《使用邊緣AI和Sitara處理器進(jìn)行關(guān)鍵字檢測(cè).pdf》資料免費(fèi)下載
    發(fā)表于 09-02 11:30 ?0次下載
    使用<b class='flag-5'>邊緣</b><b class='flag-5'>AI</b>和Sitara<b class='flag-5'>處理器</b>進(jìn)行關(guān)鍵字檢測(cè)

    AI核心板:Core-1688JD4

    采用SOPHON能八核AI處理器BM1688,INT8高達(dá)16TOPS,支持16路解碼+10路編碼+16路
    的頭像 發(fā)表于 05-15 08:02 ?1427次閱讀
    <b class='flag-5'>AI</b><b class='flag-5'>算</b><b class='flag-5'>力</b>核心板:Core-1688JD4

    AIGC掀需求革命,邊緣計(jì)算將不再“邊緣

    AI瓶頸下邊緣計(jì)算崛起
    的頭像 發(fā)表于 04-22 14:51 ?361次閱讀

    AMD推出銳龍8000嵌入式處理器AI高達(dá)39 T

    此款CPU選用4納米制程、AMD基于“Zen 4”架構(gòu)的CPU核心以及使用RDNA 3架構(gòu)GPU和XDNA架構(gòu)NPU,實(shí)現(xiàn)高達(dá)39TOPS的AI,其中NPU
    的頭像 發(fā)表于 04-03 10:39 ?906次閱讀

    256Tops!CSA1-N8S1684X服務(wù)

    (基于BM1684X的高服務(wù))高AI處理器
    的頭像 發(fā)表于 03-23 08:02 ?1670次閱讀
    256Tops<b class='flag-5'>算</b><b class='flag-5'>力</b>!CSA1-N8S1684X<b class='flag-5'>算</b><b class='flag-5'>力</b>服務(wù)<b class='flag-5'>器</b>

    瑞薩隆重推出RZ/V2H這一款嵌入式AI處理器

    日益增長(zhǎng)的AI應(yīng)用中,對(duì)AI處理器和能效提出了更高要求,用于滿(mǎn)足復(fù)雜的AI運(yùn)用。
    的頭像 發(fā)表于 03-06 13:53 ?1728次閱讀
    瑞薩隆重推出RZ/V2H這一款嵌入式<b class='flag-5'>AI</b>微<b class='flag-5'>處理器</b>

    能RADXA微服務(wù)試用體驗(yàn)】Radxa Fogwise 1684X Mini 規(guī)格

    通過(guò)網(wǎng)絡(luò)可以了解到,能RADXA微服務(wù)的具體規(guī)格: 處理器:BM1684X :高達(dá)32Tops INT8峰值
    發(fā)表于 02-28 11:21

    EASY-EAI攜手Hailo推出高性能、高邊緣AI硬件組合

    EASY-EAI與Hailo建立合作關(guān)系,共同推出高邊緣AI產(chǎn)品組合。
    的頭像 發(fā)表于 02-21 09:56 ?847次閱讀