0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

Arm Ethos-U85:滿足物聯(lián)網(wǎng)面向AI時代的高性能需求

Arm社區(qū) ? 來源:Arm社區(qū) ? 2024-04-09 17:04 ? 次閱讀

隨著人工智能 (AI) 不斷對我們的日常生活產(chǎn)生越來越大的影響,其推理任務(wù)也逐漸從云端遷移到邊緣側(cè)和端側(cè)。邊緣側(cè)推理為板載設(shè)備引入智能化能力,使數(shù)據(jù)能夠在本地進行處理,并實時做出決策,同時提高了數(shù)據(jù)隱私性和安全性。

Arm Ethos NPU

Arm 多年來不斷開發(fā)邊緣 AI 加速器,以滿足邊緣側(cè)和端側(cè)不斷增長的推理工作負載需求。此前兩款成功的 NPU 產(chǎn)品 —— Arm Ethos-U55 和 Ethos-U65,為邊緣側(cè)和端側(cè) AI 應(yīng)用帶來了高性能、高能效的解決方案。

Ethos-U55 通常部署在基于 Cortex-M 的異構(gòu)系統(tǒng)中。而 Ethos-U65 則將 Ethos-U 系列的適用性擴展到基于 Cortex-A 的系統(tǒng)中,并為設(shè)備上的機器學(xué)習(xí) (ML) 能力帶來了兩倍的性能提升。這兩款產(chǎn)品均提供統(tǒng)一的工具鏈,可簡化開發(fā)并支持常見的 ML 神經(jīng)網(wǎng)絡(luò)運算,包括卷積神經(jīng)網(wǎng)絡(luò) (CNN) 和循環(huán)神經(jīng)網(wǎng)絡(luò) (RNN)。

Transformer 架構(gòu)的影響

于 2017 年問世的 Transformer 架構(gòu)徹底改變了生成式 AI,并成為許多新型神經(jīng)網(wǎng)絡(luò)的首選架構(gòu)?;?Transformer 架構(gòu)的模型可利用注意力機制處理序列數(shù)據(jù),并在機器翻譯、自然語言理解、語音識別、分割和圖像字幕生成等多項 AI 任務(wù)中實現(xiàn)優(yōu)異的效果。

這些模型可被調(diào)整和壓縮,在不過多影響準確度的情況下,能高效運行于邊緣設(shè)備上,并在許多邊緣側(cè)和端側(cè)用例中發(fā)揮領(lǐng)先的優(yōu)勢。

全新 Ethos-U85 NPU

依托 Ethos-U 系列 NPU 過往的成功經(jīng)驗,Arm 推出了全新產(chǎn)品 —— Ethos-U85。該處理器秉承此前 Ethos-U NPU 一貫的高性能、高能效設(shè)計理念,并可同時為邊緣側(cè)和端側(cè)設(shè)備上采用 Transformer 架構(gòu)的現(xiàn)有和未來的工作負載提供支持。

Ethos-U85 是 Arm Ethos-U 產(chǎn)品線中的第三代 NPU,也是迄今為止性能和能效最強的 Ethos NPU。與上一代產(chǎn)品相比,該 NPU 的性能提升了四倍,能效提高了 20%,并且可在主流網(wǎng)絡(luò)上實現(xiàn)高達 85% 的利用率。全新 Ethos-U85 可滿足諸如工廠自動化和商用或智能家居攝像頭等物聯(lián)網(wǎng)應(yīng)用不斷攀升的性能需求。此外,其專為搭配基于 Cortex-M 或 Cortex-A的系統(tǒng)一同運行而設(shè)計,并容忍高 DRAM 延遲。

Ethos-U85 的主要特性包括:

單周期支持從 128 到 2048 個 MAC 單元的配置 —— 在 1GHz 時,算力可支持從 256 GOPS 到 4 TOPS。

支持 int8 權(quán)重和 int8 或 int16 激活。

支持 Transformer 架構(gòu)網(wǎng)絡(luò),以及 CNN 和 RNN。

硬件原生支持 2/4 稀疏性,使吞吐量翻倍。

內(nèi)部 SRAM 為 29 至 267 KB,多達六個 128 位 AXI5 接口。

支持權(quán)重壓縮,采用標準和快速權(quán)重編碼器。

支持擴展壓縮。

除了 Ethos-U55 和 Ethos-U65 目前支持的算子,通過支持 TRANSPOSE、GATHER、MATMUL、RESIZE BILINEAR 和 ARGMAX 等運算,Ethos-U85 涵蓋了對 Transformer 模型和 DeeplabV3 語義分割網(wǎng)絡(luò)的原生硬件支持。

Ethos-U85 也支持元素級算子鏈化。通過鏈化將元素級運算與先前的運算相結(jié)合,使 SRAM 不必先寫入再讀取中間張量。由此可憑借 NPU 和內(nèi)存之間數(shù)據(jù)傳輸量的減少,提高 NPU 的效率。相比于 Ethos-U65,鏈化是 Ethos-U85 在效率提升上的新功能之一,其余還包括快速的權(quán)重編碼器、優(yōu)化的 MAC 陣列能效,以及提升的元素效率。

76e89a6c-f64e-11ee-a297-92fbcf53809c.png

圖:Ethos-U85 系統(tǒng)配置

Ethos-U85 可用于與 Ethos-U55 和 Ethos-U65 相同的系統(tǒng)配置流程,并且我們支持從基于 Cortex-A 的系統(tǒng)直接驅(qū)動 Ethos-U85 的功能。

Ethos-U85 支持與上一代 Ethos-U 系列產(chǎn)品相同的軟件工具鏈, 即使用 TFLmicro 運行時。此外,在這個基礎(chǔ)上,Ethos-U85 同時還能為更廣泛采用 Transformer 架構(gòu)的用例提供支持,這對于已經(jīng)投入在基于 Cortex-A/Cortex-M 與 Ethos-U55/Ethos-U65 的系統(tǒng)廠商來說,將能擴大其過往的投資價值。未來,我們預(yù)計將支持面向邊緣設(shè)備的 PyTorch 運行時 ExecuTorch。

Ethos-U85 支持的算子將在 NPU 上進行加速,對于特殊算子不支持的情況,其中部分算子將調(diào)用 CMSIS-NN 庫實現(xiàn)在 Cortex-M系統(tǒng)上進行加速。例如,在 tinyLlama 的用例中,該模型算子可完全映射到 Ethos-U85,沒有算子回退到 CPU。

Ethos-U85 擔任了 Arm 全新物聯(lián)網(wǎng)參考設(shè)計平臺 Corstone-320 的核心角色,該參考設(shè)計平臺加快了各類 AIoT 解決方案中高性能 SoC 的開發(fā)和部署。

釋放邊緣 AI 的無限潛力

Ethos-U85 將提供在邊緣側(cè)和端側(cè)設(shè)備上執(zhí)行領(lǐng)先 AI 功能所需的算力。隨著 AI 時代的不斷發(fā)展,我們的合作伙伴將獲得基于 Arm Ethos-U 的可靠、高效兼具高性能的解決方案。我們預(yù)計在新興的邊緣 AI 用例、智能家居、零售或工業(yè)場景中看到 Ethos-U85 被廣泛部署,這些用例和場景需要更高的計算性能,并支持新型的 AI 框架。

Arm 引以為傲的是,我們不斷通過前沿的軟硬件解決方案,為合作伙伴與生態(tài)系統(tǒng)提供強而有力的支持。全新 Ethos-U85 的推出將釋放邊緣側(cè)和端側(cè) AI 推理用例的無限潛能,從而改變世界。Arm 正在引領(lǐng)邊緣 AI 的創(chuàng)新提升至全新水平,并持續(xù)夯實 Arm 成為未來邊緣 AI 的基石。



審核編輯:劉清

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • sram
    +關(guān)注

    關(guān)注

    6

    文章

    767

    瀏覽量

    114689
  • 物聯(lián)網(wǎng)
    +關(guān)注

    關(guān)注

    2909

    文章

    44634

    瀏覽量

    373316
  • 人工智能
    +關(guān)注

    關(guān)注

    1791

    文章

    47274

    瀏覽量

    238467
  • Cortex-M
    +關(guān)注

    關(guān)注

    2

    文章

    229

    瀏覽量

    29761
  • AI加速器
    +關(guān)注

    關(guān)注

    1

    文章

    69

    瀏覽量

    8635

原文標題:Arm Ethos-U85:滿足物聯(lián)網(wǎng)面向 AI 時代的高性能需求

文章出處:【微信號:Arm社區(qū),微信公眾號:Arm社區(qū)】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏

    評論

    相關(guān)推薦

    AI高性能計算平臺是什么

    AI高性能計算平臺不僅是AI技術(shù)發(fā)展的基石,更是推動AI應(yīng)用落地、加速產(chǎn)業(yè)升級的重要工具。以下,是對AI
    的頭像 發(fā)表于 11-11 09:56 ?192次閱讀

    高通推出面向AI時代的全新工業(yè)聯(lián)網(wǎng)產(chǎn)品組合

    AI解決方案,從而在AI時代占據(jù)領(lǐng)先地位。作為解決工業(yè)需求的關(guān)鍵舉措,全新工規(guī)級處理器產(chǎn)品組合高通IQ系列面向最具挑戰(zhàn)性的安全級工作環(huán)境而設(shè)
    的頭像 發(fā)表于 11-08 10:22 ?252次閱讀

    ARM開發(fā)板在聯(lián)網(wǎng)中的應(yīng)用

    于需要長時間運行且能源有限的聯(lián)網(wǎng)設(shè)備來說至關(guān)重要。低功耗意味著更長的電池壽命和更低的運營成本。 2. 高性能 ARM處理器提供了高性能的處
    的頭像 發(fā)表于 11-05 11:38 ?485次閱讀

    大模型時代的算力需求

    現(xiàn)在AI已進入大模型時代,各企業(yè)都爭相部署大模型,但如何保證大模型的算力,以及相關(guān)的穩(wěn)定性和性能,是一個極為重要的問題,帶著這個極為重要的問題,我需要在此書中找到答案。
    發(fā)表于 08-20 09:04

    芯品# 聯(lián)網(wǎng)市場性能最高的 NPU

    提高數(shù)據(jù)隱私和安全性。 ArmEthos NPU 如何增強邊緣和端點的 AI 性能? 多年來,Arm 一直在開發(fā)邊緣
    的頭像 發(fā)表于 06-26 17:28 ?7831次閱讀
    芯品# <b class='flag-5'>物</b><b class='flag-5'>聯(lián)網(wǎng)</b>市場<b class='flag-5'>性能</b>最高的 NPU

    羅徹斯特電子攜手u-blox為全球客戶提供領(lǐng)先的聯(lián)網(wǎng)解決方案

    在當今數(shù)字化快速發(fā)展的時代聯(lián)網(wǎng)(IoT)已成為推動工業(yè)、汽車和消費行業(yè)變革的重要力量。羅徹斯特電子與u-blox的強強聯(lián)手,正是為了滿足
    的頭像 發(fā)表于 06-26 10:15 ?577次閱讀

    廣和通發(fā)布高性能端側(cè)AI解決方案,賦能聯(lián)網(wǎng)生態(tài)系統(tǒng)

    展現(xiàn)了廣和通在聯(lián)網(wǎng)領(lǐng)域的深厚積累,更標志著公司在拓展聯(lián)網(wǎng)生態(tài)系統(tǒng)和滿足端側(cè)AI應(yīng)用
    的頭像 發(fā)表于 06-07 16:15 ?639次閱讀

    FRAM SF25C20晶圓合封MCU,滿足小尺寸和高性能需求

    FRAM SF25C20晶圓合封MCU,滿足小尺寸和高性能需求
    的頭像 發(fā)表于 04-22 09:49 ?624次閱讀
    FRAM SF25C20晶圓合封MCU,<b class='flag-5'>滿足</b>小尺寸和<b class='flag-5'>高性能需求</b>

    Arm發(fā)布新一代Ethos-U AI加速器 Arm旨在瞄準國產(chǎn)CPU市場

    Arm發(fā)布的新一代Ethos-U AI加速器確實在業(yè)界引起了廣泛關(guān)注。
    的頭像 發(fā)表于 04-18 15:59 ?761次閱讀

    Arm推第三代邊緣AI加速器:Arm Ethos-U85

    除了Ethos-U85之外,Arm還推出了全新的聯(lián)網(wǎng)參考設(shè)計平臺Corstone-320。該平臺將Arm
    發(fā)表于 04-16 11:09 ?677次閱讀
    <b class='flag-5'>Arm</b>推第三代邊緣<b class='flag-5'>AI</b>加速器:<b class='flag-5'>Arm</b> <b class='flag-5'>Ethos-U85</b>

    Arm推動生成式AI落地邊緣!全新Ethos-U85 AI加速器支持Transformer 架構(gòu),性能提升四倍

    等領(lǐng)先企業(yè)均已推出搭載 Ethos-U 的量產(chǎn)芯片。最近,Arm發(fā)布Arm Ethos-U85 AI加速器,這款加速器在
    的頭像 發(fā)表于 04-16 09:10 ?4615次閱讀
    <b class='flag-5'>Arm</b>推動生成式<b class='flag-5'>AI</b>落地邊緣!全新<b class='flag-5'>Ethos-U85</b> <b class='flag-5'>AI</b>加速器支持Transformer 架構(gòu),<b class='flag-5'>性能</b>提升四倍

    Arm發(fā)布第三代NPU,適用于工業(yè)自動化等場景,性能提升四倍

    Ethos-U85 在能源效率上相比前作提高了 20%,且可兼容常用神經(jīng)網(wǎng)絡(luò)以達 85% 的利用率。其設(shè)計適配基于 Arm Cortex-M / A 處理器內(nèi)核的系統(tǒng),對內(nèi)存延遲有較強適應(yīng)性。
    的頭像 發(fā)表于 04-12 16:13 ?973次閱讀

    Arm推出新一代Ethos-U AI加速器及全新聯(lián)網(wǎng)參考設(shè)計平臺

    Arm 控股有限公司(納斯達克股票代碼:ARM,以下簡稱“Arm”)今日宣布推出 Arm Ethos-U85 神經(jīng)網(wǎng)絡(luò)處理器 (NPU),是
    的頭像 發(fā)表于 04-09 17:02 ?881次閱讀
    <b class='flag-5'>Arm</b>推出新一代<b class='flag-5'>Ethos-U</b> <b class='flag-5'>AI</b>加速器及全新<b class='flag-5'>物</b><b class='flag-5'>聯(lián)網(wǎng)</b>參考設(shè)計平臺

    面向聯(lián)網(wǎng)(IOT)、工業(yè)、通信等應(yīng)用的模擬及數(shù)?;旌闲酒O(shè)計

    本命題方向為面向聯(lián)網(wǎng)(IOT)、工業(yè)、通信等應(yīng)用的模擬及數(shù)?;旌闲酒O(shè)計,特別聚焦于應(yīng)用廣泛的高性能數(shù)據(jù)轉(zhuǎn)換器(ADC/DAC)芯片設(shè)計。
    的頭像 發(fā)表于 03-27 14:00 ?737次閱讀
    <b class='flag-5'>面向</b><b class='flag-5'>物</b><b class='flag-5'>聯(lián)網(wǎng)</b>(IOT)、工業(yè)、通信等應(yīng)用的模擬及數(shù)模混合芯片設(shè)計

    Hitek Systems開發(fā)基于PCIe的高性能加速器以滿足行業(yè)需求

    Hitek Systems 使用開放式 FPGA 堆棧 (OFS) 和 Agilex 7 FPGA,以開發(fā)基于最新 PCIe 的高性能加速器 (HiPrAcc),旨在滿足網(wǎng)絡(luò)、計算和高容量存儲應(yīng)用的需求
    的頭像 發(fā)表于 03-22 14:02 ?639次閱讀
    Hitek Systems開發(fā)基于PCIe的<b class='flag-5'>高性能</b>加速器以<b class='flag-5'>滿足</b>行業(yè)<b class='flag-5'>需求</b>