0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

Arm Ethos-U85:滿足物聯(lián)網(wǎng)面向AI時代的高性能需求

Arm社區(qū) ? 來源:Arm社區(qū) ? 2024-04-09 17:04 ? 次閱讀

隨著人工智能 (AI) 不斷對我們的日常生活產(chǎn)生越來越大的影響,其推理任務(wù)也逐漸從云端遷移到邊緣側(cè)和端側(cè)。邊緣側(cè)推理為板載設(shè)備引入智能化能力,使數(shù)據(jù)能夠在本地進行處理,并實時做出決策,同時提高了數(shù)據(jù)隱私性和安全性。

Arm Ethos NPU

Arm 多年來不斷開發(fā)邊緣 AI 加速器,以滿足邊緣側(cè)和端側(cè)不斷增長的推理工作負載需求。此前兩款成功的 NPU 產(chǎn)品 —— Arm Ethos-U55 和 Ethos-U65,為邊緣側(cè)和端側(cè) AI 應(yīng)用帶來了高性能、高能效的解決方案。

Ethos-U55 通常部署在基于 Cortex-M 的異構(gòu)系統(tǒng)中。而 Ethos-U65 則將 Ethos-U 系列的適用性擴展到基于 Cortex-A 的系統(tǒng)中,并為設(shè)備上的機器學(xué)習(xí) (ML) 能力帶來了兩倍的性能提升。這兩款產(chǎn)品均提供統(tǒng)一的工具鏈,可簡化開發(fā)并支持常見的 ML 神經(jīng)網(wǎng)絡(luò)運算,包括卷積神經(jīng)網(wǎng)絡(luò) (CNN) 和循環(huán)神經(jīng)網(wǎng)絡(luò) (RNN)。

Transformer 架構(gòu)的影響

于 2017 年問世的 Transformer 架構(gòu)徹底改變了生成式 AI,并成為許多新型神經(jīng)網(wǎng)絡(luò)的首選架構(gòu)?;?Transformer 架構(gòu)的模型可利用注意力機制處理序列數(shù)據(jù),并在機器翻譯、自然語言理解、語音識別、分割和圖像字幕生成等多項 AI 任務(wù)中實現(xiàn)優(yōu)異的效果。

這些模型可被調(diào)整和壓縮,在不過多影響準確度的情況下,能高效運行于邊緣設(shè)備上,并在許多邊緣側(cè)和端側(cè)用例中發(fā)揮領(lǐng)先的優(yōu)勢。

全新 Ethos-U85 NPU

依托 Ethos-U 系列 NPU 過往的成功經(jīng)驗,Arm 推出了全新產(chǎn)品 —— Ethos-U85。該處理器秉承此前 Ethos-U NPU 一貫的高性能、高能效設(shè)計理念,并可同時為邊緣側(cè)和端側(cè)設(shè)備上采用 Transformer 架構(gòu)的現(xiàn)有和未來的工作負載提供支持。

Ethos-U85 是 Arm Ethos-U 產(chǎn)品線中的第三代 NPU,也是迄今為止性能和能效最強的 Ethos NPU。與上一代產(chǎn)品相比,該 NPU 的性能提升了四倍,能效提高了 20%,并且可在主流網(wǎng)絡(luò)上實現(xiàn)高達 85% 的利用率。全新 Ethos-U85 可滿足諸如工廠自動化和商用或智能家居攝像頭等物聯(lián)網(wǎng)應(yīng)用不斷攀升的性能需求。此外,其專為搭配基于 Cortex-M 或 Cortex-A的系統(tǒng)一同運行而設(shè)計,并容忍高 DRAM 延遲。

Ethos-U85 的主要特性包括:

單周期支持從 128 到 2048 個 MAC 單元的配置 —— 在 1GHz 時,算力可支持從 256 GOPS 到 4 TOPS。

支持 int8 權(quán)重和 int8 或 int16 激活。

支持 Transformer 架構(gòu)網(wǎng)絡(luò),以及 CNN 和 RNN。

硬件原生支持 2/4 稀疏性,使吞吐量翻倍。

內(nèi)部 SRAM 為 29 至 267 KB,多達六個 128 位 AXI5 接口。

支持權(quán)重壓縮,采用標準和快速權(quán)重編碼器。

支持擴展壓縮。

除了 Ethos-U55 和 Ethos-U65 目前支持的算子,通過支持 TRANSPOSE、GATHER、MATMUL、RESIZE BILINEAR 和 ARGMAX 等運算,Ethos-U85 涵蓋了對 Transformer 模型和 DeeplabV3 語義分割網(wǎng)絡(luò)的原生硬件支持。

Ethos-U85 也支持元素級算子鏈化。通過鏈化將元素級運算與先前的運算相結(jié)合,使 SRAM 不必先寫入再讀取中間張量。由此可憑借 NPU 和內(nèi)存之間數(shù)據(jù)傳輸量的減少,提高 NPU 的效率。相比于 Ethos-U65,鏈化是 Ethos-U85 在效率提升上的新功能之一,其余還包括快速的權(quán)重編碼器、優(yōu)化的 MAC 陣列能效,以及提升的元素效率。

76e89a6c-f64e-11ee-a297-92fbcf53809c.png

圖:Ethos-U85 系統(tǒng)配置

Ethos-U85 可用于與 Ethos-U55 和 Ethos-U65 相同的系統(tǒng)配置流程,并且我們支持從基于 Cortex-A 的系統(tǒng)直接驅(qū)動 Ethos-U85 的功能。

Ethos-U85 支持與上一代 Ethos-U 系列產(chǎn)品相同的軟件工具鏈, 即使用 TFLmicro 運行時。此外,在這個基礎(chǔ)上,Ethos-U85 同時還能為更廣泛采用 Transformer 架構(gòu)的用例提供支持,這對于已經(jīng)投入在基于 Cortex-A/Cortex-M 與 Ethos-U55/Ethos-U65 的系統(tǒng)廠商來說,將能擴大其過往的投資價值。未來,我們預(yù)計將支持面向邊緣設(shè)備的 PyTorch 運行時 ExecuTorch。

Ethos-U85 支持的算子將在 NPU 上進行加速,對于特殊算子不支持的情況,其中部分算子將調(diào)用 CMSIS-NN 庫實現(xiàn)在 Cortex-M系統(tǒng)上進行加速。例如,在 tinyLlama 的用例中,該模型算子可完全映射到 Ethos-U85,沒有算子回退到 CPU

Ethos-U85 擔任了 Arm 全新物聯(lián)網(wǎng)參考設(shè)計平臺 Corstone-320 的核心角色,該參考設(shè)計平臺加快了各類 AIoT 解決方案中高性能 SoC 的開發(fā)和部署。

釋放邊緣 AI 的無限潛力

Ethos-U85 將提供在邊緣側(cè)和端側(cè)設(shè)備上執(zhí)行領(lǐng)先 AI 功能所需的算力。隨著 AI 時代的不斷發(fā)展,我們的合作伙伴將獲得基于 Arm Ethos-U 的可靠、高效兼具高性能的解決方案。我們預(yù)計在新興的邊緣 AI 用例、智能家居、零售或工業(yè)場景中看到 Ethos-U85 被廣泛部署,這些用例和場景需要更高的計算性能,并支持新型的 AI 框架。

Arm 引以為傲的是,我們不斷通過前沿的軟硬件解決方案,為合作伙伴與生態(tài)系統(tǒng)提供強而有力的支持。全新 Ethos-U85 的推出將釋放邊緣側(cè)和端側(cè) AI 推理用例的無限潛能,從而改變世界。Arm 正在引領(lǐng)邊緣 AI 的創(chuàng)新提升至全新水平,并持續(xù)夯實 Arm 成為未來邊緣 AI 的基石。



審核編輯:劉清

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • sram
    +關(guān)注

    關(guān)注

    6

    文章

    779

    瀏覽量

    115508
  • 物聯(lián)網(wǎng)
    +關(guān)注

    關(guān)注

    2921

    文章

    45663

    瀏覽量

    384898
  • 人工智能
    +關(guān)注

    關(guān)注

    1804

    文章

    48418

    瀏覽量

    244689
  • Cortex-M
    +關(guān)注

    關(guān)注

    2

    文章

    229

    瀏覽量

    30142
  • AI加速器
    +關(guān)注

    關(guān)注

    1

    文章

    69

    瀏覽量

    8915

原文標題:Arm Ethos-U85:滿足物聯(lián)網(wǎng)面向 AI 時代的高性能需求

文章出處:【微信號:Arm社區(qū),微信公眾號:Arm社區(qū)】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 0人收藏

    評論

    相關(guān)推薦

    Synaptics發(fā)布高性能AI MCU,推動邊緣計算新突破

    新突思科技發(fā)布SR系列高性能自適應(yīng)微控制器(MCU),基于Astra?原生AI平臺,專為邊緣AI情境感知設(shè)計。該系列支持三種功耗模式(性能、超低功耗、持續(xù)運行),搭載
    的頭像 發(fā)表于 04-23 10:00 ?211次閱讀
    Synaptics發(fā)布<b class='flag-5'>高性能</b><b class='flag-5'>AI</b> MCU,推動邊緣計算新突破

    ESP32-C3FH4:高性能聯(lián)網(wǎng)芯片的卓越之選,智能門鎖安防等應(yīng)用

    防護,滿足聯(lián)網(wǎng)設(shè)備安全需求 低功耗設(shè)計:多種省電模式延長電池設(shè)備使用壽命 ESP32-C3FH4以其出色的性能參數(shù)和廣泛的應(yīng)用適應(yīng)性,
    發(fā)表于 04-03 11:41

    Nordic nRF54 系列芯片:開啟 AI聯(lián)網(wǎng)時代?

    ,在保證性能的同時實現(xiàn)了成本的有效控制。? Nordic nRF54 系列芯片憑借其在 AI 機器學(xué)習(xí)和聯(lián)網(wǎng)領(lǐng)域的卓越表現(xiàn),正引領(lǐng)著行業(yè)的發(fā)展潮流。無論是追求
    發(fā)表于 04-01 00:18

    適用于數(shù)據(jù)中心和AI時代的800G網(wǎng)絡(luò)

    選擇無擁塞路徑,提高數(shù)據(jù)傳輸效率。 多租戶性能隔離:確保不同用戶任務(wù)之間帶寬分配合理。 飛速(FS)800G光模塊在AI數(shù)據(jù)中心中的作用 為滿足AI和大規(guī)模數(shù)據(jù)中心的帶寬
    發(fā)表于 03-25 17:35

    Banana Pi 發(fā)布 BPI-AI2N &amp; BPI-AI2N Carrier,助力 AI 計算與嵌入式開發(fā)

    RZ/V2N——近期在嵌入式世界2025上新發(fā)布,為 AI 計算、嵌入式系統(tǒng)及工自動化提供強大支持。這款全新的計算平臺旨在滿足開發(fā)者和企業(yè)用戶對高性能、低功耗和靈活擴展的需求。 [](
    發(fā)表于 03-19 17:54

    MediaTek發(fā)布全新高性能邊緣AI聯(lián)網(wǎng)芯片

    在國際嵌入式展(EMBEDDED WORLD)上, MediaTek 發(fā)布高性能邊緣 AI 聯(lián)網(wǎng)芯片 Genio 720 和 Genio 520。作為 Genio 智能
    的頭像 發(fā)表于 03-12 16:21 ?373次閱讀

    Arm 推出 Armv9 邊緣 AI 計算平臺,以超高能效與先進 AI 能力賦能聯(lián)網(wǎng)革新

    架構(gòu)的超高能效 CPU——Arm Cortex-A320 以及對 Transformer 網(wǎng)絡(luò)具有原生支持的 Ethos-U85 AI 加速器為核心的邊緣AI 計算平臺,可支持運行超
    的頭像 發(fā)表于 03-06 11:43 ?1087次閱讀
    <b class='flag-5'>Arm</b> 推出 Armv9 邊緣 <b class='flag-5'>AI</b> 計算平臺,以超高能效與先進 <b class='flag-5'>AI</b> 能力賦能<b class='flag-5'>物</b><b class='flag-5'>聯(lián)網(wǎng)</b>革新

    FPGA+AI王炸組合如何重塑未來世界:看看DeepSeek東方神秘力量如何預(yù)測......

    的應(yīng)用不斷增加,尤其是在需要低延遲和實時數(shù)據(jù)處理的場景中,如自動駕駛、工業(yè)自動化和聯(lián)網(wǎng)設(shè)備。其可編程性和靈活性使其能夠適應(yīng)多樣化的邊緣計算需求。? 數(shù)據(jù)中心與高性能計算:在數(shù)據(jù)中心中
    發(fā)表于 03-03 11:21

    Arm推出全球首個Armv9邊緣AI計算平臺

    全球首個 Armv9 邊緣 AI 計算平臺以 Cortex-A320 CPU 和 Ethos-U85 NPU 為核心,專為聯(lián)網(wǎng)應(yīng)用優(yōu)化,支持運行超 10 億參數(shù)的端側(cè)
    的頭像 發(fā)表于 02-27 17:08 ?511次閱讀

    如何在Arm Ethos-U85上使用ExecuTorch

    在快速發(fā)展的機器學(xué)習(xí)領(lǐng)域,PyTorch 憑借其靈活性和全面的生態(tài)系統(tǒng),已成為模型開發(fā)的熱門框架。Arm 與 Meta 合作在 ExecuTorch 中引入了對 Arm 平臺的支持,進一步簡化了模型算法開發(fā)過程,實現(xiàn)無縫在邊緣側(cè)設(shè)備上部署 PyTorch 模型。
    的頭像 發(fā)表于 02-14 14:23 ?416次閱讀
    如何在<b class='flag-5'>Arm</b> <b class='flag-5'>Ethos-U85</b>上使用ExecuTorch

    基于Arm Ethos-U85 NPU部署小語言模型

    隨著人工智能 (AI) 的演進,人們對使用小語言模型 (SLM) 在嵌入式設(shè)備上執(zhí)行 AI 工作負載的興趣愈發(fā)高漲。
    的頭像 發(fā)表于 01-20 09:53 ?369次閱讀

    國產(chǎn)固態(tài)繼電器如何滿足聯(lián)網(wǎng)應(yīng)用的需求

    聯(lián)網(wǎng)(IoT)的快速發(fā)展徹底改變了從智能家居到工業(yè)自動化等各個行業(yè)。由于聯(lián)網(wǎng)系統(tǒng)需要高效、可靠且緊湊的組件來處理眾多傳感器、執(zhí)行器和通信設(shè)備,國產(chǎn)固態(tài)繼電器(SSR)已成為
    的頭像 發(fā)表于 01-03 15:57 ?445次閱讀

    高通推出面向AI時代的全新工業(yè)聯(lián)網(wǎng)產(chǎn)品組合

    AI解決方案,從而在AI時代占據(jù)領(lǐng)先地位。作為解決工業(yè)需求的關(guān)鍵舉措,全新工規(guī)級處理器產(chǎn)品組合高通IQ系列面向最具挑戰(zhàn)性的安全級工作環(huán)境而設(shè)
    的頭像 發(fā)表于 11-08 10:22 ?528次閱讀

    ARM開發(fā)板在聯(lián)網(wǎng)中的應(yīng)用

    于需要長時間運行且能源有限的聯(lián)網(wǎng)設(shè)備來說至關(guān)重要。低功耗意味著更長的電池壽命和更低的運營成本。 2. 高性能 ARM處理器提供了高性能的處
    的頭像 發(fā)表于 11-05 11:38 ?942次閱讀

    芯品# 聯(lián)網(wǎng)市場性能最高的 NPU

    提高數(shù)據(jù)隱私和安全性。 ArmEthos NPU 如何增強邊緣和端點的 AI 性能? 多年來,Arm 一直在開發(fā)邊緣
    的頭像 發(fā)表于 06-26 17:28 ?8128次閱讀
    芯品# <b class='flag-5'>物</b><b class='flag-5'>聯(lián)網(wǎng)</b>市場<b class='flag-5'>性能</b>最高的 NPU

    電子發(fā)燒友

    中國電子工程師最喜歡的網(wǎng)站

    • 2931785位工程師會員交流學(xué)習(xí)
    • 獲取您個性化的科技前沿技術(shù)信息
    • 參加活動獲取豐厚的禮品