0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

使用神經(jīng)處理單元集群轉(zhuǎn)換邊緣AI

星星科技指導(dǎo)員 ? 來源:嵌入式計(jì)算設(shè)計(jì) ? 作者:Saumitra Jagdale ? 2022-10-19 10:57 ? 次閱讀

隨著人工智能領(lǐng)域獲得牽引力,這些設(shè)備變得越來越計(jì)算和耗電。隨后,邊緣設(shè)備上的處理負(fù)載隨著系統(tǒng)架構(gòu)的性能和復(fù)雜性而顯著增加。因此,在系統(tǒng)中灌輸了更高分辨率的圖像和更復(fù)雜的算法,隨著對AI處理的需求不斷增長,以實(shí)現(xiàn)高TOPS性能,這需要進(jìn)一步優(yōu)化。

Synopsys 發(fā)布了神經(jīng)處理單元 (NPU)、知識產(chǎn)權(quán) (IP) 內(nèi)核和工具鏈,以滿足 AI 片上系統(tǒng) (SoC) 中日益復(fù)雜的神經(jīng)網(wǎng)絡(luò)模型的性能需求。其新的設(shè)計(jì)軟件 ARC NPX6 和 NPX6FS NPU IP 可處理實(shí)時(shí)計(jì)算的需求,同時(shí)為 AI 應(yīng)用消耗超低功耗。此外,該公司的新 MetaWare MX 開發(fā)工具提供了一個(gè)完整的編譯環(huán)境,具有自動(dòng)化神經(jīng)網(wǎng)絡(luò)算法分區(qū),可最大限度地提高最新 NPU 上應(yīng)用軟件開發(fā)的資源效率。

使用新的設(shè)計(jì)軟件 ARC NPX6 和 NPX6FS NPU IP 以及元軟件 MX 開發(fā)工具包,設(shè)計(jì)人員可以利用最新的神經(jīng)網(wǎng)絡(luò)模型,滿足不斷升級的性能期望,并加快其下一代智能 SoC 的上市時(shí)間。ARC NPX6 NPU IP 系列包括許多處理深度學(xué)習(xí)算法覆蓋的產(chǎn)品,包括對象識別、圖像質(zhì)量增強(qiáng)和場景分割等計(jì)算機(jī)視覺任務(wù),以及音頻和自然語言處理等大型 AI 應(yīng)用。設(shè)計(jì)中的單個(gè)內(nèi)核可以從 4K MAC 擴(kuò)展到 96K MAC,以實(shí)現(xiàn)超過 250 TOPS 和超過 440 TOPS 的單個(gè) AI 引擎性能,并且很少。

NPX6 NPU IP 包含對多達(dá) 8 個(gè) NPU 的多 NPU 群集的硬件和軟件支持,稀疏性為 3500 TOPS。由于硬件和軟件中的高級帶寬功能以及內(nèi)存層次結(jié)構(gòu)(每個(gè)內(nèi)核中包含L1內(nèi)存以及用于訪問常見L2內(nèi)存的高性能,低延遲連接),可以擴(kuò)展到大量MAC數(shù)量。對于受益于神經(jīng)網(wǎng)絡(luò)內(nèi)部 BF16 或 FP16 的應(yīng)用,提供了可選的張量浮點(diǎn)單元。

poYBAGNPZ7iAFPArAAGDfudyRsU033.png

MetaWare MX 開發(fā)工具包為應(yīng)用軟件開發(fā)提供了軟件編程環(huán)境,包括神經(jīng)網(wǎng)絡(luò)軟件開發(fā)工具包 (NN SDK) 和虛擬模型支持。NN SDK 會(huì)自動(dòng)將使用流行框架(如巨炬、張量流或 ONNX)訓(xùn)練的神經(jīng)網(wǎng)絡(luò)轉(zhuǎn)換為 NPX 優(yōu)化的可執(zhí)行代碼。

這個(gè)概念是,NPX6 NPU處理器IP隨后可用于制造各種產(chǎn)品,從幾個(gè)TOPS到數(shù)千個(gè)TOPS,所有這些都可以使用單個(gè)工具鏈編寫。

NPX6 網(wǎng)絡(luò)輸出電源的主要特性:

可擴(kuò)展的實(shí)時(shí) AI/神經(jīng)處理器 IP,具有多達(dá) 3,500 個(gè) TOPS 的性能,支持 CNN、RNN/LSTM、變壓器、推薦器網(wǎng)絡(luò)和其他神經(jīng)網(wǎng)絡(luò)。

功率效率(高達(dá) 30 TOPS/W)在業(yè)界無與倫比。

卷積加速器的 1-24 個(gè)內(nèi)核,增加了 4K MAC/內(nèi)核

張量加速器,支持張量運(yùn)算符集體系結(jié)構(gòu)并允許變量激活 (TOSA)

軟件開發(fā)套件

用于自動(dòng)混合模式量化的工具

降低帶寬的架構(gòu)和軟件工具特性

通過并行處理各個(gè)層來減少延遲。

設(shè)計(jì)軟件 ARC VPX 矢量 DSP 無縫集成。

生產(chǎn)力很高。張量流和巨炬框架,以及ONNX交換標(biāo)準(zhǔn),由元軟件MX開發(fā)工具包支持。

此外,ARC NPX6FS NPU IP 符合 ISO 26262 ASIL D 標(biāo)準(zhǔn),用于隨機(jī)硬件故障檢測和系統(tǒng)功能安全開發(fā)流程。這些處理器具有符合 ISO 26262 的特定安全機(jī)制,可處理下一代區(qū)域性設(shè)計(jì)的混合關(guān)鍵性和虛擬化需求,以及全面的安全文檔。

ARC 元軟件 MX 開發(fā)工具包包括神經(jīng)網(wǎng)絡(luò)軟件開發(fā)工具包 (SDK)、編譯器和調(diào)試器、虛擬平臺 SDK、運(yùn)行時(shí)和庫以及高級仿真模型。它提供了一個(gè)統(tǒng)一的工具鏈環(huán)境來加速應(yīng)用程序開發(fā),并在MAC資源之間智能地劃分算法以實(shí)現(xiàn)最佳處理。MetaWare MX 安全開發(fā)工具包包含安全手冊和安全指南,可幫助開發(fā)人員滿足 ISO 26262 標(biāo)準(zhǔn),并為安全關(guān)鍵型汽車應(yīng)用的 ISO 26262 合規(guī)性測試做準(zhǔn)備。

利用 NPU 集群加速邊緣 AI 應(yīng)用

為了滿足人工智能應(yīng)用不斷增長的性能和復(fù)雜需求,恩智浦NPU IP核提供高性能、可擴(kuò)展的實(shí)時(shí)人工智能和神經(jīng)處理IP,具有多達(dá)3500個(gè)TOPS,支持各種神經(jīng)網(wǎng)絡(luò),如CNN、RNN/LSTM、變壓器和推薦器網(wǎng)絡(luò)。

此外,它通過并行處理各個(gè)層來減少延遲。此外,高生產(chǎn)力的元軟件 MX 開發(fā)工具包支持張量流和巨魔框架以及 ONNX 交換格式。

審核編輯:郭婷

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報(bào)投訴
  • 處理器
    +關(guān)注

    關(guān)注

    68

    文章

    19329

    瀏覽量

    230132
  • 神經(jīng)網(wǎng)絡(luò)

    關(guān)注

    42

    文章

    4773

    瀏覽量

    100861
  • 人工智能
    +關(guān)注

    關(guān)注

    1792

    文章

    47372

    瀏覽量

    238858
收藏 人收藏

    評論

    相關(guān)推薦

    AI模型部署邊緣設(shè)備的奇妙之旅:如何實(shí)現(xiàn)手寫數(shù)字識別

    ,而不必傳輸?shù)酵獠糠?wù)器,這有助于更好地保護(hù)用戶隱私和數(shù)據(jù)安全。 然而,邊緣計(jì)算也帶來了獨(dú)特的挑戰(zhàn),特別是在資源受限的嵌入式系統(tǒng)中部署復(fù)雜的AI模型時(shí)。為了確保神經(jīng)網(wǎng)絡(luò)模型能夠在邊緣設(shè)
    發(fā)表于 12-06 17:20

    HZHY-AI100G:適配鴻蒙系統(tǒng)的AI邊緣計(jì)算智能盒

    Cortex-A55處理器,主頻高達(dá)2.0GHz,同時(shí)內(nèi)置1TOPS的NPU(神經(jīng)網(wǎng)絡(luò)處理單元),能夠在多個(gè)應(yīng)用場景中實(shí)現(xiàn)高效的數(shù)據(jù)處理。支
    的頭像 發(fā)表于 11-23 01:09 ?240次閱讀
    HZHY-<b class='flag-5'>AI</b>100G:適配鴻蒙系統(tǒng)的<b class='flag-5'>AI</b><b class='flag-5'>邊緣</b>計(jì)算智能盒

    使用 ADI 的 MAX78002 MCU 開發(fā)邊緣 AI 應(yīng)用

    的物聯(lián)網(wǎng)設(shè)備上運(yùn)行。 Analog Devices, Inc. 的微控制器單元 (MCU) 可以通過集成的低功耗卷積神經(jīng)網(wǎng)絡(luò) (CNN) 加速器來解決邊緣處理限制,以
    的頭像 發(fā)表于 10-17 11:39 ?1495次閱讀
    使用 ADI 的 MAX78002 MCU 開發(fā)<b class='flag-5'>邊緣</b> <b class='flag-5'>AI</b> 應(yīng)用

    使用邏輯和轉(zhuǎn)換優(yōu)化數(shù)字駕駛艙處理單元

    電子發(fā)燒友網(wǎng)站提供《使用邏輯和轉(zhuǎn)換優(yōu)化數(shù)字駕駛艙處理單元.pdf》資料免費(fèi)下載
    發(fā)表于 09-05 11:08 ?0次下載
    使用邏輯和<b class='flag-5'>轉(zhuǎn)換</b>優(yōu)化數(shù)字駕駛艙<b class='flag-5'>處理</b><b class='flag-5'>單元</b>

    基于FPGA的類腦計(jì)算平臺 —PYNQ 集群的無監(jiān)督圖像識別類腦計(jì)算系統(tǒng)

    模擬器,可為 SNN 算法開發(fā)者和神經(jīng)學(xué)家提供理想滿意的類腦仿真實(shí)驗(yàn)平臺。 (2)本設(shè)計(jì)提供的基于 NEST 仿真器的 FPGA 集群的硬件加速服務(wù)可以為實(shí)驗(yàn)環(huán)境不理 想,應(yīng)用計(jì)算復(fù)雜周期長的用戶帶來
    發(fā)表于 06-25 18:35

    邊緣AI網(wǎng)關(guān),將具備更強(qiáng)大的計(jì)算和學(xué)習(xí)能力

    電子發(fā)燒友網(wǎng)報(bào)道(文/李彎彎)網(wǎng)關(guān)又稱網(wǎng)間連接器、協(xié)議轉(zhuǎn)換器。網(wǎng)關(guān)在網(wǎng)絡(luò)層以上實(shí)現(xiàn)網(wǎng)絡(luò)互連,是復(fù)雜的網(wǎng)絡(luò)互連設(shè)備,僅用于兩個(gè)高層協(xié)議不同的網(wǎng)絡(luò)互連。 ? 邊緣AI網(wǎng)關(guān)是指在邊緣計(jì)算環(huán)境
    的頭像 發(fā)表于 06-06 00:26 ?3550次閱讀

    ai邊緣盒子有哪些用途?ai視頻分析邊緣計(jì)算盒子詳解

    近年來,隨著人工智能和邊緣計(jì)算的發(fā)展,一種名為AI邊緣盒子的新型設(shè)備正逐漸引起廣泛關(guān)注。作為一種集成了邊緣計(jì)算和AI算法
    的頭像 發(fā)表于 05-29 14:24 ?1003次閱讀
    <b class='flag-5'>ai</b><b class='flag-5'>邊緣</b>盒子有哪些用途?<b class='flag-5'>ai</b>視頻分析<b class='flag-5'>邊緣</b>計(jì)算盒子詳解

    邊緣計(jì)算單元多接入能力怎么算

    邊緣計(jì)算作為一種分布式計(jì)算模式,其多接入能力是評估其性能和擴(kuò)展性的重要指標(biāo)之一。在實(shí)際應(yīng)用中,我們需要考慮多個(gè)因素來計(jì)算邊緣計(jì)算單元的多接入能力。這包括帶寬和網(wǎng)絡(luò)延遲、處理能力、并發(fā)連
    的頭像 發(fā)表于 05-16 17:51 ?332次閱讀

    AI邊緣計(jì)算盒子優(yōu)勢有哪些?如何實(shí)現(xiàn)低延遲處理

    AI邊緣計(jì)算盒子作為一種集成人工智能技術(shù)的邊緣計(jì)算設(shè)備,其優(yōu)勢主要體現(xiàn)在以下幾個(gè)方面,萬物縱橫為您詳細(xì)介紹: 邊緣計(jì)算盒子 1. 低延遲處理
    的頭像 發(fā)表于 05-09 16:07 ?676次閱讀
    <b class='flag-5'>AI</b><b class='flag-5'>邊緣</b>計(jì)算盒子優(yōu)勢有哪些?如何實(shí)現(xiàn)低延遲<b class='flag-5'>處理</b>?

    面向邊緣AI應(yīng)用的全新RZ/V2H

    一款新的64位 MPU RZ/V2H ,為瑞薩電子的RZ/V系列帶來了針對邊緣AI的重大升級。邊緣AI是指在連接網(wǎng)絡(luò)的邊緣進(jìn)行的
    的頭像 發(fā)表于 05-07 14:56 ?7459次閱讀
    面向<b class='flag-5'>邊緣</b><b class='flag-5'>AI</b>應(yīng)用的全新RZ/V2H

    risc-v多核芯片在AI方面的應(yīng)用

    得RISC-V多核芯片能夠更好地適應(yīng)AI算法的不同需求,包括深度學(xué)習(xí)、神經(jīng)網(wǎng)絡(luò)等,從而提高芯片的性能和效率,降低成本,使AI邊緣計(jì)算晶片更具競爭力。 再者,RISC-V的多核設(shè)計(jì)可以進(jìn)
    發(fā)表于 04-28 09:20

    全新AMD銳龍8000F系列處理器整機(jī)正式發(fā)售 配備神經(jīng)處理單元(NPU)

    器,將由AMD渠道品牌整機(jī)合作伙伴提供整機(jī)進(jìn)行銷售。全新AMD銳龍8000F系列處理器為提高效率進(jìn)行了低功耗優(yōu)化,其中的AMD銳龍7 8700F配備了尖端的神經(jīng)處理單元(NPU),它提
    的頭像 發(fā)表于 04-18 11:05 ?863次閱讀
    全新AMD銳龍8000F系列<b class='flag-5'>處理</b>器整機(jī)正式發(fā)售 配備<b class='flag-5'>神經(jīng)</b><b class='flag-5'>處理</b><b class='flag-5'>單元</b>(NPU)

    恩智浦推出首次搭載專屬神經(jīng)處理單元(NPU)的MCX N系列!

    恩智浦半導(dǎo)體強(qiáng)勢推出新品MCX N系列產(chǎn)品,首次集成恩智浦專用神經(jīng)處理單元(NPU), 可助力實(shí)現(xiàn)高性能、低功耗的邊緣安全智能。
    的頭像 發(fā)表于 03-14 09:46 ?1200次閱讀

    NanoEdge AI的技術(shù)原理、應(yīng)用場景及優(yōu)勢

    NanoEdge AI 是一種基于邊緣計(jì)算的人工智能技術(shù),旨在將人工智能算法應(yīng)用于物聯(lián)網(wǎng)(IoT)設(shè)備和傳感器。這種技術(shù)的核心思想是將數(shù)據(jù)處理和分析從云端轉(zhuǎn)移到設(shè)備本身,從而減少數(shù)據(jù)傳輸延遲、降低
    發(fā)表于 03-12 08:09

    什么是AI邊緣計(jì)算,AI邊緣計(jì)算的特點(diǎn)和優(yōu)勢介紹

    隨著人工智能的迅猛發(fā)展,AI邊緣計(jì)算成為了熱門話題。那么什么是AI邊緣計(jì)算呢?簡單來說,它是將人工智能技術(shù)引入邊緣計(jì)算的新興領(lǐng)域,旨在將計(jì)算
    的頭像 發(fā)表于 02-01 11:42 ?911次閱讀