0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

Arm與ExecuTorch合作加速端側(cè)生成式AI實(shí)現(xiàn)

Arm社區(qū) ? 來(lái)源:Arm社區(qū) ? 2024-11-15 11:30 ? 次閱讀

作者:Arm 戰(zhàn)略與生態(tài)部人工智能開(kāi)發(fā)者平臺(tái)與服務(wù)高級(jí)副總裁 Alex Spinelli

通過(guò) Arm 計(jì)算平臺(tái)與 ExecuTorch 框架的結(jié)合,使得更小、更優(yōu)化的模型能夠在邊緣側(cè)運(yùn)行,加速邊緣側(cè)生成式 AI 的實(shí)現(xiàn)。

新的 Llama 量化模型適用于基于 Arm 平臺(tái)的端側(cè)和邊緣側(cè) AI 應(yīng)用,可減少內(nèi)存占用,提高精度、性能和可移植性。

全球 2,000 萬(wàn)名 Arm 開(kāi)發(fā)者能夠更迅速地在數(shù)十億臺(tái)邊緣側(cè)設(shè)備上大規(guī)模開(kāi)發(fā)和部署更多的智能 AI 應(yīng)用。

Arm 正在與 Meta 公司的 PyTorch 團(tuán)隊(duì)攜手合作,共同推進(jìn)新的 ExecuTorch 測(cè)試版 (Beta) 上線,旨在為全球數(shù)十億邊緣側(cè)設(shè)備和數(shù)百萬(wàn)開(kāi)發(fā)者提供人工智能 (AI) 和機(jī)器學(xué)習(xí) (ML) 功能,進(jìn)而確保 AI 真正的潛力能被最廣泛的設(shè)備和開(kāi)發(fā)者所使用。

借助 ExecuTorch 和新的 Llama 量化模型,Arm 計(jì)算平臺(tái)優(yōu)化生成式 AI 性能

Arm 計(jì)算平臺(tái)無(wú)處不在,為全球眾多邊緣側(cè)設(shè)備提供支持,而 ExecuTorch 則是專為移動(dòng)和邊緣側(cè)設(shè)備部署 AI 模型而設(shè)計(jì)的 PyTorch 原生部署框架。兩者的緊密合作,使開(kāi)發(fā)者能夠賦能更小、更優(yōu)化的模型,包括新的 Llama 3.2 1B 和 3B 量化模型。這些新模型可以減少內(nèi)存占用、提高準(zhǔn)確性、增強(qiáng)性能和提供可移植性,成為小型設(shè)備上的生成式 AI 應(yīng)用的理想選擇,如虛擬聊天機(jī)器人、文本摘要和 AI 助手。

開(kāi)發(fā)者無(wú)需額外的修改或優(yōu)化,便可將新的量化模型無(wú)縫集成到應(yīng)用中,從而節(jié)省時(shí)間和資源。如此一來(lái),他們能夠迅速在廣泛的 Arm 設(shè)備上大規(guī)模開(kāi)發(fā)和部署更多的智能 AI 應(yīng)用。

隨著 Llama 3.2 大語(yǔ)言模型 (LLM) 新版本的發(fā)布,Arm 正在通過(guò) ExecuTorch 框架優(yōu)化 AI 性能,使得在 Arm 計(jì)算平臺(tái)邊緣設(shè)備運(yùn)行的真實(shí)生成式 AI 工作負(fù)載能更為快速。在 ExecuTorch 測(cè)試版發(fā)布的首日起,開(kāi)發(fā)者便能享有這些性能的提升。

集成 KleidiAI,加速端側(cè)生成式 AI 的實(shí)現(xiàn)

在移動(dòng)領(lǐng)域,Arm 與 ExecuTorch 的合作意味著眾多生成式 AI 應(yīng)用,如虛擬聊天機(jī)器人、文本生成和摘要、實(shí)時(shí)語(yǔ)音和虛擬助手等,完全能夠在搭載 Arm CPU 的設(shè)備上以更高的性能運(yùn)行。這一成果得益于 KleidiAI,它引入了針對(duì) 4 位量化優(yōu)化的微內(nèi)核,并通過(guò) XNNPACK 集成到了 ExecuTorch 中,因此,在 Arm 計(jì)算平臺(tái)上運(yùn)行 4 位量化的 LLM 時(shí),無(wú)縫加速 AI 工作負(fù)載的執(zhí)行。例如,通過(guò) KleidiAI 的集成,Llama 3.2 1B 量化模型預(yù)填充階段的執(zhí)行速度可以提高 20%,使得一些基于 Arm 架構(gòu)的移動(dòng)設(shè)備上的文本生成速度超過(guò)了每秒 400 個(gè)詞元 (token)。這意味著,終端用戶將從他們移動(dòng)設(shè)備上獲得更快速、響應(yīng)更靈敏的 AI 體驗(yàn)。

物聯(lián)網(wǎng)的邊緣側(cè) AI 應(yīng)用加速實(shí)時(shí)處理能力

在物聯(lián)網(wǎng)領(lǐng)域,ExecuTorch 將提高邊緣側(cè) AI 應(yīng)用的實(shí)時(shí)處理能力,包括智能家電、可穿戴設(shè)備以及自動(dòng)零售系統(tǒng)等。這意味著物聯(lián)網(wǎng)設(shè)備和應(yīng)用能夠以毫秒級(jí)的速度響應(yīng)環(huán)境變化,這對(duì)保障安全性和功能可用性至關(guān)重要。

ExecuTorch 可在 Arm Cortex-A CPU 和 Ethos-U NPU 上運(yùn)行,以加速邊緣側(cè) AI 應(yīng)用的開(kāi)發(fā)和部署。事實(shí)上,通過(guò)將 ExecuTorch 與 Arm Corstone-320 參考平臺(tái)(也可作為仿真固定虛擬平臺(tái) (FVP) 使用)、Arm Ethos-U85 NPU 驅(qū)動(dòng)程序和編譯器支持集成到一個(gè)軟件包中,開(kāi)發(fā)者可在平臺(tái)上市前幾個(gè)月就著手開(kāi)發(fā)邊緣側(cè) AI 應(yīng)用。

更易獲取、更快捷的邊緣側(cè) AI 開(kāi)發(fā)體驗(yàn)

ExecuTorch 有潛力成為全球最受歡迎的高效 AI 和 ML 開(kāi)發(fā)框架之一。通過(guò)將應(yīng)用最廣泛的 Arm 計(jì)算平臺(tái)與 ExecuTorch 相結(jié)合,Arm 正在通過(guò)新的量化模型加速 AI 的普及,讓開(kāi)發(fā)者能夠更快地在更多設(shè)備上部署應(yīng)用,并將更多生成式 AI 體驗(yàn)引入邊緣側(cè)。

聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • ARM
    ARM
    +關(guān)注

    關(guān)注

    134

    文章

    9097

    瀏覽量

    367555
  • AI
    AI
    +關(guān)注

    關(guān)注

    87

    文章

    30894

    瀏覽量

    269085
  • 人工智能
    +關(guān)注

    關(guān)注

    1791

    文章

    47279

    瀏覽量

    238493

原文標(biāo)題:ExecuTorch 測(cè)試版上線,加速 Arm 平臺(tái)邊緣側(cè)生成式 AI 發(fā)展

文章出處:【微信號(hào):Arm社區(qū),微信公眾號(hào):Arm社區(qū)】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏

    評(píng)論

    相關(guān)推薦

    中信建投建議關(guān)注側(cè)AI模組機(jī)會(huì)

    中信建投近日發(fā)布的研報(bào)指出,隨著OpenAI的ChatGPT功能全面接入蘋(píng)果設(shè)備,包括iPhone、iPad和Mac,側(cè)AI產(chǎn)業(yè)的發(fā)展正在加速。這一趨勢(shì)為
    的頭像 發(fā)表于 12-17 14:05 ?254次閱讀

    廣和通開(kāi)啟側(cè)AI新時(shí)代

    AI發(fā)展正酣,隨著終端芯片算力越來(lái)越高、側(cè)模型能力越來(lái)越強(qiáng)、實(shí)時(shí)響應(yīng)及隱私保護(hù)的側(cè)應(yīng)用需求增加,
    的頭像 發(fā)表于 12-12 10:35 ?195次閱讀

    把握關(guān)鍵節(jié)點(diǎn),美格智能持續(xù)推動(dòng)側(cè)AI規(guī)模化拓展

    將成為和系統(tǒng)同樣重要的存在,如果說(shuō)電路是連接身體的“血管”,那么AI就將成為終端的智慧“大腦”。加速演進(jìn)大模型加速走向側(cè)從手機(jī)移動(dòng)
    的頭像 發(fā)表于 11-26 01:00 ?152次閱讀
    把握關(guān)鍵節(jié)點(diǎn),美格智能持續(xù)推動(dòng)<b class='flag-5'>端</b><b class='flag-5'>側(cè)</b><b class='flag-5'>AI</b>規(guī)?;卣? />    </a>
</div>                            <div   id=

    中科創(chuàng)達(dá)發(fā)開(kāi)創(chuàng)側(cè)智能新篇章

    生成AI在創(chuàng)新和應(yīng)用方面以前所未有的速度向前發(fā)展。融合云計(jì)算和邊緣/側(cè)計(jì)算的混合AI技術(shù),
    的頭像 發(fā)表于 11-17 11:23 ?489次閱讀

    從Apple Intelligence到IoT Intelligence,側(cè)生成AI時(shí)代加速到來(lái)

    快速運(yùn)行以AppleIntelligence為中心的生成AI功能在手機(jī)側(cè)運(yùn)行。用庫(kù)克的話說(shuō):“新一代iPhone徹徹底底為AppleIn
    的頭像 發(fā)表于 09-11 08:01 ?729次閱讀
    從Apple Intelligence到IoT Intelligence,<b class='flag-5'>端</b><b class='flag-5'>側(cè)</b><b class='flag-5'>生成</b><b class='flag-5'>式</b><b class='flag-5'>AI</b>時(shí)代<b class='flag-5'>加速</b>到來(lái)

    GE醫(yī)療與亞馬遜云科技達(dá)成戰(zhàn)略合作,通過(guò)生成AI加速醫(yī)療健康領(lǐng)域轉(zhuǎn)型

    GE醫(yī)療已選擇亞馬遜云科技作為其戰(zhàn)略云服務(wù)合作伙伴,致力于推出全新的定制化基礎(chǔ)模型,加速創(chuàng)新醫(yī)療應(yīng)用快速開(kāi)發(fā)。 ? GE醫(yī)療將利用亞馬遜云科技的機(jī)器學(xué)習(xí)和生成
    發(fā)表于 08-29 16:38 ?271次閱讀

    NVIDIA推出NVIDIA AI Computing by HPE加速生成 AI 變革

    簡(jiǎn)化 AI 創(chuàng)造價(jià)值的過(guò)程,加速生成 AI 的發(fā)展步伐。 NVIDIA AI Computin
    的頭像 發(fā)表于 06-20 17:36 ?728次閱讀

    IBM與SAP深化生成AI領(lǐng)域合作

    近日,IBM與SAP宣布將進(jìn)一步擴(kuò)大他們的合作范圍,共同在生成人工智能(AI)領(lǐng)域進(jìn)行深度探索。此次合作的核心在于,雙方將共同為SAP的R
    的頭像 發(fā)表于 05-13 09:19 ?472次閱讀

    聯(lián)發(fā)科天璣9300+登場(chǎng),側(cè)生成AI刷新業(yè)界最高速

    聯(lián)發(fā)科旗艦芯的新一代力作,天璣9300+秉承了天璣系列的突破創(chuàng)新精神,不僅延續(xù)了先進(jìn)的全大核架構(gòu)和強(qiáng)大的生成AI能力,更是首次在側(cè)
    的頭像 發(fā)表于 05-08 21:24 ?1133次閱讀
    聯(lián)發(fā)科天璣9300+登場(chǎng),<b class='flag-5'>端</b><b class='flag-5'>側(cè)</b><b class='flag-5'>生成</b><b class='flag-5'>式</b><b class='flag-5'>AI</b>刷新業(yè)界最高速

    Arm平臺(tái)賦能移動(dòng)生成AI

    生成人工智能 (Generative AI) 涵蓋了當(dāng)下廣為人知,且備受關(guān)注的大語(yǔ)言模型 (LLM),如今也已落地邊緣側(cè)的移動(dòng)設(shè)備。
    的頭像 發(fā)表于 04-26 11:09 ?802次閱讀

    Arm推動(dòng)生成AI落地邊緣!全新Ethos-U85 AI加速器支持Transformer 架構(gòu),性能提升四倍

    電子發(fā)燒友網(wǎng)報(bào)道(文/黃晶晶)在嵌入領(lǐng)域,邊緣與側(cè)AI推理需求不斷增長(zhǎng),Arm既有Helium 技術(shù)使 CPU 能夠執(zhí)行更多計(jì)算密集型的
    的頭像 發(fā)表于 04-16 09:10 ?4618次閱讀
    <b class='flag-5'>Arm</b>推動(dòng)<b class='flag-5'>生成</b><b class='flag-5'>式</b><b class='flag-5'>AI</b>落地邊緣!全新Ethos-U85 <b class='flag-5'>AI</b><b class='flag-5'>加速</b>器支持Transformer 架構(gòu),性能提升四倍

    NVIDIA生成AI研究實(shí)現(xiàn)在1秒內(nèi)生成3D形狀

    NVIDIA 研究人員使 LATTE3D (一款最新文本轉(zhuǎn) 3D 生成 AI 模型)實(shí)現(xiàn)雙倍加速
    的頭像 發(fā)表于 03-27 10:28 ?498次閱讀
    NVIDIA<b class='flag-5'>生成</b><b class='flag-5'>式</b><b class='flag-5'>AI</b>研究<b class='flag-5'>實(shí)現(xiàn)</b>在1秒內(nèi)<b class='flag-5'>生成</b>3D形狀

    SAP與NVIDIA攜手加速生成AI在企業(yè)應(yīng)用中的普及

    SAP SE 和 NVIDIA 宣布深化合作,致力于加速企業(yè)客戶在 SAP 云解決方案和應(yīng)用組合中利用數(shù)據(jù)和生成 AI 的變革力量。
    的頭像 發(fā)表于 03-22 10:02 ?607次閱讀

    生成AI加速向終端側(cè)演進(jìn),NPU、異構(gòu)計(jì)算提供強(qiáng)大算力支持

    的400億美元,增長(zhǎng)至2032年的1.3萬(wàn)億美元,年復(fù)合增速達(dá)到42%。 ? 生成AI 向終端快速演進(jìn) ? 當(dāng)前大部分生成
    的頭像 發(fā)表于 03-16 00:16 ?2869次閱讀

    博世與微軟合作開(kāi)發(fā)生成AI產(chǎn)品

    全球知名科技公司博世與微軟聯(lián)合宣布,雙方已建立合作關(guān)系,共同致力于開(kāi)發(fā)先進(jìn)的生成AI產(chǎn)品。這一合作的核心目標(biāo)在于通過(guò)利用
    的頭像 發(fā)表于 03-05 11:17 ?903次閱讀