0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

從AI算力爆發(fā)到圖形革命?,Imagination重構(gòu)嵌入式設(shè)備的性能平衡模式

穎脈Imgtec ? 2025-04-16 11:49 ? 次閱讀

4月15日,慕尼黑上海電子展拉開帷幕。此次展覽將持續(xù)三天,不僅吸引了半導(dǎo)體、傳感器、海內(nèi)外展商參展;同期舉辦的“創(chuàng)新論壇”更是眾多行業(yè)人士關(guān)注的重點。4月15日下午,Imagination中國高級業(yè)務(wù)經(jīng)理黃音出席“2025AI技術(shù)創(chuàng)新論壇”,她結(jié)合公司產(chǎn)品情況,從AI算力、圖形渲染,以及基于兩者的嵌入式設(shè)備性能平衡等方面進行了主題分享。

ca16d8d8-1a75-11f0-9434-92fbcf53809c.jpg


AI模型持續(xù)優(yōu)化驅(qū)動硬件構(gòu)架的革新

首先,黃音回顧了自2012年以來AI模型的發(fā)展歷程。她介紹說,2012年AlexNet開啟了卷積神經(jīng)網(wǎng)絡(luò)時代;Perception AI開始進入語音識別、計算機視覺;Generative AI實現(xiàn)了從文本生成圖像、視頻等內(nèi)容生成;Agentic AI不僅能學(xué)習(xí),還能使用工具,進行判斷,并且采取行動;還有最近流行的Physical AI,能感知物理世界的人工智能,在真實環(huán)境中完成任務(wù),如智能機器人等。

“我們現(xiàn)在常說‘大模型’,其實也有不少公司在做‘小模型’”。大模型(LLM)通?;诖笠?guī)模數(shù)據(jù)進行訓(xùn)練,如谷歌的Transformer,也有可在端側(cè)進行推理的大模型,例如Deepseek R1。小模型(SLM)通常參數(shù)量比LLM少,設(shè)計上更側(cè)重于針對特定任務(wù)進行微調(diào),如LLaMini。而AI推理的應(yīng)用中,特別是在端側(cè)設(shè)備上運行時,小模型與physical AI的結(jié)合,會給端側(cè)應(yīng)用帶來爆發(fā)式增長。

與此同時,模型不斷優(yōu)化也帶來了硬件設(shè)計的變革,從單一算力需求轉(zhuǎn)變?yōu)閷λ懔?、存儲、中間通訊三者的平衡,新的硬件架構(gòu)是發(fā)展的必然趨勢。根據(jù)不同的處理器架構(gòu),黃音分別介紹了不同之處。CPU更適合處理串行數(shù)據(jù),NPU適合固定模型算法的并行加速,GPU適合通用的并行計算,隨著基礎(chǔ)模型的不斷優(yōu)化,邊緣側(cè)的AI應(yīng)用會有更多架構(gòu)組合的可能性。

ca425b5c-1a75-11f0-9434-92fbcf53809c.png

而對于人工智能的端側(cè)應(yīng)用,推理只是其中的一個核心模塊,還有很多邊緣需求,比如通用計算和調(diào)度,云邊混合帶來的加密和隱私需求,圖形渲染圖像畫質(zhì)增強需求,功能安全和信息安全需求,設(shè)備自學(xué)習(xí)需求等。我們除了要追求每瓦算力,峰值算力和帶寬極致外,還應(yīng)該看到端側(cè)應(yīng)用是一個融合能力的應(yīng)用。真正的破局點,是構(gòu)建一個可以持續(xù)適配算法演進的架構(gòu)平臺。


Imagination GPU擅長應(yīng)對邊緣和端側(cè)AI帶來的挑戰(zhàn)

Imagination作為全球領(lǐng)先的GPU IP供應(yīng)商,深耕圖形和AI,特別是針對邊緣和端側(cè)AI,Imagination的GPU技術(shù)具有高能效、可編程性、可擴展性和靈活性等特點?,F(xiàn)場,黃音重點介紹了ImaginationD系列DXTP GPU和DXS GPU兩款產(chǎn)品及其在AI phone和AIPC上的應(yīng)用前景。

ca51351e-1a75-11f0-9434-92fbcf53809c.png

DXTP GPU可保證在智能手機和其他功耗受限設(shè)備上加速圖形和AI工作負(fù)載時,保證全天候的電池續(xù)航。通過微架構(gòu)的優(yōu)化,相比前一代產(chǎn)品DXT,DXTP提供了更高的持續(xù)性能、更快的計算調(diào)度,并在幾何處理吞吐量方面提高了50%。目前,DXTP已經(jīng)被全球知名科技公司使用,在AI多數(shù)據(jù)類型處理、計算任務(wù)加速,以及本地內(nèi)存的支持上有突出表現(xiàn)。此外,它還支持LiteRT(前身是tensorflow Lite)主流AI框架,并在Imagination體系內(nèi)做了優(yōu)化,開發(fā)者可運用它在Android設(shè)備上實現(xiàn)高性能AI應(yīng)用的部署。

ca617c62-1a75-11f0-9434-92fbcf53809c.png

DXS GPU則是專為處理駕駛艙、信息娛樂和高級駕駛輔助系統(tǒng)中的圖形和計算工作負(fù)載而打造的一款產(chǎn)品。相比于上一代GPU,IMG DXS為車輛中越來越常見的計算工作負(fù)載(如駕駛員監(jiān)控和防撞)提供了高達10倍的性能提升。與硬件配套的計算庫(imgBLAS、imgNN、imgFFT)可幫助軟件開發(fā)人員實現(xiàn)高達80%的GPU利用率。這也將加速常見計算工作負(fù)載的處理,如計算機視覺和ADAS系統(tǒng)感知數(shù)據(jù)的預(yù)處理和后處理。

在演講最后,對于什么將是符合“Physical AI”的終極硬件?黃音指出了三點:一是效率,在圖形與AI計算上實現(xiàn)更優(yōu)的能效比與計算密度;二是深度嵌入式集成,最小化數(shù)據(jù)傳輸,匹配現(xiàn)代API擴展;三是開發(fā)者與系統(tǒng)靈活性,是一款高度多用途的邊緣處理器,既可用于圖形,也可用于AI。她也透露到,Imagination今年也將有重磅產(chǎn)品推出,值得期待。

此外,在圓桌討論環(huán)節(jié),黃音與產(chǎn)業(yè)鏈伙伴圍繞AI對行業(yè)帶來的影響、生態(tài)合作、RISC-V等話題進行了討論。黃音認(rèn)為AI快速發(fā)展驅(qū)動了新的算力需求、硬件架構(gòu)的革新,而作為IP供應(yīng)商更需要與產(chǎn)業(yè)上下游伙伴合作,例如Imagination與多家RISC-V公司合作,優(yōu)化GPU適配主流AI框架和標(biāo)準(zhǔn)API接口等,希望幫助客戶打造差異化產(chǎn)品,實現(xiàn)快速上市。


聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 慕尼黑
    +關(guān)注

    關(guān)注

    0

    文章

    149

    瀏覽量

    18107
  • 嵌入式設(shè)備
    +關(guān)注

    關(guān)注

    0

    文章

    116

    瀏覽量

    17363
  • imagination
    +關(guān)注

    關(guān)注

    1

    文章

    598

    瀏覽量

    62044
收藏 0人收藏

    評論

    相關(guān)推薦
    熱點推薦

    聚徽智控——嵌入式到邊緣計算:平板工控電腦的技術(shù)進化論

    在工業(yè)數(shù)字化轉(zhuǎn)型的浪潮中,平板工控電腦作為核心終端設(shè)備,正經(jīng)歷嵌入式系統(tǒng)到邊緣計算架構(gòu)的范式革命。這一進化不僅重塑了設(shè)備的技術(shù)形態(tài),更推動
    的頭像 發(fā)表于 06-13 13:48 ?52次閱讀

    網(wǎng)絡(luò)的“神經(jīng)突觸”:AI互聯(lián)技術(shù)如何重構(gòu)分布訓(xùn)練范式

    過程中,由于單個AI芯片的提升速度無法跟上模型參數(shù)的增長速率,再加上龐大的模型參數(shù)和訓(xùn)練數(shù)據(jù),已遠遠超出單個AI芯片甚至單臺服務(wù)器的能力范圍。因此,需要將數(shù)據(jù)樣本和模型結(jié)構(gòu)分散到多
    的頭像 發(fā)表于 06-08 08:11 ?6007次閱讀
    <b class='flag-5'>算</b><b class='flag-5'>力</b>網(wǎng)絡(luò)的“神經(jīng)突觸”:<b class='flag-5'>AI</b>互聯(lián)技術(shù)如何<b class='flag-5'>重構(gòu)</b>分布<b class='flag-5'>式</b>訓(xùn)練范式

    新品 | 26+6TOPS強悍!飛凌嵌入式FCU3501嵌入式控制單元發(fā)布

    飛凌嵌入式FCU3501嵌入式控制單元基于瑞芯微RK3588處理器開發(fā)設(shè)計,4xCortex-A76+4xCortex-A55架構(gòu),A76主頻高達2.4GHz,A55核主頻高達1.8GHz,支持8K編解碼,NPU
    的頭像 發(fā)表于 05-15 11:57 ?1540次閱讀
    新品 | 26+6TOPS強悍<b class='flag-5'>算</b><b class='flag-5'>力</b>!飛凌<b class='flag-5'>嵌入式</b>FCU3501<b class='flag-5'>嵌入式</b>控制單元發(fā)布

    Imagination?宣布推出?E-Series GPU:開啟Edge AI?與圖形處理新時代

    E-Series帶來跨越性能提升,使GPU成為邊緣設(shè)備圖形AI的核心加速引擎2025年5月8日——ImaginationTechnolo
    的頭像 發(fā)表于 05-08 08:02 ?343次閱讀
    <b class='flag-5'>Imagination</b>?宣布推出?E-Series GPU:開啟Edge <b class='flag-5'>AI</b>?與<b class='flag-5'>圖形</b>處理新時代

    芯片的生態(tài)突圍與革命

    電子發(fā)燒友網(wǎng)報道(文 / 李彎彎)大芯片,即具備強大計算能力的集成電路芯片,主要應(yīng)用于高性能計算(HPC)、人工智能(AI)、數(shù)據(jù)中心、自動駕駛等需要海量數(shù)據(jù)并行計算的場景。隨著
    的頭像 發(fā)表于 04-13 00:02 ?1526次閱讀

    嵌入式主板開發(fā)詳細指南

    與方案設(shè)計功能定義:明確主板的用途(如工業(yè)控制、邊緣AI)、接口需求(CAN、GPIO、MIPI等)及性能指標(biāo)(、實時性)。選型決策:根據(jù)需求選擇處理器架構(gòu)(AR
    的頭像 發(fā)表于 04-02 11:35 ?426次閱讀
    <b class='flag-5'>嵌入式</b>主板開發(fā)詳細指南

    DeepSeek推動AI需求:800G光模塊的關(guān)鍵作用

    隨著人工智能技術(shù)的飛速發(fā)展,AI需求正以前所未有的速度增長。DeepSeek等大模型的訓(xùn)練與推理任務(wù)對的需求持續(xù)攀升,直接推動了服務(wù)
    發(fā)表于 03-25 12:00

    圖形處理到AI加速,一文看懂Imagination D系列GPU

    Imagination的D系列于2022年首次發(fā)布,見證了生成AI云端到智能手機等消費設(shè)備中普及。在云端,由于GPU的可編程性、可擴展性
    的頭像 發(fā)表于 02-27 08:33 ?408次閱讀
    <b class='flag-5'>從</b><b class='flag-5'>圖形</b>處理到<b class='flag-5'>AI</b>加速,一文看懂<b class='flag-5'>Imagination</b> D系列GPU

    信而泰CCL仿真:解鎖AI極限,智中心網(wǎng)絡(luò)性能躍升之道

    中心RoCE網(wǎng)絡(luò)提供精準(zhǔn)評估方案,助力企業(yè)突破瓶頸,釋放AI澎湃動力! 什么是智中心 智中心(AIDC,Artificial Int
    的頭像 發(fā)表于 02-24 17:34 ?396次閱讀
    信而泰CCL仿真:解鎖<b class='flag-5'>AI</b><b class='flag-5'>算</b><b class='flag-5'>力</b>極限,智<b class='flag-5'>算</b>中心網(wǎng)絡(luò)<b class='flag-5'>性能</b>躍升之道

    企業(yè)AI租賃模式的好處

    構(gòu)建和維護一個高效、可擴展的AI基礎(chǔ)設(shè)施,不僅需要巨額的初期投資,還涉及復(fù)雜的運維管理和持續(xù)的技術(shù)升級。而AI
    的頭像 發(fā)表于 12-24 10:49 ?1157次閱讀

    芯片 高性能 CPUGPUNPU 微架構(gòu)分析》第3篇閱讀心得:GPU革命圖形引擎到AI加速器的蛻變

    在數(shù)據(jù)挖掘工作中,我經(jīng)常需要處理海量數(shù)據(jù)的深度學(xué)習(xí)任務(wù),這讓我對GPU架構(gòu)和張量運算充滿好奇。閱讀《芯片》第7-9章,讓我對這些關(guān)鍵技術(shù)有了全新認(rèn)識。 GPU架構(gòu)從早期的固定功能流水線,到現(xiàn)代
    發(fā)表于 11-24 17:12

    GPU開發(fā)平臺是什么

    隨著AI技術(shù)的廣泛應(yīng)用,需求呈現(xiàn)出爆發(fā)式增長。AI
    的頭像 發(fā)表于 10-31 10:31 ?598次閱讀

    【「芯片 | 高性能 CPU/GPU/NPU 微架構(gòu)分析」閱讀體驗】--全書概覽

    1章 TOP500和MLPerf看芯片格局 1.1科學(xué)最前沿TOP500 1.2 AI
    發(fā)表于 10-15 22:08

    七大嵌入式GUI盤點

    嵌入式圖形用戶界面(GUI)是一種為嵌入式系統(tǒng)設(shè)計的用戶界面,它可以讓用戶通過圖形化的方式與設(shè)備進行交互。以下是對七種
    發(fā)表于 09-02 10:58

    電子發(fā)燒友

    中國電子工程師最喜歡的網(wǎng)站

    • 2931785位工程師會員交流學(xué)習(xí)
    • 獲取您個性化的科技前沿技術(shù)信息
    • 參加活動獲取豐厚的禮品