0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

墨芯Antoum芯片賦能大模型在各行各業(yè)的落地

墨芯人工智能 ? 來源:墨芯人工智能 ? 2023-09-06 14:21 ? 次閱讀

近日,墨芯人工智能攜Antoum?芯片亮相芯片行業(yè)的國際頂級大會Hot Chips 2023,墨芯首席架構(gòu)師肖志斌博士在大會Tutorials上發(fā)表對行業(yè)趨勢的分享,并在Conference Day介紹Antoum?的創(chuàng)新架構(gòu)。

一年一度的Hot Chips是全球芯片產(chǎn)業(yè)界影響力最大的活動,被譽為“芯片產(chǎn)業(yè)的風(fēng)向標”,每年都有來自業(yè)界前沿的眾多頭部企業(yè),發(fā)布最新產(chǎn)品與創(chuàng)新技術(shù)。

今年Hot Chips云集了NVIDIA、高通、英特爾、AMD等芯片巨頭,與墨芯等代表性初創(chuàng)企業(yè),介紹前沿技術(shù)與企業(yè)最新成果。

肖志斌博士進行《Moffett Antoum?: A Deep-Sparse AI Inference System-on-Chip for Vision and Large Language Models》主題分享,介紹了的Antoum?芯片的創(chuàng)新架構(gòu),及Antoum?在大語言模型、計算機視覺等任務(wù)上的優(yōu)勢與特點。

由于深度學(xué)習(xí)模型復(fù)雜性的提升及模型的廣泛應(yīng)用,AI計算需求呈指數(shù)級增長。尤其是ChatGPT掀起大模型浪潮后,算力供需不平衡的問題日益突出。針對算力難題,墨芯推出全球首顆高倍率稀疏芯片Antoum?,實現(xiàn)了更高的推理效率與能效比。

Antoum?獨特的稀疏計算單元SPU(Sparse Processing Unit),可以在負載均衡的情況下進行并行計算,并且只計算非零值,即忽略零元素的存儲、搬移、計算,大大提高了計算單元的利用率,進而減少功耗與延時,同時增加吞吐率。SPU載有Deep Sparse Tensor Core(深度稀疏張量核心),實現(xiàn)稀疏神經(jīng)網(wǎng)絡(luò)的高模型精度和高硬件利用效率。

0b1eeca6-4c66-11ee-a25d-92fbcf53809c.png

除了利用稀疏處理單元(SPU)支持深度稀疏性之外,Antoum?還采用了特定領(lǐng)域架構(gòu),將各種特殊功能加速器以及內(nèi)部設(shè)計的矢量處理單元與可擴展的片上網(wǎng)絡(luò)連接起來。

Antoum?共有 32 個 SPU,支持 BF16 和 INT8 數(shù)據(jù)精度,密集吞吐量為 14.7 TFLOPS 和 29.5 TOPS,在 32 倍稀疏性條件下可實現(xiàn)相當(dāng)于 471.8 TFLOPS 和 943.6 TOPS 的性能。

此外,Antoum?芯片還具有多個亮點:

存儲器層次結(jié)構(gòu)包含總計 82 MB 的片上 SRAM,由 SPU、VPU 和特殊功能加速器共享。

特殊功能加速器包括激活功能、TOPK、Transpose、嵌入式查找以及圖像預(yù)處理和后處理功能。

高帶寬環(huán)形互連連接四個 NNCore 子系統(tǒng),支持模型并行化和張量并行化。

專用硬件視頻編解碼引擎和 JPEG 解碼引擎。四個視頻解碼器引擎和一個視頻編碼引擎可處理多通道視頻流(高達 4K),并可輕松將可擴展的深度學(xué)習(xí)集成到視頻處理中。集成的 8 個硬件 JPEG 解碼器可載 CPU 密集型 JPEG 解碼任務(wù),并能以超過 2000 FPS 的速度解碼 1080p JPEG 圖像。

PCIe Gen3 x 16 和 20 GB LPDDR4x 內(nèi)存,理論峰值內(nèi)存帶寬高達 84 GB/s,功耗僅為 70 W。

在軟件方面,Antoum?由墨芯 SparseRT 軟件開發(fā)環(huán)境支持,為加速開發(fā)提供了一個完整的、可擴展的平臺,并增強了稀疏計算的能力?,F(xiàn)有的機器學(xué)習(xí)(ML)框架,如 TensorFlow、PyTorch、ONNX 和 MXNet,都能得到SparseRT 全面高效的支持。獨特的 SparseOPT 模型壓縮工具可為AI模型提供4倍到32倍的稀疏壓縮。這樣就可以輕松集成到現(xiàn)有的模型交付中,釋放大模型的潛力。

Antoum?芯片的優(yōu)異性能,已在連續(xù)兩屆權(quán)威測評MLPerf中得到驗證。同時,基于Antoum?的墨芯第一代AI計算卡產(chǎn)品已實現(xiàn)量產(chǎn),并已在互聯(lián)網(wǎng)、生命科學(xué)、智慧交通等領(lǐng)域落地,產(chǎn)業(yè)化接連取得重要進展。墨芯將持續(xù)為客戶帶來高效的大模型算力方案,賦能大模型在各行各業(yè)的落地。

審核編輯:彭菁

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 芯片
    +關(guān)注

    關(guān)注

    456

    文章

    51026

    瀏覽量

    425430
  • 軟件開發(fā)
    +關(guān)注

    關(guān)注

    0

    文章

    621

    瀏覽量

    27384
  • 墨芯
    +關(guān)注

    關(guān)注

    0

    文章

    8

    瀏覽量

    1096
  • 大模型
    +關(guān)注

    關(guān)注

    2

    文章

    2512

    瀏覽量

    2923

原文標題:墨芯攜Antoum芯片 亮相行業(yè)國際頂會Hot Chips 2023

文章出處:【微信號:墨芯人工智能,微信公眾號:墨芯人工智能】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏

    評論

    相關(guān)推薦

    risc-v目前什么領(lǐng)域最熱門?

    risc-v芯片可以應(yīng)用于各行各業(yè),那請問在哪個行業(yè)最火呢?
    發(fā)表于 11-30 23:17

    模型加速能行業(yè) 訊飛星火引領(lǐng)大模型規(guī)?;?b class='flag-5'>落地時代

    舉辦2024全球開發(fā)者節(jié),并對外公布了訊飛星火大模型落地應(yīng)用的最 新成績單,科大訊飛披露,訊飛星火接連拿下央國企中標第 一、教育醫(yī)療市場第 一、智能汽車市場第 一、大模型應(yīng)用開發(fā)者生態(tài)第 一、智能硬件市場第 一、
    的頭像 發(fā)表于 10-28 14:03 ?190次閱讀

    達實智能在各行各業(yè)的應(yīng)用案例

    近期,達實智能中標經(jīng)開區(qū)光伏新能源產(chǎn)業(yè)園(一期)項目高效機房系統(tǒng)項目,完成了1個億的“小目標”。除了這個小目標以外,達實智能基于自主研發(fā)的節(jié)能低碳技術(shù),也服務(wù)了眾多各行各業(yè)的頭部企業(yè)。
    的頭像 發(fā)表于 10-24 10:27 ?345次閱讀

    單北斗各行各業(yè),頂堅工作記錄儀開啟智能化管理

    一、單北斗技術(shù)能行業(yè)應(yīng)用近年來,隨著北斗衛(wèi)星導(dǎo)航系統(tǒng)的不斷完善和發(fā)展,其應(yīng)用領(lǐng)域日益廣泛,為各行各業(yè)帶來了前所未有的變革。單北斗技術(shù)以其高精度、全天候、全球覆蓋的特性,正逐步成為各行業(yè)智能化轉(zhuǎn)型
    的頭像 發(fā)表于 09-06 11:00 ?264次閱讀
    單北斗<b class='flag-5'>賦</b><b class='flag-5'>能</b><b class='flag-5'>各行各業(yè)</b>,頂堅工作記錄儀開啟智能化管理

    RISC-V Summit China 2024 | 青稞RISC-V+接口PHY,RISC-V高效落地

    RISC-V中國峰會在杭州圓滿落幕。峰會現(xiàn)場,沁恒圍繞“青稞RISC-V全棧MCU+USB/藍牙/以太網(wǎng)芯片,RISC-V高效落地”的主題,通過首日主會場演講、展臺互動等形式,系統(tǒng)
    發(fā)表于 08-30 17:37

    精準記錄,高效分析:單北斗現(xiàn)場記錄儀各行各業(yè)的應(yīng)用

    在這個信息爆炸、效率至上的時代,每一個細節(jié)的記錄與分析都成為了推動行業(yè)進步的關(guān)鍵力量。單北斗現(xiàn)場記錄儀,作為集高精度定位、高清視頻錄制、智能數(shù)據(jù)分析于一體的創(chuàng)新設(shè)備,正悄然改變著各行各業(yè)的作業(yè)模式
    的頭像 發(fā)表于 08-28 11:46 ?377次閱讀
    精準記錄,高效分析:單北斗現(xiàn)場記錄儀<b class='flag-5'>在</b><b class='flag-5'>各行各業(yè)</b>的應(yīng)用

    華邦電子為邊緣設(shè)備打造生成式AI性能

    以大模型為基礎(chǔ)的云端 AI 廣泛各行各業(yè)后,邊緣設(shè)備對于 AI 也釋放出巨大需求,AI 也在從云端向邊緣端加速
    的頭像 發(fā)表于 08-19 16:14 ?633次閱讀

    智能微型斷路器,廣泛應(yīng)用,各行各業(yè)電力升級

    電力作為現(xiàn)代社會的血脈,其安全與運行成為各行各業(yè)關(guān)注的焦點。智能微型斷路器以其實時監(jiān)測、遠程操控與預(yù)警保護功能,為戶內(nèi)低壓配電網(wǎng)絡(luò)的安全管理樹立了新的標桿。 從工業(yè)生產(chǎn)線到商業(yè)綜合體,從民用建筑到
    的頭像 發(fā)表于 08-05 11:53 ?435次閱讀
    智能微型斷路器,廣泛應(yīng)用,<b class='flag-5'>賦</b><b class='flag-5'>能</b><b class='flag-5'>各行各業(yè)</b>電力升級

    為什么加速數(shù)據(jù)處理對各行各業(yè)的AI創(chuàng)新都至關(guān)重要

    各行各業(yè),AI 正在用機器驅(qū)動的計算來推動創(chuàng)新。金融領(lǐng)域,銀行正在使用 AI 更快地檢測欺詐行為并確保賬戶安全;電信公司正在使用 AI 優(yōu)化網(wǎng)絡(luò)以提供優(yōu)質(zhì)服務(wù);科學(xué)家正在使用 AI 開發(fā)治療罕見
    的頭像 發(fā)表于 07-05 10:46 ?709次閱讀

    數(shù)字EDARISC-V落地演進技術(shù)研討會成功舉辦

    為了推動RISC-V技術(shù)的落地與演進,國家集成電路設(shè)計深圳產(chǎn)業(yè)化基地攜手思爾,于2024年6月18日下午成功舉辦了“數(shù)字EDARISC-V落地
    的頭像 發(fā)表于 06-21 08:24 ?411次閱讀
    數(shù)字EDA<b class='flag-5'>賦</b><b class='flag-5'>能</b>RISC-V<b class='flag-5'>落地</b>演進技術(shù)研討會成功舉辦

    數(shù)字EDARISC-V落地演進技術(shù)研討會成功舉辦

    為了推動RISC-V技術(shù)的落地與演進, 國家集成電路設(shè)計深圳產(chǎn)業(yè)化基地攜手思爾 ,于2024年6月18日下午成功舉辦了“數(shù)字EDARISC-V
    的頭像 發(fā)表于 06-20 11:15 ?733次閱讀

    華為推出ICN Master解決方案,率先將大模型應(yīng)用到核心網(wǎng)運維領(lǐng)域

    2023年ChatGPT的出現(xiàn)讓大模型成為各行各業(yè)的熱點,如何構(gòu)建大模型,實現(xiàn)大模型和云核心網(wǎng)之間的深度融合是核心網(wǎng)產(chǎn)業(yè)當(dāng)前新熱點。
    的頭像 發(fā)表于 05-13 10:25 ?1008次閱讀

    IC咖啡沙龍“未來”公益講座丨仇健樂:RISC-V指令架構(gòu)端側(cè)智能芯片產(chǎn)業(yè)化落地

    4月18日,由張江高科、IC咖啡聯(lián)合主辦的“未來”公益講座【2024第十場】“RISC-V指令架構(gòu)端側(cè)智能芯片產(chǎn)業(yè)化落地”如約開講。本
    的頭像 發(fā)表于 04-24 08:16 ?356次閱讀
    IC咖啡沙龍“<b class='flag-5'>芯</b>未來”公益講座丨仇健樂:RISC-V指令架構(gòu)<b class='flag-5'>賦</b><b class='flag-5'>能</b>端側(cè)智能<b class='flag-5'>芯片</b>產(chǎn)業(yè)化<b class='flag-5'>落地</b>

    青云科技聯(lián)手摩爾線程,構(gòu)建國產(chǎn)算力繁榮生態(tài)

    隨著大數(shù)據(jù)模型各行業(yè)深度整合,以GPU為代表的智能算力需求持續(xù)攀升。同時,政府出臺多項扶持政策,積極推行“人工智能+”戰(zhàn)略,激勵A(yù)I芯片行業(yè)創(chuàng)新發(fā)展,以更好地
    的頭像 發(fā)表于 04-22 09:32 ?549次閱讀

    紫光展銳推出系列5G產(chǎn)品矩陣百業(yè)數(shù)字化升級轉(zhuǎn)型

    隨著5G技術(shù)的快速發(fā)展,各行各業(yè)對通信技術(shù)的需求也不斷升級。
    的頭像 發(fā)表于 03-06 10:12 ?574次閱讀