0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

寒武紀基于思元370芯片的MLU370-X8 智能加速卡產(chǎn)品手冊詳解

向上 ? 來源:寒武紀 ? 作者:寒武紀 ? 2025-04-24 17:57 ? 次閱讀

寒武紀思元370芯片是基于7nm制程工藝,思元370是寒武紀首款采用chiplet(芯粒)技術(shù)的AI芯片,集成了390億個晶體管,最大算力高達256TOPS(INT8),是寒武紀第二代產(chǎn)品思元270算力的2倍。憑借寒武紀最新智能芯片架構(gòu)MLUarch03,思元370實測性能表現(xiàn)更為優(yōu)秀。思元370也是國內(nèi)第一款公開發(fā)布支持LPDDR5內(nèi)存的云端AI芯片,內(nèi)存帶寬是上一代產(chǎn)品的3倍,訪存能效達GDDR6的1.5倍。搭載MLU-Link?多芯互聯(lián)技術(shù),在分布式訓練或推理任務(wù)中為多顆思元370芯片提供高效協(xié)同能力。全新升級的寒武紀基礎(chǔ)軟件平臺,新增推理加速引擎MagicMind,實現(xiàn)訓推一體,大幅提升了開發(fā)部署的效率,降低用戶的學習成本、開發(fā)成本和運營成本。

寒武紀思元370芯片參數(shù)特性詳解

http://www.wenjunhu.com/d/6566167.html

寒武紀? AIDC? MLU370?-X8智能加速卡訓推一體人工智能加速卡

寒武紀?? AIDC?? MLU370 ?? -X8采用雙芯思元370配置,為雙槽位250w全尺寸智能加速卡,提供24TFLPOS(FP32)訓練算力和256TOPS (INT8)推理算力,同時提供豐富的FP16、BF16等多種訓練精度?;陔p芯思元370打造的MLU370-X8整合了兩倍于標準思元370加速卡的內(nèi)存、編解碼資源,同時MLU370-X8搭載MLU-Link多芯互聯(lián)技術(shù),每張加速卡可獲得200GB/s的通訊吞吐性能,是PCIe 4.0帶寬的3.1倍,支持單機八卡部署,可高效執(zhí)行多芯多卡訓練和分布式推理任務(wù)。

MLU370-X8智能加速卡是全面升級的數(shù)據(jù)中心訓推一體AI加速卡,基于寒武紀全新一代思元370芯片,接口為PCIe 4.0 X16,是全高全長雙寬(FHFL-Dual-Slot)的標準PCIe加速卡,適用于業(yè)內(nèi)最新的CPU平臺,可輕松搭載于最先進的人工智能服務(wù)器,快速實現(xiàn) AI算力的部署。MLU370-X8加速卡功耗為250W,可為計算機視覺、自然語言處理、語音等多樣化的人工智能應(yīng)用提供強大算力支持。

MLU370-X8 智能加速卡產(chǎn)品手冊免費下載

*附件:MLU370-X8 智能加速卡產(chǎn)品手冊免費下載.doc

產(chǎn)品規(guī)格

板卡型號MLU370-X8
計算架構(gòu)Camicon MLUarch03
制程工藝7nm
計算精度支持FP32、FP16、BF16、INT16、INT8、INT4
峰值性能256 TOPS (INT8)
128 TOPS (INT16)
96 TFLOPS (FP16)
96 TFLOPS (BF16)
24 TFLOPS (FP32)
內(nèi)存類型LPDDR5
內(nèi)存容量48GB
內(nèi)存帶寬614.4 GB/s
視頻編解碼最高可支持至8K;264路HEVC全高清視頻解碼;48路HEVC全高清視頻編碼;
圖片編解碼圖片編解碼最高分辨率支持16384x16384;8000 Frames/s 全高清圖片解碼;6000 Frames/s 全高清圖片編碼;
系統(tǒng)接口x16 PCIe Gen4
MLU-Link?接口4 ports, 16 Lanes, 50 Gbps
MLU-Link?帶寬聚合帶寬200GB/s Bi-direction
形態(tài)全高全長雙槽位
最大熱功耗250W
散熱設(shè)計被動

在寒武紀基礎(chǔ)軟件平臺 SDK上實測,在常見的4個人工智能模型上,MLU370-X8單卡性能與主流350W RTX GPU相當;而在多卡加速方面,MLU370-X8借助MLU-Link多芯互聯(lián)技術(shù)和寒武紀基礎(chǔ)軟件平臺 CNCL通訊庫的優(yōu)化,在8卡環(huán)境下達到更優(yōu)的并行加速比。

性能對比

image.png

*** 測試環(huán)境

250W MLU370-X8:NF5468M5/Intel Xeon Gold 5218 CPU @ 2.30GHz/MLU370 SDK 1.2.0

350W GPU: Supermicro AS -4124GS-TNR/Intel Xeon Gold 6130 CPU @ 2.10GHz/Cuda11.2

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 加速卡
    +關(guān)注

    關(guān)注

    1

    文章

    62

    瀏覽量

    11128
  • 寒武紀
    +關(guān)注

    關(guān)注

    11

    文章

    199

    瀏覽量

    74181
  • AI芯片
    +關(guān)注

    關(guān)注

    17

    文章

    1961

    瀏覽量

    35641
  • 算力
    +關(guān)注

    關(guān)注

    1

    文章

    1114

    瀏覽量

    15379
收藏 0人收藏

    評論

    相關(guān)推薦
    熱點推薦

    寒武紀“思220”推動邊緣AI應(yīng)用發(fā)展

    11月14日,寒武紀在第21屆高交會正式發(fā)布邊緣AI系列產(chǎn)品220(MLU220)芯片及M.2加速卡
    的頭像 發(fā)表于 11-14 14:49 ?4647次閱讀

    MLU220-M.2邊緣端智能加速卡支持相關(guān)資料介紹

    1、MLU220-M.2邊緣端智能加速卡簡介MLU220-M.2 加速卡采用思220
    發(fā)表于 08-08 17:37

    寒武紀科技生態(tài)爆發(fā),產(chǎn)業(yè)伙伴展示寒武紀芯片應(yīng)用

    業(yè)界領(lǐng)先的智能芯片設(shè)計公司寒武紀科技今天于上海發(fā)布了Cambricon MLU100 云端智能芯片
    的頭像 發(fā)表于 05-04 17:15 ?1.1w次閱讀

    寒武紀首款智能云端芯片應(yīng)用Cadence Z1硬件仿真加速平臺

    寒武紀云端智能芯片產(chǎn)品MLU100中集成了Cadence Memory interface IP和I/O interface IP,并應(yīng)用了
    的頭像 發(fā)表于 05-08 16:53 ?1.1w次閱讀

    寒武紀推出邊緣AI芯片220

    日前,寒武紀在第21屆高交會正式發(fā)布邊緣AI系列產(chǎn)品220(MLU220)芯片及M.2加速卡
    發(fā)表于 11-15 14:31 ?1596次閱讀

    寒武紀首顆訓練芯片290亮相

    1月21日,寒武紀290智能芯片加速卡、玄思1000智能
    的頭像 發(fā)表于 01-21 10:35 ?3156次閱讀

    寒武紀290智能芯片加速卡、玄思1000智能加速器亮相 全面支持AI訓練

    1 月 21 日,寒武紀 290 智能芯片加速卡、玄思 1000 智能
    的頭像 發(fā)表于 01-21 11:06 ?4272次閱讀

    寒武紀290芯片發(fā)布,具有三大關(guān)鍵亮點

    寒武紀在官網(wǎng)披露7納米AI訓練芯片 290 智能芯片加速卡、玄思1000
    的頭像 發(fā)表于 01-25 14:51 ?5500次閱讀

    軟硬兼施 寒武紀同步推出Neuware訓練軟件棧

    290智能芯片加速卡、玄思1000智能加速器訓練產(chǎn)品
    的頭像 發(fā)表于 02-05 11:39 ?1773次閱讀

    寒武紀持續(xù)研發(fā)投入 2020年虧損收窄,營收穩(wěn)步上漲

    ,自成立以來,寒武紀先后推出了用于終端場景的寒武紀1A、寒武紀1H、寒武紀1M系列芯片、基于思
    的頭像 發(fā)表于 04-28 13:16 ?1817次閱讀

    寒武紀發(fā)布新款A(yù)I訓練 瑞薩電子推出雙波束有源波束成形器IC

      2022年3月21日,寒武紀正式發(fā)布新款訓練加速卡MLU370-X8MLU370-X8搭載雙芯片四芯粒思
    的頭像 發(fā)表于 03-22 15:21 ?2264次閱讀

    【教程】貝啟RK3568開發(fā)板搭載寒武紀MLU220加速卡使用說明

    平臺:貝啟RK3568開發(fā)板軟件平臺:Ubuntu18.04AI算力計算棒:寒武紀MLU220加速卡寒武紀220M.2邊緣
    的頭像 發(fā)表于 04-28 10:30 ?3032次閱讀
    【教程】貝啟RK3568開發(fā)板搭載<b class='flag-5'>寒武紀</b><b class='flag-5'>MLU</b>220<b class='flag-5'>加速卡</b>使用說明

    寒武紀的思MLU)云端智能加速卡與百川智能完成大模型適配,攜手創(chuàng)新生成式AI

    近日,寒武紀MLU)系列云端智能加速卡與百川智能旗下的大模型Baichuan2-53B、B
    的頭像 發(fā)表于 11-06 20:32 ?1802次閱讀
    <b class='flag-5'>寒武紀</b>的思<b class='flag-5'>元</b>(<b class='flag-5'>MLU</b>)云端<b class='flag-5'>智能</b><b class='flag-5'>加速卡</b>與百川<b class='flag-5'>智能</b>完成大模型適配,攜手創(chuàng)新生成式AI

    寒武紀與智象未來聯(lián)手,推動視覺大模型的技術(shù)創(chuàng)新與應(yīng)用

    在大模型領(lǐng)域,寒武紀自底層硬件架構(gòu)至基礎(chǔ)軟件更新,皆針對大模型的實際應(yīng)用場景進行了細致優(yōu)化。依托高效的推理引擎MagicMind,寒武紀MLU)系列云端
    的頭像 發(fā)表于 01-24 09:59 ?1210次閱讀

    寒武紀370芯片參數(shù)特性詳解

    寒武紀首次采用chiplet技術(shù)將2顆AI計算芯粒封裝為一顆AI芯片,通過不同芯粒組合規(guī)格多樣化的產(chǎn)品,為用戶提供適用不同場景的高性價比AI芯片。
    的頭像 發(fā)表于 04-24 17:49 ?495次閱讀
    <b class='flag-5'>寒武紀</b>思<b class='flag-5'>元</b><b class='flag-5'>370</b><b class='flag-5'>芯片</b>參數(shù)特性<b class='flag-5'>詳解</b>

    電子發(fā)燒友

    中國電子工程師最喜歡的網(wǎng)站

    • 2931785位工程師會員交流學習
    • 獲取您個性化的科技前沿技術(shù)信息
    • 參加活動獲取豐厚的禮品