0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

AI推理框架軟件ONNX Runtime正式支持龍架構(gòu)

龍芯中科 ? 來源:龍芯中科 ? 2024-03-12 12:23 ? 次閱讀

近日,知名AI推理框架開源社區(qū)ONNX Runtime正式發(fā)布支持龍架構(gòu)的版本1.17.0。今后,用戶可以直接使用ONNX Runtime開源社區(qū)發(fā)布的版本在龍芯平臺完成AI推理類應(yīng)用的開發(fā)和部署,標(biāo)志著龍架構(gòu)軟件生態(tài)得到進一步完善。

f9225b04-e027-11ee-a297-92fbcf53809c.png

ONNX Runtime(ORT)是近年來興起的AI推理框架軟件,被大量AI應(yīng)用作為基礎(chǔ)AI推理引擎。ORT可支持PyTorch、TensorflowTFLite等多種格式的模型輸入,以及CPU、GPUIoT、NPU、FPGA等多樣化算力后端。

在ONNX Runtime 社區(qū)1.17.0版本的研制過程中,龍芯中科技術(shù)團隊與社區(qū)保持緊密合作,期間向ONNX Runtime社區(qū)代碼倉庫提交了7697行代碼,對矩陣乘法、卷積、轉(zhuǎn)置等核心算子進行深度向量優(yōu)化。在社區(qū)支持下,龍架構(gòu)優(yōu)化代碼通過了檢視、測試驗證等質(zhì)量保證流程,ONNX Runtime社區(qū)自1.17.0版本起正式實現(xiàn)對龍架構(gòu)的原生支持。

未來,龍芯中科將繼續(xù)與AI領(lǐng)域的國際開源軟件社區(qū)攜手合作,助力AI領(lǐng)域的生態(tài)發(fā)展和技術(shù)創(chuàng)新,為用戶帶來更優(yōu)產(chǎn)品,實現(xiàn)更大價值。




審核編輯:劉清

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • FPGA
    +關(guān)注

    關(guān)注

    1641

    文章

    21912

    瀏覽量

    611717
  • 龍芯中科
    +關(guān)注

    關(guān)注

    0

    文章

    300

    瀏覽量

    7888
  • NPU
    NPU
    +關(guān)注

    關(guān)注

    2

    文章

    311

    瀏覽量

    19340

原文標(biāo)題:AI推理框架軟件ONNX Runtime正式支持龍架構(gòu)

文章出處:【微信號:gh_53fadbdbd4d4,微信公眾號:龍芯中科】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 0人收藏

    評論

    相關(guān)推薦

    AI推理的存儲,看好SRAM?

    電子發(fā)燒友網(wǎng)報道(文/黃晶晶)近幾年,生成式AI引領(lǐng)行業(yè)變革,AI訓(xùn)練率先崛起,帶動高帶寬內(nèi)存HBM一飛沖天。但我們知道AI推理的廣泛應(yīng)用才能推動A
    的頭像 發(fā)表于 03-03 08:51 ?1369次閱讀
    <b class='flag-5'>AI</b><b class='flag-5'>推理</b>的存儲,看好SRAM?

    首創(chuàng)開源架構(gòu),天璣AI開發(fā)套件讓端側(cè)AI模型接入得心應(yīng)手

    ,聯(lián)發(fā)科帶來了全面升級的天璣AI開發(fā)套件2.0,在模型庫規(guī)模、架構(gòu)開放程度、前沿端側(cè)AI技術(shù)支持和端側(cè)LoRA訓(xùn)練落地等方面均迎來全面躍遷,為開發(fā)者提供了更全面、更開放、更強大的端側(cè)
    發(fā)表于 04-13 19:52

    有獎直播 | @4/8 輕松部署,強大擴展邊緣運算 AI 新世代

    (RockchipRK3588),該方案以高性價比和易用性為特色,支持主流深度學(xué)習(xí)框架(如TensorFlow、PyTorch、ONNX),讓企業(yè)與開發(fā)者輕松邁入
    的頭像 發(fā)表于 03-27 16:31 ?511次閱讀
    有獎直播 | @4/8 輕松部署,強大擴展邊緣運算 <b class='flag-5'>AI</b> 新世代

    邊緣AI新突破:MemryX AI加速卡與RK3588打造高效多路物體檢測方案

    資源及對主流深度學(xué)習(xí)框架 (如 TensorFlow、PyTorch、ONNX) 的支持,即便是新手也能快速上手,輕松部署 AI 模型,實現(xiàn)智能應(yīng)用開發(fā)。
    的頭像 發(fā)表于 03-06 10:45 ?406次閱讀
    邊緣<b class='flag-5'>AI</b>新突破:MemryX <b class='flag-5'>AI</b>加速卡與RK3588打造高效多路物體檢測方案

    無法在GPU上運行ONNX模型的Benchmark_app怎么解決?

    在 CPU 和 GPU 上運行OpenVINO? 2023.0 Benchmark_app推斷的 ONNX 模型。 在 CPU 上推理成功,但在 GPU 上失敗。
    發(fā)表于 03-06 08:02

    AI Agent 應(yīng)用與項目實戰(zhàn)》第1-2章閱讀心得——理解Agent框架與Coze平臺的應(yīng)用

    Operator 和 Deep Research 代表的第三層 Agent。 我對AI Agent的發(fā)展前景和未來應(yīng)用落地都持有非常樂觀的看法。 談回到本書,書中對Agent框架的闡述打破了我之前對其認識
    發(fā)表于 02-19 16:35

    使用NVIDIA推理平臺提高AI推理性能

    NVIDIA推理平臺提高了 AI 推理性能,為零售、電信等行業(yè)節(jié)省了數(shù)百萬美元。
    的頭像 發(fā)表于 02-08 09:59 ?510次閱讀
    使用NVIDIA<b class='flag-5'>推理</b>平臺提高<b class='flag-5'>AI</b><b class='flag-5'>推理</b>性能

    軟件受邀參加華為昇思人工智能框架峰會,展示昇思X香橙派的創(chuàng)新AI案例

    產(chǎn)業(yè)界、學(xué)術(shù)界力量,共建人工智能框架開源生態(tài),共探人工智能框架新未來。作為華為昇騰APN伙伴,迅軟件受邀參加此屆大會,并攜旗下基于昇騰AI
    的頭像 發(fā)表于 12-17 18:02 ?710次閱讀
    迅<b class='flag-5'>龍</b><b class='flag-5'>軟件</b>受邀參加華為昇思人工智能<b class='flag-5'>框架</b>峰會,展示昇思X香橙派的創(chuàng)新<b class='flag-5'>AI</b>案例

    大語言模型開發(fā)框架是什么

    大語言模型開發(fā)框架是指用于訓(xùn)練、推理和部署大型語言模型的軟件工具和庫。下面,AI部落小編為您介紹大語言模型開發(fā)框架。
    的頭像 發(fā)表于 12-06 10:28 ?388次閱讀

    RISC-V如何支持不同的AI和機器學(xué)習(xí)框架和庫?

    RISC-V如何支持不同的AI和機器學(xué)習(xí)框架和庫?還請壇友們多多指教一下。
    發(fā)表于 10-10 22:24

    基于迅為RK3588開發(fā)板的AI圖像識別方案

    操作)算力的高性能神經(jīng)網(wǎng)絡(luò)處理器單元(NPU)。這款NPU不僅擁有強大的計算能力,支持TensorFlow、Caffe、Tflite、Pytorch、Onnx NN、Android NN 等常見框架
    發(fā)表于 08-13 11:26

    摩爾線程攜手東華軟件完成AI大模型推理測試與適配

    近日,摩爾線程與東華軟件云筑AI創(chuàng)新中心宣布,雙方已完成大模型推理測試與適配。依托摩爾線程的全功能GPU國產(chǎn)算力,東華軟件打造安全可信的基于私有化大模型的“智多型(A.I.Cognif
    的頭像 發(fā)表于 07-31 10:51 ?1140次閱讀

    STM CUBE AI錯誤導(dǎo)入onnx模型報錯的原因?

    使用cube-AI分析模型時報錯,該模型是pytorch的cnn轉(zhuǎn)化成onnx ``` Neural Network Tools for STM32AI v1.7.0 (STM.ai
    發(fā)表于 05-27 07:15

    ONNX是什么?

    ONNX是什么?
    的頭像 發(fā)表于 05-15 09:49 ?2528次閱讀

    進一步解讀英偉達 Blackwell 架構(gòu)、NVlink及GB200 超級芯片

    ,第五代NVLink、InfiniBand網(wǎng)絡(luò)和NVIDIA Magnum IO?軟件支持,確保企業(yè)和廣泛GPU計算集群的高效可擴展性。 HGX B200 深度學(xué)習(xí)推理能力 英偉達第五代 NVLink
    發(fā)表于 05-13 17:16

    電子發(fā)燒友

    中國電子工程師最喜歡的網(wǎng)站

    • 2931785位工程師會員交流學(xué)習(xí)
    • 獲取您個性化的科技前沿技術(shù)信息
    • 參加活動獲取豐厚的禮品