0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

基于龍架構(gòu)的AI加速開發(fā)系統(tǒng)正式落地

龍芯中科 ? 來源:龍芯中科 ? 作者:龍芯中科 ? 2022-06-15 11:13 ? 次閱讀

隨著信息數(shù)據(jù)的爆炸式增長、計(jì)算能力的提高以及理論算法的突破,AI技術(shù)快速發(fā)展,AI技術(shù)不僅在學(xué)術(shù)界產(chǎn)生突破性研究成果,同時(shí)在工業(yè)界被廣泛應(yīng)用。目前,絕大多數(shù)流行使用的AI系統(tǒng)均為國外開發(fā)者發(fā)布,使用國外的開發(fā)系統(tǒng)平臺開展AI的研究和應(yīng)用,具有風(fēng)險(xiǎn)性和安全問題。AI系統(tǒng)作為關(guān)鍵系統(tǒng)軟件,亟需解決國產(chǎn)化問題并確保安全可控。

近期,在龍芯中科、松科智能、寒武紀(jì)等多方的共同努力下,基于LoongArch(龍架構(gòu))的AI加速開發(fā)系統(tǒng),在金陵科技學(xué)院成功部署驗(yàn)收。

基于龍架構(gòu)的AI加速開發(fā)系統(tǒng)

1基于LA架構(gòu),算力最高達(dá)20T

基于龍芯最新高性能處理器龍芯3C5000L設(shè)計(jì),處理器基于龍芯自主指令系統(tǒng)架構(gòu)LoongArch。配合國產(chǎn) AI加速卡,最?可以完成10T算?的?作任務(wù)。多卡最?可以?持4路??智能計(jì)算卡的部署,最?算?可以達(dá)到20T。

2與系統(tǒng)軟硬件深度融合

該AI加速開發(fā)系統(tǒng),與系統(tǒng)軟硬件的深入融合,提供了開發(fā)、調(diào)試與維護(hù)的系統(tǒng)平臺,有可靠的硬件支持和性能優(yōu)越的算法模型,把AI技術(shù)和硬件系統(tǒng)環(huán)境進(jìn)行有機(jī)結(jié)合,應(yīng)用到具體和安全密切相關(guān)的實(shí)際場景中,例如人臉識別認(rèn)證,智能檢測控制、大數(shù)據(jù)風(fēng)控等。在這些場景下AI技術(shù)能提供比人工更加好的識別精準(zhǔn)度,節(jié)省人工成本,為生產(chǎn)生活帶來便利。

AI開發(fā)系統(tǒng)的硬件結(jié)構(gòu)

3支持多個人工智能場景

該AI加速開發(fā)系統(tǒng),可以實(shí)現(xiàn)包括?臉識別、矩陣推導(dǎo)、模式識別、智能駕駛等??智能場景,提供深度學(xué)習(xí)定點(diǎn)化訓(xùn)練框架以及模型的定點(diǎn)化?具,提供通?模型的編譯以及部署開發(fā)SDK套件,?持 MXnet、 Caffe、TensorFlow 等主流算法框架。

人臉識別功能測試

在很多場景下的AI開發(fā)系統(tǒng)平臺無法滿足系統(tǒng)性能的需要,不易于開發(fā),資源利用率低等,基于龍架構(gòu)的AI加速開發(fā)系統(tǒng),發(fā)揮計(jì)算芯片的效率,搭載設(shè)計(jì)先進(jìn)的計(jì)算卡,開拓了機(jī)器學(xué)習(xí)系統(tǒng)新的發(fā)展方向。此系統(tǒng)搭載國產(chǎn)??智能芯?,可以?效完成多路動態(tài)視頻流的?臉檢測、跟蹤、特征提取和識別,?效?持墨鏡、?罩、性別、年齡等屬性檢測。提供強(qiáng)?的可編程運(yùn)算能?,滿?CNN算法實(shí)時(shí)性處理的運(yùn)算要求和算法移植和應(yīng)?。

在國家大力發(fā)展自主可控的關(guān)鍵基礎(chǔ)軟硬件背景下,基于龍架構(gòu)的AI加速開發(fā)系統(tǒng)的落地,為國產(chǎn)AI產(chǎn)業(yè)發(fā)展提供了新的創(chuàng)新動能與實(shí)踐樣本。高校是培養(yǎng)創(chuàng)新型科技人才的前沿陣地和搖籃,龍芯中科愿攜手金陵科技學(xué)院及其它各類院校,不斷進(jìn)行產(chǎn)學(xué)研深度合作,培養(yǎng)創(chuàng)新技術(shù)人才,共同建設(shè)自主信息技術(shù)體系和產(chǎn)業(yè)生態(tài)。

原文標(biāo)題:龍芯聯(lián)手松科智能與寒武紀(jì),基于LoongArch的AI加速開發(fā)系統(tǒng)落地南京高校

文章出處:【微信公眾號:龍芯中科】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

審核編輯:湯梓紅

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報(bào)投訴
  • 龍芯中科
    +關(guān)注

    關(guān)注

    0

    文章

    278

    瀏覽量

    7659
  • 寒武紀(jì)
    +關(guān)注

    關(guān)注

    11

    文章

    191

    瀏覽量

    73922
  • LoongArch
    +關(guān)注

    關(guān)注

    0

    文章

    26

    瀏覽量

    1354

原文標(biāo)題:龍芯聯(lián)手松科智能與寒武紀(jì),?基于LoongArch的AI加速開發(fā)系統(tǒng)落地南京高校

文章出處:【微信號:gh_53fadbdbd4d4,微信公眾號:龍芯中科】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏

    評論

    相關(guān)推薦

    存儲需要Passion!德明利PCIe Gen5 SSD加速AI應(yīng)用落地

    存儲需要Passion!德明利PCIe Gen5 SSD加速AI應(yīng)用落地
    的頭像 發(fā)表于 01-21 16:33 ?35次閱讀
    存儲需要Passion!德明利PCIe Gen5 SSD<b class='flag-5'>加速</b><b class='flag-5'>AI</b>應(yīng)用<b class='flag-5'>落地</b>

    Alpine操作系統(tǒng)社區(qū)發(fā)布架構(gòu)版本

    近日,開源軟件世界和云計(jì)算領(lǐng)域重要的操作系統(tǒng)發(fā)行版社區(qū)Alpine Linux正式發(fā)布3.21最新版本,以完整的系統(tǒng)形態(tài)實(shí)現(xiàn)對架構(gòu)的原生支持,將有力促進(jìn)
    的頭像 發(fā)表于 12-10 11:12 ?361次閱讀

    直播報(bào)名丨第4講:AI檢測系統(tǒng)落地工具詳解

    阿丘工業(yè)AI學(xué)堂上線“AI檢測系統(tǒng)開發(fā)實(shí)戰(zhàn)”系列課程,全面涵蓋AI檢測系統(tǒng)開發(fā)從理論到實(shí)踐、從算法選擇到
    的頭像 發(fā)表于 11-23 01:05 ?168次閱讀
    直播報(bào)名丨第4講:<b class='flag-5'>AI</b>檢測<b class='flag-5'>系統(tǒng)</b><b class='flag-5'>落地</b>工具詳解

    英特爾攜手百度智能云加速AI落地

    大語言模型,并展示了一系列優(yōu)化策略和面向企業(yè)客戶的開放架構(gòu)AI軟件棧(OPEA),以幫助企業(yè)加速AI落地,并最大化地發(fā)揮整個
    的頭像 發(fā)表于 10-12 10:08 ?527次閱讀

    基于昇騰AI,迅軟件發(fā)布OrangePi AIpro 20T,共推AI應(yīng)用落地

    題,各界專家與商業(yè)領(lǐng)袖近2000人參與,聚焦大模型推理和客戶伙伴優(yōu)秀實(shí)踐,分享前沿觀點(diǎn),共同探索如何加速大模型創(chuàng)新與應(yīng)用落地的道路。迅軟件總經(jīng)理趙一帆先生受邀出席本屆
    的頭像 發(fā)表于 07-12 14:26 ?646次閱讀
    基于昇騰<b class='flag-5'>AI</b>,迅<b class='flag-5'>龍</b>軟件發(fā)布OrangePi AIpro 20T,共推<b class='flag-5'>AI</b>應(yīng)用<b class='flag-5'>落地</b>

    英偉達(dá)加速AI芯片迭代,推出Rubin架構(gòu)計(jì)劃

    在近日舉辦的COMPUTEX 2024展會上,英偉達(dá)CEO黃仁勛再次展現(xiàn)了公司在人工智能(AI)芯片領(lǐng)域的雄心壯志。他公布了下一代AI芯片架構(gòu)“Rubin”,這是繼今年3月發(fā)布的“Blackwell”
    的頭像 發(fā)表于 06-03 11:36 ?848次閱讀

    架構(gòu)實(shí)現(xiàn)AR應(yīng)用領(lǐng)域新突破,與影AR成功適配

    近日,架構(gòu)實(shí)現(xiàn)AR應(yīng)用領(lǐng)域新突破,與北京智融全景科技有限公司影AR遠(yuǎn)程指導(dǎo)系統(tǒng)V5.0成功適配。
    的頭像 發(fā)表于 04-17 15:21 ?757次閱讀

    Arm推動生成式AI落地邊緣!全新Ethos-U85 AI加速器支持Transformer 架構(gòu),性能提升四倍

    電子發(fā)燒友網(wǎng)報(bào)道(文/黃晶晶)在嵌入式領(lǐng)域,邊緣與端側(cè)AI推理需求不斷增長,Arm既有Helium 技術(shù)使 CPU 能夠執(zhí)行更多計(jì)算密集型的 AI 推理算法,也有Ethos 系列 AI 加速
    的頭像 發(fā)表于 04-16 09:10 ?4699次閱讀
    Arm推動生成式<b class='flag-5'>AI</b><b class='flag-5'>落地</b>邊緣!全新Ethos-U85 <b class='flag-5'>AI</b><b class='flag-5'>加速</b>器支持Transformer <b class='flag-5'>架構(gòu)</b>,性能提升四倍

    開發(fā)者手機(jī) AI - 目標(biāo)識別 demo

    功能簡介 該應(yīng)用是在Openharmony 4.0系統(tǒng)開發(fā)的一個目標(biāo)識別的AI應(yīng)用,旨在從上到下打通Openharmony AI系統(tǒng),展
    發(fā)表于 04-11 16:14

    NVIDIA在加速識因智能AI大模型落地應(yīng)用方面的重要作用介紹

    本案例介紹了 NVIDIA 在加速識因智能 AI 大模型落地應(yīng)用方面的重要作用。生成式大模型已廣泛應(yīng)用于各領(lǐng)域,通過學(xué)習(xí)人類思維方式,能快速挖掘海量內(nèi)容,滿足不同需求。
    的頭像 發(fā)表于 03-29 15:28 ?670次閱讀

    ONNX Runtime支持架構(gòu)AI推理生態(tài)再添新翼

    近日,備受矚目的AI推理框架開源社區(qū)ONNX Runtime宣布推出支持架構(gòu)的新版本1.17.0,這一里程碑式的更新意味著龍芯平臺上的AI推理應(yīng)用
    的頭像 發(fā)表于 03-27 10:58 ?767次閱讀

    英偉達(dá)發(fā)布最強(qiáng)AI加速卡Blackwell GB200

    英偉達(dá)在最近的GTC開發(fā)者大會上發(fā)布了其最新、最強(qiáng)大的AI加速卡——GB200。這款加速卡采用了新一代AI圖形處理器
    的頭像 發(fā)表于 03-20 11:38 ?1209次閱讀

    AI推理框架軟件ONNX Runtime正式支持架構(gòu)

    近日,知名AI推理框架開源社區(qū)ONNX Runtime正式發(fā)布支持架構(gòu)的版本1.17.0。
    的頭像 發(fā)表于 03-12 12:23 ?614次閱讀
    <b class='flag-5'>AI</b>推理框架軟件ONNX Runtime正式支持<b class='flag-5'>龍</b><b class='flag-5'>架構(gòu)</b>

    Tenstorrent將為日本LSTC新型邊緣2納米AI加速開發(fā)芯片

    加拿大AI芯片領(lǐng)域的初創(chuàng)公司Tenstorrent與日本尖端半導(dǎo)體技術(shù)中心(LSTC)達(dá)成了一項(xiàng)多層次合作協(xié)議。根據(jù)協(xié)議內(nèi)容,LSTC將采用Tenstorrent的世界級RISC-V架構(gòu)和芯片IP來開發(fā)其新型邊緣2納米人工智能
    的頭像 發(fā)表于 02-28 10:49 ?731次閱讀

    【國產(chǎn)FPGA+OMAPL138開發(fā)板體驗(yàn)】(原創(chuàng))5.FPGA的AI加速源代碼

    OMAP-L138(定點(diǎn)/浮點(diǎn)DSP C674x+ARM9)+ FPGA處理器的開發(fā)板。 編寫一個用于AI加速的FPGA程序是一個相當(dāng)復(fù)雜的過程,涉及硬件描述語言(如VHDL或Verilog)以及針對特定
    發(fā)表于 02-12 16:18