0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

基于 ODLA 的異構(gòu) AI 硬件對(duì)接方案介紹

lhl545545 ? 來(lái)源:與非網(wǎng) ? 作者:與非網(wǎng) ? 2020-09-25 17:25 ? 次閱讀

在剛剛結(jié)束的 2020 云棲大會(huì)上,阿里云宣布對(duì)行業(yè)開源業(yè)界首個(gè)深度學(xué)習(xí)開放接口標(biāo)準(zhǔn) ODLA(Open Deep Learning API)。阿里云在今年 5 月份的 OCP 全球峰會(huì)上首次對(duì)外公布 ODLA 接口標(biāo)準(zhǔn),并宣布已率先在 Graphcore 等生態(tài)伙伴上獲得支持。IPU 是 Graphcore 為機(jī)器智能從零設(shè)計(jì)的 AI 處理器,通過(guò) ODLA 接口,開發(fā)者可以在 IPU 上快速跑通 AI Matrix 的各類模型。

基于 ODLA 的異構(gòu) AI 硬件對(duì)接方案介紹

張偉豐博士在 2020 OCP 全球峰會(huì)上公布 ODLA 接口標(biāo)準(zhǔn)

ODLA 是一個(gè)為加速深度學(xué)習(xí)的統(tǒng)一異構(gòu)硬件編程接口。ODLA 規(guī)范了深度學(xué)習(xí)計(jì)算任務(wù)的定義和執(zhí)行,實(shí)現(xiàn)上層應(yīng)用和底層異構(gòu)硬件平臺(tái)的解耦,讓 AI 異構(gòu)計(jì)算更簡(jiǎn)單,實(shí)踐代碼“生成一次,隨時(shí)鏈接,隨處執(zhí)行”的愿景。

“令人興奮的新應(yīng)用程序意味著我們對(duì)數(shù)據(jù)中心的期望比以往任何時(shí)候都要更高。我們希望通過(guò)使用更廣泛的硬件選擇,以更大的規(guī)模,擴(kuò)大操作類型范圍。ODLA 使我們能夠管理這種復(fù)雜性,并挖掘出這些出色的新技術(shù)的全部潛力?!盙raphcore 高級(jí)副總裁兼中國(guó)區(qū)總經(jīng)理盧濤表示。

阿里云開發(fā) ODLA 是為了解決異構(gòu)計(jì)算中存在許久的一個(gè)核心挑戰(zhàn)。ODLA 是輕量高效的異構(gòu)硬件統(tǒng)一接口標(biāo)準(zhǔn),可在異構(gòu)計(jì)算環(huán)境中實(shí)現(xiàn)效率最大化。在異構(gòu)計(jì)算環(huán)境中,軟件框架需要從專業(yè)芯片中獲得最高性能,需要多種類型處理器在一個(gè)通用平臺(tái)上協(xié)同工作,而每種處理器都需要針對(duì)其架構(gòu)和專業(yè)知識(shí)領(lǐng)域進(jìn)行某種程度的優(yōu)化,例如 AI 的稀疏性。API 提供的抽象級(jí)別可以適應(yīng)芯片架構(gòu)之間的差異。

基于 ODLA 的異構(gòu) AI 硬件對(duì)接方案

通過(guò) ODLA,在 Graphcore IPU 上技術(shù)適配和應(yīng)用部署的工作量可以實(shí)現(xiàn)大幅度降低,且實(shí)現(xiàn)效率大幅提升。另外,通過(guò) ODLA 可以更好的與 AI 計(jì)算框架進(jìn)行軟硬協(xié)同,快速利用現(xiàn)有的編譯優(yōu)化技術(shù),達(dá)到最佳性能。對(duì)于異構(gòu)任務(wù),ODLA 充當(dāng)該系統(tǒng)范圍通用語(yǔ)言與特定于架構(gòu)的優(yōu)化之間的接口或轉(zhuǎn)換器,該優(yōu)化可從 Graphcore 的 IPU 等設(shè)備實(shí)現(xiàn)最佳性能。

對(duì)于數(shù)據(jù)中心運(yùn)營(yíng)商而言,除了簡(jiǎn)化了新微處理器技術(shù)的集成之外,ODLA 還帶來(lái)了其他一系列好處。它支持通用和高性能的數(shù)據(jù)中心設(shè)置,并為高級(jí)應(yīng)用程序提供統(tǒng)一的加速框架。對(duì)于應(yīng)用程序開發(fā)人員來(lái)說(shuō),它減少了對(duì)不同架構(gòu)進(jìn)行重復(fù)優(yōu)化的需求,并應(yīng)該可以減少開發(fā)成本,縮短產(chǎn)品上市時(shí)間。

ODLA 在 2020 云棲大會(huì)上宣布的主要特性及優(yōu)勢(shì)包含:

透明接口層,零損耗。

接口抽象和統(tǒng)一,軟硬件解耦:通過(guò)面向 AI 的多粒度算子抽象,定義統(tǒng)一的接口,解耦具體軟硬件,平滑遷移業(yè)務(wù);實(shí)現(xiàn)代碼復(fù)用,提升開發(fā)和部署效率。

多模態(tài)執(zhí)行方式:支持多種執(zhí)行模式,覆蓋解釋執(zhí)行、編譯執(zhí)行、載入預(yù)編譯代碼等場(chǎng)景,兼容各種硬件的運(yùn)行模式。

AI 全場(chǎng)景支持:支持推理和訓(xùn)練,適配云、邊、端全場(chǎng)景 AI 業(yè)務(wù);擁有廣泛的算子定義和豐富的接口(設(shè)備管理、會(huì)話管理、執(zhí)行管理、事件同步 / 異步、資源查詢、性能監(jiān)控等)。

卓越的擴(kuò)展性,支持 AI 芯片廠家獨(dú)特屬性和自定義算子。

張偉豐博士在云棲大會(huì)上宣布開源 ODLA

Graphcore 公司相信,IPU 將成為下一代數(shù)據(jù)中心 AI 工作負(fù)載的核心。我們深知,我們的愿景需要 ODLA 在內(nèi)的諸多框架和工具,這些框架和工具能使我們的產(chǎn)品與其他同類最佳技術(shù)協(xié)同工作。

Graphcore 的聯(lián)合創(chuàng)始人兼首席執(zhí)行官 Nigel Toon 表示:“ODLA 優(yōu)雅地滿足了 Graphcore 新用戶的兩個(gè)最大需求。一是他們希望輕松地將我們的技術(shù)集成到現(xiàn)有的數(shù)據(jù)中心,二是他們希望確保最終的設(shè)置在從各個(gè)組件到整個(gè)系統(tǒng)的每個(gè)層級(jí)都能得到高度優(yōu)化?!?br /> 責(zé)任編輯:pj

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 處理器
    +關(guān)注

    關(guān)注

    68

    文章

    19342

    瀏覽量

    230223
  • AI
    AI
    +關(guān)注

    關(guān)注

    87

    文章

    31097

    瀏覽量

    269427
  • 阿里云
    +關(guān)注

    關(guān)注

    3

    文章

    965

    瀏覽量

    43116
收藏 人收藏

    評(píng)論

    相關(guān)推薦

    進(jìn)迭時(shí)空 K1 系列 8 核 64 位 RISC - V AI CPU 芯片介紹

    需要大量向量計(jì)算的任務(wù)中表現(xiàn)出色,例如圖像和視頻處理等。(三)通用的 AI 算力融合方式 :以 CPU 核融合方式提供原生 AI 算力。生態(tài)對(duì)接 :實(shí)現(xiàn)與所有主流 AI 生態(tài)的快速
    發(fā)表于 01-06 17:37

    唯創(chuàng)知音WT3000A AI智能對(duì)話方案介紹

    AI
    WT-深圳唯創(chuàng)知音電子有限公司
    發(fā)布于 :2025年01月02日 11:02:41

    壁仞科技聯(lián)合中國(guó)電信等合作伙伴共同發(fā)布智算異構(gòu)四芯混訓(xùn)解決方案

    工智能實(shí)驗(yàn)室等發(fā)布了“智算異構(gòu)四芯混訓(xùn)解決方案”,打造算力、網(wǎng)絡(luò)、平臺(tái)、通信庫(kù)、框架全棧異構(gòu)方案,實(shí)現(xiàn)異構(gòu)算力的互聯(lián)互通、互調(diào)互算,基于壁仞
    的頭像 發(fā)表于 12-07 17:56 ?1093次閱讀

    汽車異構(gòu)硬件平臺(tái)開發(fā)如何進(jìn)行靜態(tài)代碼分析

    隨著汽車軟件開發(fā)復(fù)雜度的提升,異構(gòu)硬件平臺(tái)的應(yīng)用已成為必然趨勢(shì)。多編譯器環(huán)境的引入不僅是技術(shù)發(fā)展的自然產(chǎn)物,更是解決日益增長(zhǎng)的功能需求和技術(shù)挑戰(zhàn)的有效途徑。在此背景下,Helix QAC 作為一款
    的頭像 發(fā)表于 10-09 16:15 ?541次閱讀
    汽車<b class='flag-5'>異構(gòu)</b><b class='flag-5'>硬件</b>平臺(tái)開發(fā)如何進(jìn)行靜態(tài)代碼分析

    深蕾半導(dǎo)體ASTRA AI詳細(xì)介紹

    ASTRA AI芯片是一種集成了多種計(jì)算單元(包括NPU/uNPU、GPU、CPU、DSP等)的異構(gòu)計(jì)算系統(tǒng)級(jí)芯片(SOC),專為處理復(fù)雜的人工智能(AI)任務(wù)而設(shè)計(jì)。這種設(shè)計(jì)使得ASTRA
    的頭像 發(fā)表于 09-12 16:49 ?402次閱讀
    深蕾半導(dǎo)體ASTRA <b class='flag-5'>AI</b>詳細(xì)<b class='flag-5'>介紹</b>

    淺談國(guó)產(chǎn)異構(gòu)雙核RISC-V+FPGA處理器AG32VF407的優(yōu)勢(shì)和應(yīng)用場(chǎng)景

    任務(wù)優(yōu)化計(jì)算資源,提高整體計(jì)算效率。 靈活性與可擴(kuò)展性 : FPGA的靈活性允許用戶根據(jù)需求重新配置硬件邏輯,實(shí)現(xiàn)高度定制化的解決方案。結(jié)合RISC-V的開放架構(gòu),用戶可以更容易地根據(jù)應(yīng)用需求調(diào)整
    發(fā)表于 08-31 08:32

    開啟全新AI時(shí)代 智能嵌入式系統(tǒng)快速發(fā)展——“第六屆國(guó)產(chǎn)嵌入式操作系統(tǒng)技術(shù)與產(chǎn)業(yè)發(fā)展論壇”圓滿結(jié)束

    操作系統(tǒng)標(biāo)準(zhǔn)化的最新進(jìn)展。 華為計(jì)算產(chǎn)業(yè)戰(zhàn)略規(guī)劃總監(jiān)周明耀在論壇上做了“華為在AI硬件上積累及生態(tài)戰(zhàn)略”專題報(bào)告。周明耀介紹華為計(jì)算產(chǎn)業(yè)在AI
    發(fā)表于 08-30 17:24

    安謀科技異構(gòu)算力組合,破局生成式AI算力挑戰(zhàn)

    近日,此芯科技集團(tuán)有限公司(以下簡(jiǎn)稱“此芯科技”)AI PC戰(zhàn)略暨首款芯片發(fā)布會(huì)在上海舉行,正式推出了其首款專為AI PC打造的異構(gòu)高能效芯片產(chǎn)品——“此芯P1”。作為國(guó)產(chǎn)新一代AI
    的頭像 發(fā)表于 08-13 09:12 ?585次閱讀

    安謀科技異構(gòu)算力賦能AI計(jì)算,此芯科技首款AI PC芯片發(fā)布

    7月30日,此芯科技集團(tuán)有限公司(以下簡(jiǎn)稱“此芯科技”)AI PC戰(zhàn)略暨首款芯片發(fā)布會(huì)在上海舉行,正式推出了其首款專為AI PC打造的異構(gòu)高能效芯片產(chǎn)品——“此芯P1”。作為國(guó)產(chǎn)新一代AI
    發(fā)表于 07-31 14:36 ?1054次閱讀
    安謀科技<b class='flag-5'>異構(gòu)</b>算力賦能<b class='flag-5'>AI</b>計(jì)算,此芯科技首款<b class='flag-5'>AI</b> PC芯片發(fā)布

    異構(gòu)混訓(xùn)整合不同架構(gòu)芯片資源,提高算力利用率

    的解決方案。通過(guò)混合使用多種異構(gòu)芯片,可以充分利用不同芯片的優(yōu)勢(shì),提高算力利用率,降低算力成本,并推動(dòng)AI技術(shù)的廣泛應(yīng)用。 ? 異構(gòu)混訓(xùn)能夠整合不同架構(gòu)芯片資源 ? 在2024年世界人
    的頭像 發(fā)表于 07-18 00:11 ?3504次閱讀

    開發(fā)者手機(jī) AI - 目標(biāo)識(shí)別 demo

    。 NNRt host 實(shí)現(xiàn)了NNRt HDI接口功能,通過(guò)對(duì)接底層AI芯片接口為上層應(yīng)用提供NPU硬件推理的能力。 功能實(shí)現(xiàn) JS從相機(jī)數(shù)據(jù)流獲取一張圖片,調(diào)用Native的接口進(jìn)行目標(biāo)識(shí)別的處理
    發(fā)表于 04-11 16:14

    邁爾微視重磅推出高精度對(duì)接相機(jī)M4 Mega

    為移動(dòng)機(jī)器人、人形機(jī)器人貨物抓取、高精度對(duì)接提供3D視覺(jué)+AI一體化解決方案。
    的頭像 發(fā)表于 03-19 10:14 ?733次閱讀
    邁爾微視重磅推出高精度<b class='flag-5'>對(duì)接</b>相機(jī)M4 Mega

    高通NPU和異構(gòu)計(jì)算提升生成式AI性能?

    異構(gòu)計(jì)算的重要性不可忽視。根據(jù)生成式AI的獨(dú)特需求和計(jì)算負(fù)擔(dān),需要配備不同的處理器,如專注于AI工作負(fù)載的定制設(shè)計(jì)的NPU、CPU和GPU。
    的頭像 發(fā)表于 03-06 14:15 ?825次閱讀

    CES AI硬件層出不窮:你愿為AI的溢價(jià)買單嗎?

    硬件AI
    電子發(fā)燒友網(wǎng)官方
    發(fā)布于 :2024年01月30日 16:36:00