0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內(nèi)不再提示

關于深度學習硬件加速器的介紹和應用

西門子EDA ? 來源:djl ? 2019-10-11 14:59 ? 次閱讀

Chips&Media 成功采用 Mentor Catapult High-Level Synthesis (HLS) 平臺實現(xiàn)了首個計算機視覺 IP;

Chips&Media 通過 Catapult HLS 將模塊設計/驗證時間縮短了一半,并實現(xiàn)了關鍵的現(xiàn)場可編程門陣列 (FPGA) 演示系統(tǒng);

Catapult HLS 方法論使探索多種架構并為深度神經(jīng)網(wǎng)絡加速器尋找最佳實現(xiàn)方案成為了可能。

Mentor, A Siemens Business 宣布 Chips&Media 已成功部署 Mentor Catapult HLS 平臺,將使用深度神經(jīng)網(wǎng)絡 (DNN) 算法設計和驗證其 c.WAVE 計算機視覺 IP 的實時對象檢測。Chips&Media 是一家面向片上系統(tǒng) (SoC) 設計高性能、高質量視頻 IP 的領先供應商,其產(chǎn)品廣泛應用于汽車、監(jiān)控和消費電子領域。

Chips&Media 需要通過減少功能驗證時間、時序收斂、自定義和最終優(yōu)化來大幅提高生產(chǎn)力,把更多時間用于機器算法和架構的研發(fā)上,從而為客戶快速提供差異化的機器學習 IP。為實現(xiàn)這些目標,他們棄用了傳統(tǒng)的手工編碼寄存器傳輸級 (RTL) 流程,轉而采用 Catapult HLS 平臺,以使用 C 語言編寫算法和驗證平臺。與同一項目中使用 RTL 流程的團隊相比,HLS 設計和驗證團隊將項目時間縮短了一半。

“要應對以推理為目標的設備帶來的加速挑戰(zhàn),我們認為關鍵在于使用深度神經(jīng)網(wǎng)絡建立一個專注于功耗、性能和面積 (PPA) 并高度優(yōu)化的硬件架構,”Chips&Media 首席技術官 Mickey Jeon 表示?!癏LS 使我們能夠極其高效地完成這項工作。我們的項目取得了突出的成績,我們計劃在接下來的項目中部署應用 Catapult 的 HLS 流程。”

基于 DNN 的計算機視覺處理的特征,就是乘法/加法/累加的重復計算,同時通過神經(jīng)網(wǎng)絡層進行大量數(shù)據(jù)遷移。DNN 是在 Caffe 或 TensorFlow 等框架上開發(fā)的,然后在 C 模型中捕獲其算法。Chips&Media 將此算法 C 模型改進為可綜合的 C 代碼,并使用 Catapult HLS 平臺快速探索各種架構并綜合到 RTL 中,以找到此類設計的最佳解決方案。

“根據(jù)我們的觀察,在市場快速變化的多個應用領域,采用 Catapult HLS 是提高生產(chǎn)力來獲得成功的唯一途徑,”Mentor 數(shù)字設計和實施解決方案總經(jīng)理 Badru Agarwala 表示?!拔覀円恢迸c Chips&Media 密切合作,以確保他們平穩(wěn)過渡到 HLS。該平臺可以讓他們專注于算法/架構設計,而不是底層實現(xiàn)和調(diào)試等細節(jié),從而更快地把想法變成產(chǎn)品,然后推向市場?!?/p>

借助 Catapult HLS 平臺,設計人員便能利用行業(yè)標準 ANSI C++ 和 SystemC 來描述功能意圖,并將其提高到生產(chǎn)率更高的抽象層次。根據(jù)這些高層次的描述,Catapult 即可快速生成產(chǎn)品級的 RTL。Catapult 平臺將綜合與形式 C 屬性檢查功能相結合,以便及早發(fā)現(xiàn) C++/SystemC 級別的錯誤并在綜合之前全面驗證源代碼。高度交互的 Catapult 工作流程可提供對綜合過程的完全可見性和控制,使設計人員能夠迅速收斂到 PPA 的最佳實現(xiàn)方案。此外,Catapult 的高級功耗優(yōu)化功能也可以自動大幅降低動態(tài)功耗。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 計算機視覺
    +關注

    關注

    8

    文章

    1699

    瀏覽量

    46050
  • 深度學習
    +關注

    關注

    73

    文章

    5510

    瀏覽量

    121338
收藏 人收藏

    評論

    相關推薦

    數(shù)據(jù)中心中的FPGA硬件加速器

    ? 再來看一篇FPGA的綜述,我們都知道微軟包括國內(nèi)的云廠商其實都在數(shù)據(jù)中心的服務中部署了FPGA,所以這篇論文就以數(shù)據(jù)中心的視角,來看下FPGA這個硬件加速器。 還是一樣,想要論文原文的可以私信
    的頭像 發(fā)表于 01-14 10:29 ?73次閱讀
    數(shù)據(jù)中心中的FPGA<b class='flag-5'>硬件加速器</b>

    從版本控制到全流程支持:揭秘Helix Core如何成為您的創(chuàng)意加速器

    加速器
    龍智DevSecOps
    發(fā)布于 :2024年11月26日 13:42:47

    NPU在深度學習中的應用

    設計的硬件加速器,它在深度學習中的應用日益廣泛。 1. NPU的基本概念 NPU是一種專門針對深度學習算法優(yōu)化的處理
    的頭像 發(fā)表于 11-14 15:17 ?726次閱讀

    FPGA加速深度學習模型的案例

    FPGA(現(xiàn)場可編程門陣列)加速深度學習模型是當前硬件加速領域的一個熱門研究方向。以下是一些FPGA加速
    的頭像 發(fā)表于 10-25 09:22 ?284次閱讀

    適用于數(shù)據(jù)中心應用中的硬件加速器的直流/直流轉換解決方案

    電子發(fā)燒友網(wǎng)站提供《適用于數(shù)據(jù)中心應用中的硬件加速器的直流/直流轉換解決方案.pdf》資料免費下載
    發(fā)表于 08-26 09:38 ?0次下載
    適用于數(shù)據(jù)中心應用中的<b class='flag-5'>硬件加速器</b>的直流/直流轉換<b class='flag-5'>器</b>解決方案

    什么是神經(jīng)網(wǎng)絡加速器?它有哪些特點?

    神經(jīng)網(wǎng)絡加速器是一種專門設計用于提高神經(jīng)網(wǎng)絡計算效率的硬件設備。隨著深度學習技術的快速發(fā)展和廣泛應用,神經(jīng)網(wǎng)絡模型的復雜度和計算量急劇增加,對計算性能的要求也越來越高。傳統(tǒng)的通用處理
    的頭像 發(fā)表于 07-11 10:40 ?540次閱讀

    西門子推出Catapult AI NN軟件,賦能神經(jīng)網(wǎng)絡加速器設計

    西門子數(shù)字化工業(yè)軟件近日發(fā)布了Catapult AI NN軟件,這款軟件在神經(jīng)網(wǎng)絡加速器設計領域邁出了重要一步。Catapult AI NN軟件專注于在專用集成電路(ASIC)和芯片級系統(tǒng)(SoC)上實現(xiàn)神經(jīng)網(wǎng)絡的高層次綜合(HLS),為機器學習應用提供了
    的頭像 發(fā)表于 06-19 11:27 ?896次閱讀

    PSoC 6 MCUBoot和mbedTLS是否支持加密硬件加速

    v3.0,它的上限是 MCUBoot v1.8.1。 當前版本基于 MCUBoot v1.9.1,似乎支持加密硬件加速。 有什么最簡單的方法可以更新我的舊版引導加載,以便運行 MCUBoot v1.9.1? 順便說一下,我的 PSoC 是 CY8C624ABZI-S2
    發(fā)表于 05-29 08:17

    Elektrobit利用其首創(chuàng)的硬件加速軟件優(yōu)化汽車通信網(wǎng)絡的性能

    Elektrobit今日宣布推出 EB zoneo GatewayCore——首款支持、配置和集成現(xiàn)代微控制新一代硬件加速器的軟件產(chǎn)品,可應用于先進的汽車電子/電氣架構(基于被廣泛采用
    的頭像 發(fā)表于 04-17 09:51 ?382次閱讀

    用DE1-SOC進行硬件加速的2D N-Body重力模擬設計

    該項目的目標是創(chuàng)建一個用DE1-SOC進行硬件加速的2D N-Body重力模擬。
    的頭像 發(fā)表于 04-09 11:08 ?594次閱讀
    用DE1-SOC進行<b class='flag-5'>硬件加速</b>的2D N-Body重力模擬<b class='flag-5'>器</b>設計

    330-基于FMC接口的Kintex-7 XC7K325T PCIeX4 3U PXIe接口卡 圖形圖像硬件加速器

    標簽: Net FPGA , XC7K325T板卡 , XC7K325T處理板 , 軟件無線電處理平臺 , 圖形圖像硬件加速器
    的頭像 發(fā)表于 03-04 14:14 ?651次閱讀
    330-基于FMC接口的Kintex-7 XC7K325T PCIeX4 3U PXIe接口卡 圖形圖像<b class='flag-5'>硬件加速器</b>

    家居智能化,推動AI加速器的發(fā)展

    電子發(fā)燒友網(wǎng)報道(文/黃山明)AI加速芯片,也稱為人工智能加速器(AI Accelerator),是一種專為執(zhí)行機器學習深度學習任務而設計
    的頭像 發(fā)表于 02-23 00:18 ?4625次閱讀

    【國產(chǎn)FPGA+OMAPL138開發(fā)板體驗】(原創(chuàng))7.硬件加速Sora文生視頻源代碼

    完成,準備輸出視頻幀 // 調(diào)用硬件加速模塊進行文本到視頻幀的轉換 // 將文本緩沖區(qū)的內(nèi)容“傳遞”給硬件加速器 // TextToVideoHardwareAccelerator 是一個硬件模塊 // 它
    發(fā)表于 02-22 09:49

    音視頻解碼硬件加速:實現(xiàn)更流暢的播放效果

    隨著多媒體內(nèi)容的日益豐富和高清化,傳統(tǒng)的軟件解碼已經(jīng)難以滿足人們對流暢播放體驗的需求。因此,音視頻解碼硬件加速技術的出現(xiàn),為提升播放效果帶來了革命性的改變。 硬件加速的原理 硬件加速
    的頭像 發(fā)表于 02-21 14:40 ?1019次閱讀
    音視頻解碼<b class='flag-5'>器</b><b class='flag-5'>硬件加速</b>:實現(xiàn)更流暢的播放效果

    回旋加速器原理 回旋加速器的影響因素

    回旋加速器(Cyclotron)是一種用于加速帶電粒子的可再生粒子加速器。它的工作原理基于帶電粒子在恒定強磁場中的運動。本文將詳細介紹回旋加速器
    的頭像 發(fā)表于 01-30 10:02 ?4428次閱讀