0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

賽靈思Kria K26 SOM應(yīng)運而生為ML邊緣應(yīng)用開發(fā)提供了更加理想的選擇

Xilinx賽靈思官微 ? 來源:Xilinx賽靈思官微 ? 作者:Xilinx賽靈思官微 ? 2021-07-01 11:52 ? 次閱讀

隨著人工智能機器學習算法取得一系列新進展

眾多高計算強度的應(yīng)用正在被部署到邊緣設(shè)備上

當下,業(yè)界迫切需要一種高效率的硬件

既能高效率地執(zhí)行復(fù)雜算法

又能適應(yīng)這種技術(shù)的快速演進

在此背景下,賽靈思 Kria K26 SOM應(yīng)運而生

為 ML 邊緣應(yīng)用開發(fā)提供了更加理想的選擇

賽靈思的研究結(jié)果表明,K26 SOM 提供了比英偉達 Jetson Nano 高出大約 3 倍的性能。此外,它的單位功耗性能較之英偉達 Jetson TX2 提升了 2 倍。對于 SSD MobileNet-v1 這樣的網(wǎng)絡(luò),K26 SOM 的低時延、高性能深度學習處理單元 (DPU)提供了比 Nano 高出 4 倍甚至更高的性能。

01

與未來兼容的 Kria K26 SOM

智能應(yīng)用除了要求亞微秒級的時延,還需要具備私密性、低功耗、安全性和低成本。以 Zynq MPSoC 架構(gòu)為基礎(chǔ),Kria K26 SOM 提供了業(yè)界一流的單位功耗性能和更低的總體擁有成本,使之成為邊緣設(shè)備的理想選擇。

原始計算能力

就在邊緣設(shè)備上部署解決方案而言,硬件必須擁有充足的算力,才能處理先進 ML 算法工作負載。我們可以使用各種深度學習處理單元 (DPU) 配置對 Kria K26 SOM 進行配置,還能根據(jù)性能要求,將最適用的配置集成到設(shè)計內(nèi)。

支持更低精度的數(shù)據(jù)類型

深度學習算法正在以極快的速度演進發(fā)展,各種更低精度的數(shù)據(jù)類型和定制數(shù)據(jù)正在進入使用。傳統(tǒng)的 GPU 廠商已無法滿足當前的市場需求,而 Kria K26 SOM 能夠支持全系列數(shù)據(jù)類型精度,如 PF32、INT8、二進制和其他定制數(shù)據(jù)類型。

低時延與低功耗

為了改善軟件可編程能力,GPU 架構(gòu)需要頻繁訪問外部 DDR。這種做法非常低效,有時候會對高帶寬設(shè)計要求構(gòu)成瓶頸。相反,Zynq MPSoC 架構(gòu)具有高能效,它的可重配置能

力便于開發(fā)者設(shè)計的應(yīng)用減少或不必訪問外部存儲器。這不僅有助于減少應(yīng)用的總功耗,也通過降低端到端時延改善了響應(yīng)能力。

靈活性

與數(shù)據(jù)流固定的 GPU 不同,賽靈思硬件提供了靈活性用來專門地重新配置數(shù)據(jù)路徑,從而實現(xiàn)最大吞吐量并降低時延。此外,可編程的數(shù)據(jù)路徑也降低了對批處理的需求,而批處理是 GPU 的一個重大不足,需要在降低時延或提高吞吐量之間做出權(quán)衡取舍。Kria SOM 靈活的架構(gòu)已在稀疏網(wǎng)絡(luò)中展示出巨大潛力。

02

與英偉達 Jetson 性能比較

深度學習模型性能比較

根據(jù)測試數(shù)據(jù),所有模型在 K26 SOM 上的性能數(shù)值均優(yōu)于英偉達 Jetson Nano。而且對于 SSD Mobilenet-V1 等部分模型,吞吐量則為 Jetson Nano 的四倍以上,為 Jetson Tx2 的兩倍左右,從下表可以很容易地看到顯著的吞吐量提升。

功耗測量

邊緣設(shè)備提供最佳性能這點非常重要,但同時必須降低能耗。賽靈思測量了英偉達和賽靈思 SOM 模塊在執(zhí)行具體模型時發(fā)生的峰值功率,結(jié)果很明顯,K26 SOM 優(yōu)于 Jetson Nano

3.5 倍,優(yōu)于 Jetson TX2 2.4 倍。

實際應(yīng)用性能比較

為了分析實際用例,我們選擇了一種準確檢測和識別車輛牌照的基于機器學習的應(yīng)用。將 Uncanny Vision 行業(yè)領(lǐng)先的 ANPR 算法部署在 Kria SOM 上后,與英偉達用 Deepstream-SDK 完成的“車牌識別”的公開數(shù)據(jù)進行比較,結(jié)果說明,Uncanny Vision 的 ANPR 流水線在針對 KV260 入門套件進行優(yōu)化后,實現(xiàn)了超過 33fps 的吞吐量,顯著優(yōu)于英偉達基準測試中 Jetson Nano 的 8pfs 和 Jetson Tx2 的 23fps。這種前所未有的性能水平為 ANPR 集成商和 OEM 廠商提供了優(yōu)于競爭對手的開發(fā)靈活性。

實際應(yīng)用測試顯示,K26 SOM 不僅在標準性能比較中表現(xiàn)極其優(yōu)異,并且在為開發(fā)者提供加速整體 AI 和視覺流水線所需的原始性能時,效率也更高。通過對比,在標準的基準測試領(lǐng)域之外,競爭解決方案傾向于提供較低效率水平,而且功耗較高。

編輯:jq

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • gpu
    gpu
    +關(guān)注

    關(guān)注

    28

    文章

    4743

    瀏覽量

    128997
  • 人工智能
    +關(guān)注

    關(guān)注

    1791

    文章

    47352

    瀏覽量

    238777
  • SOM
    SOM
    +關(guān)注

    關(guān)注

    0

    文章

    59

    瀏覽量

    15735

原文標題:白皮書 | Kria K26:邊緣端視覺 AI 理想平臺

文章出處:【微信號:賽靈思,微信公眾號:Xilinx賽靈思官微】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏

    評論

    相關(guān)推薦

    低溫失效的原因,有沒有別的方法或者一些見解?

    低溫失效的原因,有沒有別的方法或者一些見解。就是芯片工作溫度在100°--40°區(qū)間,然后呢我們到了0°以下就不工作了,然后在低溫的情況下監(jiān)測電流和電壓都正常,頻率也都正常,頻
    發(fā)表于 12-30 16:28

    Silicon Labs攜手Eta Compute簡化邊緣ML開發(fā)

    Silicon Labs(芯科科技)與 Eta Compute近期共同宣布建立合作伙伴關(guān)系,將支持產(chǎn)品開發(fā)人員將機器學習(ML)高級功能無縫集成到其邊緣ML嵌入式產(chǎn)品中,以添加多樣應(yīng)用
    的頭像 發(fā)表于 12-12 10:26 ?177次閱讀

    TI解讀:嵌啟未來 邊緣AI不邊緣

    的創(chuàng)新半導(dǎo)體、直觀的軟件和設(shè)計專業(yè)知識可以幫助您轉(zhuǎn)變設(shè)計,使其更智能、更安全、適應(yīng)性更強。 隨著物聯(lián)網(wǎng)技術(shù)的飛速發(fā)展, 邊緣計算正逐漸成為實現(xiàn)高效數(shù)據(jù)處理和實時決策的關(guān)鍵技術(shù)。 在這一背景下,邊緣 AI 應(yīng)運而生,它通過將
    的頭像 發(fā)表于 12-09 14:18 ?565次閱讀
    TI解讀:嵌啟未來 <b class='flag-5'>邊緣</b>AI不<b class='flag-5'>邊緣</b>

    云端ai開發(fā)環(huán)境怎么樣

    隨著云計算技術(shù)的成熟與普及,云端AI開發(fā)環(huán)境應(yīng)運而生,為AI開發(fā)提供一個高效、靈活、可擴展的開發(fā)
    的頭像 發(fā)表于 10-24 09:37 ?198次閱讀

    智能安全帶是時代應(yīng)運而生的產(chǎn)物

    面對傳統(tǒng)安全帶的種種不足,智能安全帶應(yīng)運而生。它集成了現(xiàn)代傳感技術(shù)、物聯(lián)網(wǎng)技術(shù)、大數(shù)據(jù)分析等前沿科技,實現(xiàn)對高空作業(yè)工人安全的全方位、智能化監(jiān)控與管理。智能安全帶不僅能夠?qū)崟r監(jiān)測工人的身體狀態(tài)
    的頭像 發(fā)表于 08-05 11:07 ?292次閱讀

    EOS智慧營銷設(shè)計平臺:精準高效可擴展的營銷新選擇

    隨著人工智能、大數(shù)據(jù)和信息技術(shù)的不斷發(fā)展,企業(yè)需要更高效、更精準的工具來設(shè)計和實施營銷策略。這時,EOS智慧營銷設(shè)計平臺應(yīng)運而生,為企業(yè)提供全新的營銷解決方案。
    的頭像 發(fā)表于 07-24 14:07 ?372次閱讀
    EOS智慧營銷設(shè)計平臺:精準高效可擴展的營銷新<b class='flag-5'>選擇</b>

    快訊 | 發(fā)展新質(zhì)生產(chǎn)力問道?如何下好“創(chuàng)新棋”?

    7月11日,南湖區(qū)委宣傳部、清華大學馬克主義學院共同帶隊一行蒞臨圍繞時頻新質(zhì)生產(chǎn)力創(chuàng)新層面進行實地調(diào)研,副總經(jīng)理田永和、對外合作部
    的頭像 發(fā)表于 07-12 13:31 ?502次閱讀
    <b class='flag-5'>賽</b><b class='flag-5'>思</b>快訊 | 發(fā)展新質(zhì)生產(chǎn)力問道<b class='flag-5'>賽</b><b class='flag-5'>思</b>?<b class='flag-5'>賽</b><b class='flag-5'>思</b>如何下好“創(chuàng)新棋”?

    FPGA下載問題

    在ARM開發(fā)中,通??晒?b class='flag-5'>選擇的下載器有多種。清華的FPGA,除了官方的專用下載器,有其他的下載器可以使用嗎?使用下載器可以嗎?
    發(fā)表于 06-23 12:28

    貿(mào)澤開售適用于工業(yè)、醫(yī)療和機器人應(yīng)用的AMD/Xilinx Kria K24 SOM

    機器人、工廠自動化等)提供合適的功率、成本和性能。 ? 貿(mào)澤供應(yīng)的AMD/Xilinx Kria? K24 SOMKria?
    發(fā)表于 06-21 15:24 ?917次閱讀
    貿(mào)澤開售適用于工業(yè)、醫(yī)療和機器人應(yīng)用的AMD/Xilinx <b class='flag-5'>Kria</b> <b class='flag-5'>K</b>24 <b class='flag-5'>SOM</b>

    給我一個FPGA,可以撬起所有顯示的接口和面板

    兼顧內(nèi)外屏幕。 對于的FPGA來說,可以根據(jù)FHD、UHD、8K的性能需求,來選擇對應(yīng)的FPGA產(chǎn)品系列。 產(chǎn)品這部分,據(jù)介紹,對于
    發(fā)表于 04-25 18:10

    智能化加速,AI邊緣計算盒子提供強力支持!

    電子發(fā)燒友網(wǎng)報道(文/李彎彎)隨著數(shù)字化時代的到來,數(shù)據(jù)量呈爆炸式增長,對數(shù)據(jù)處理的速度和效率提出了更高的要求。傳統(tǒng)的云計算模式已經(jīng)無法滿足一些場景的智能化需求。因此,邊緣計算應(yīng)運而生,而邊緣計算
    的頭像 發(fā)表于 04-12 01:10 ?5300次閱讀
    智能化加速,AI<b class='flag-5'>邊緣</b>計算盒子<b class='flag-5'>提供</b>強力支持!

    FPGA flash操作原理

    FPGA flash操作原理分享
    的頭像 發(fā)表于 04-09 15:03 ?1018次閱讀

    智能邊緣計算網(wǎng)關(guān)有哪些優(yōu)勢?

    在當今時代,數(shù)據(jù)已經(jīng)成為驅(qū)動業(yè)務(wù)決策的關(guān)鍵因素。然而,傳統(tǒng)的數(shù)據(jù)處理方式往往存在延遲,無法滿足實時性要求。此時,智能邊緣計算網(wǎng)關(guān)應(yīng)運而生,它能夠?qū)?shù)據(jù)處理和分析的能力從中心服務(wù)器轉(zhuǎn)移至設(shè)備邊緣
    的頭像 發(fā)表于 04-03 14:39 ?352次閱讀

    物聯(lián)網(wǎng)邊緣網(wǎng)關(guān)優(yōu)勢有哪些及相關(guān)優(yōu)勢產(chǎn)品

    隨著物聯(lián)網(wǎng)技術(shù)的快速發(fā)展,越來越多的設(shè)備接入網(wǎng)絡(luò),數(shù)據(jù)交互日益頻繁,對數(shù)據(jù)處理和傳輸?shù)囊笠苍絹碓礁摺T谶@樣的背景下,物聯(lián)網(wǎng)邊緣網(wǎng)關(guān)應(yīng)運而生,以其低延遲、減少帶寬消耗、提高數(shù)據(jù)質(zhì)量和安全性等優(yōu)勢,為
    的頭像 發(fā)表于 03-26 15:20 ?349次閱讀
    物聯(lián)網(wǎng)<b class='flag-5'>邊緣</b>網(wǎng)關(guān)優(yōu)勢有哪些及相關(guān)優(yōu)勢產(chǎn)品

    邊緣計算網(wǎng)關(guān)與邊緣計算的融合之道

    隨著物聯(lián)網(wǎng)、大數(shù)據(jù)和人工智能的飛速發(fā)展,數(shù)據(jù)處理和分析的需求呈現(xiàn)出爆炸式增長。傳統(tǒng)的中心化數(shù)據(jù)處理模式已難以滿足實時性、低延遲和高帶寬的需求,邊緣計算應(yīng)運而生,成為解決這一難題的關(guān)鍵技術(shù)。而邊緣計算
    的頭像 發(fā)表于 02-26 16:29 ?469次閱讀
    <b class='flag-5'>邊緣</b>計算網(wǎng)關(guān)與<b class='flag-5'>邊緣</b>計算的融合之道