0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

Kria K26 SOM性能解決方案的對比分析

YCqV_FPGA_EETre ? 來源:FPGA開發(fā)圈 ? 作者:FPGA開發(fā)圈 ? 2021-07-02 14:13 ? 次閱讀

賽靈思的研究結(jié)果表明,K26 SOM 提供了比英偉達(dá) Jetson Nano 高出大約 3 倍的性能。此外,它的單位功耗性能較之英偉達(dá) Jetson TX2 提升了 2 倍。對于 SSD MobileNet-v1 這樣的網(wǎng)絡(luò),K26 SOM 的低時(shí)延、高性能深度學(xué)習(xí)處理單元 (DPU)提供了比 Nano 高出 4 倍甚至更高的性能。

01

與未來兼容的 Kria K26 SOM

智能應(yīng)用除了要求亞微秒級的時(shí)延,還需要具備私密性、低功耗、安全性和低成本。以 Zynq MPSoC 架構(gòu)為基礎(chǔ),Kria K26 SOM 提供了業(yè)界一流的單位功耗性能和更低的總體擁有成本,使之成為邊緣設(shè)備的理想選擇。

原始計(jì)算能力

就在邊緣設(shè)備上部署解決方案而言,硬件必須擁有充足的算力,才能處理先進(jìn) ML 算法工作負(fù)載。我們可以使用各種深度學(xué)習(xí)處理單元 (DPU) 配置對 Kria K26 SOM 進(jìn)行配置,還能根據(jù)性能要求,將最適用的配置集成到設(shè)計(jì)內(nèi)。

支持更低精度的數(shù)據(jù)類型

深度學(xué)習(xí)算法正在以極快的速度演進(jìn)發(fā)展,各種更低精度的數(shù)據(jù)類型和定制數(shù)據(jù)正在進(jìn)入使用。傳統(tǒng)的 GPU 廠商已無法滿足當(dāng)前的市場需求,而 Kria K26 SOM 能夠支持全系列數(shù)據(jù)類型精度,如 PF32、INT8、二進(jìn)制和其他定制數(shù)據(jù)類型。

運(yùn)算的能耗成本

低時(shí)延與低功耗

為了改善軟件可編程能力,GPU 架構(gòu)需要頻繁訪問外部 DDR。這種做法非常低效,有時(shí)候會對高帶寬設(shè)計(jì)要求構(gòu)成瓶頸。相反,Zynq MPSoC 架構(gòu)具有高能效,它的可重配置能

力便于開發(fā)者設(shè)計(jì)的應(yīng)用減少或不必訪問外部存儲器。這不僅有助于減少應(yīng)用的總功耗,也通過降低端到端時(shí)延改善了響應(yīng)能力。

典型 GPU 與 Zynq MPSoC 架構(gòu)

靈活性

與數(shù)據(jù)流固定的 GPU 不同,賽靈思硬件提供了靈活性用來專門地重新配置數(shù)據(jù)路徑,從而實(shí)現(xiàn)最大吞吐量并降低時(shí)延。此外,可編程的數(shù)據(jù)路徑也降低了對批處理的需求,而批處理是 GPU 的一個重大不足,需要在降低時(shí)延或提高吞吐量之間做出權(quán)衡取舍。Kria SOM 靈活的架構(gòu)已在稀疏網(wǎng)絡(luò)中展示出巨大潛力。

02

與英偉達(dá) Jetson 性能比較

深度學(xué)習(xí)模型性能比較

根據(jù)測試數(shù)據(jù),所有模型在 K26 SOM 上的性能數(shù)值均優(yōu)于英偉達(dá) Jetson Nano。而且對于 SSD Mobilenet-V1 等部分模型,吞吐量則為 Jetson Nano 的四倍以上,為 Jetson Tx2 的兩倍左右,從下表可以很容易地看到顯著的吞吐量提升。

FPS(時(shí)延優(yōu)化)

功耗測量

邊緣設(shè)備提供最佳性能這點(diǎn)非常重要,但同時(shí)必須降低能耗。賽靈思測量了英偉達(dá)和賽靈思 SOM 模塊在執(zhí)行具體模型時(shí)發(fā)生的峰值功率,結(jié)果很明顯,K26 SOM 優(yōu)于 Jetson Nano

3.5 倍,優(yōu)于 Jetson TX2 2.4 倍。

FPS/瓦

實(shí)際應(yīng)用性能比較

為了分析實(shí)際用例,我們選擇了一種準(zhǔn)確檢測和識別車輛牌照的基于機(jī)器學(xué)習(xí)的應(yīng)用。將 Uncanny Vision 行業(yè)領(lǐng)先的 ANPR 算法部署在 Kria SOM 上后,與英偉達(dá)用 Deepstream-SDK 完成的“車牌識別”的公開數(shù)據(jù)進(jìn)行比較,結(jié)果說明,Uncanny Vision 的 ANPR 流水線在針對 KV260 入門套件進(jìn)行優(yōu)化后,實(shí)現(xiàn)了超過 33fps 的吞吐量,顯著優(yōu)于英偉達(dá)基準(zhǔn)測試中 Jetson Nano 的 8pfs 和 Jetson Tx2 的 23fps。這種前所未有的性能水平為 ANPR 集成商和 OEM 廠商提供了優(yōu)于競爭對手的開發(fā)靈活性。

實(shí)際應(yīng)用測試顯示,K26 SOM 不僅在標(biāo)準(zhǔn)性能比較中表現(xiàn)極其優(yōu)異,并且在為開發(fā)者提供加速整體 AI 和視覺流水線所需的原始性能時(shí),效率也更高。通過對比,在標(biāo)準(zhǔn)的基準(zhǔn)測試領(lǐng)域之外,競爭解決方案傾向于提供較低效率水平,而且功耗較高。

文章出處:【微信公眾號:FPGA開發(fā)圈】

責(zé)任編輯:gt

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報(bào)投訴
  • 賽靈思
    +關(guān)注

    關(guān)注

    32

    文章

    1794

    瀏覽量

    131308
  • gpu
    gpu
    +關(guān)注

    關(guān)注

    28

    文章

    4743

    瀏覽量

    128997
  • 英偉達(dá)
    +關(guān)注

    關(guān)注

    22

    文章

    3780

    瀏覽量

    91205

原文標(biāo)題:白皮書 | Kria K26:邊緣端視覺 AI 理想平臺

文章出處:【微信號:FPGA-EETrend,微信公眾號:FPGA開發(fā)圈】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏

    評論

    相關(guān)推薦

    鴻蒙原生頁面高性能解決方案上線OpenHarmony社區(qū) 助力打造高性能原生應(yīng)用

    隨著HarmonyOS NEXT的正式推出,鴻蒙原生應(yīng)用開發(fā)熱度高漲,數(shù)量激增。但在三方應(yīng)用鴻蒙化進(jìn)程中,性能問題頻出。為此,HarmonyOS NEXT推出了一整套原生頁面高性能解決方案,包括
    發(fā)表于 01-02 18:00

    TNC連接器對比分析:與其他射頻連接器的性能對決

    德索工程師說道在射頻連接器領(lǐng)域,TNC連接器以其卓越的性能和廣泛的應(yīng)用而著稱。以下是TNC連接器與其他射頻連接器的性能對比分析: TNC連接器vs SMA連接器 頻率范圍:TNC連接器的工作頻率
    的頭像 發(fā)表于 12-17 10:58 ?161次閱讀
    TNC連接器<b class='flag-5'>對比分析</b>:與其他射頻連接器的<b class='flag-5'>性能</b>對決

    廣和通率先推出5G融合Wi-Fi 7智能解決方案

    近期,廣和通率先推出5G融合Wi-Fi 7智能解決方案,以高性能、高速率、高可靠的無線連接幫助客戶快速迭代智能終端。目前,該5G+Wi-Fi 7智能解決方案已在智能手持客戶商用,幫助客戶以更優(yōu)成本、更短開發(fā)周期邁向高速連接。
    的頭像 發(fā)表于 12-06 15:11 ?334次閱讀

    RoCE與IB對比分析(二):功能應(yīng)用篇

    在上一篇中,我們對RoCE、IB的協(xié)議棧層級進(jìn)行了詳細(xì)的對比分析,二者本質(zhì)沒有不同,但基于實(shí)際應(yīng)用的考量,RoCE在開放性、成本方面更勝一籌。本文我們將繼續(xù)分析RoCE和IB在擁塞控制、QoS、ECMP三個關(guān)鍵功能中的性能表現(xiàn)。
    的頭像 發(fā)表于 11-15 14:03 ?315次閱讀
    RoCE與IB<b class='flag-5'>對比分析</b>(二):功能應(yīng)用篇

    億佰特污水監(jiān)控系統(tǒng)智能解決方案,精確感知、精細(xì)管理!

    億佰特污水監(jiān)控系統(tǒng)智能解決方案,精確感知、精細(xì)管理!
    的頭像 發(fā)表于 11-01 08:07 ?194次閱讀
    億佰特污水監(jiān)控系統(tǒng)智<b class='flag-5'>能解決方案</b>,精確感知、精細(xì)管理!

    單臂螺旋天線:無線通信中的高效能解決方案

    深圳特信電子|單臂螺旋天線:無線通信中的高效能解決方案
    的頭像 發(fā)表于 10-31 09:04 ?211次閱讀

    對比分析點(diǎn)焊機(jī)與傳統(tǒng)焊接方法

    在焊接技術(shù)的演進(jìn)歷程中,點(diǎn)焊機(jī)憑借其高效、精確與自動化的特性,在現(xiàn)代工業(yè)制造中迅速崛起,成為現(xiàn)代工業(yè)制造中的重要工具。相較于歷史悠久的傳統(tǒng)焊接方式,點(diǎn)焊機(jī)展現(xiàn)了諸多獨(dú)特優(yōu)勢。以下我們將從點(diǎn)焊機(jī)的工作原理、優(yōu)缺點(diǎn)及應(yīng)用領(lǐng)域三大維度,對兩者進(jìn)行細(xì)致入微的對比分析。
    的頭像 發(fā)表于 09-12 11:52 ?454次閱讀

    網(wǎng)關(guān)和路由器的對比分析

    網(wǎng)關(guān)和路由器作為計(jì)算機(jī)網(wǎng)絡(luò)中的關(guān)鍵設(shè)備,各自承擔(dān)著不同的角色和功能。下面將從定義、功能、應(yīng)用場景、性能等多個方面對網(wǎng)關(guān)和路由器進(jìn)行對比分析。
    的頭像 發(fā)表于 08-27 10:20 ?1219次閱讀

    激光錫焊與回流焊接對焊點(diǎn)影響的對比分析

    針對電子裝聯(lián)技術(shù)的特點(diǎn),激光錫焊與回流焊接在對焊點(diǎn)影響方面做以下對比分析。
    的頭像 發(fā)表于 08-23 11:19 ?472次閱讀

    交流伺服電機(jī)與直流伺服電機(jī)的對比分析

    伺服電機(jī)作為現(xiàn)代工業(yè)自動化領(lǐng)域的核心動力元件,廣泛應(yīng)用于各種高精度、高效率的運(yùn)動控制系統(tǒng)中。其中,交流伺服電機(jī)和直流伺服電機(jī)作為兩種主要的伺服電機(jī)類型,各有其獨(dú)特的工作原理、性能特點(diǎn)和應(yīng)用場景。本文將對這兩種伺服電機(jī)進(jìn)行詳細(xì)的對比分析,以期為工程師和技術(shù)人員在實(shí)際應(yīng)用中提
    的頭像 發(fā)表于 06-24 14:40 ?901次閱讀

    貿(mào)澤開售適用于工業(yè)、醫(yī)療和機(jī)器人應(yīng)用的AMD/Xilinx Kria K24 SOM

    機(jī)器人、工廠自動化等)提供合適的功率、成本和性能。 ? 貿(mào)澤供應(yīng)的AMD/Xilinx Kria? K24 SOMKria?
    發(fā)表于 06-21 15:24 ?917次閱讀
    貿(mào)澤開售適用于工業(yè)、醫(yī)療和機(jī)器人應(yīng)用的AMD/Xilinx <b class='flag-5'>Kria</b> <b class='flag-5'>K</b>24 <b class='flag-5'>SOM</b>

    SD卡、MicroSD卡和SD NAND的性能與應(yīng)用對比

    在當(dāng)前豐富多元的存儲解決方案領(lǐng)域,SD卡、MicroSD卡以及SD NAND憑借其各自的獨(dú)特優(yōu)勢和特定的使用情景,贏得了市場的廣泛認(rèn)可。每種存儲技術(shù)都展現(xiàn)了其獨(dú)到之處,為用戶帶來了多樣化的選擇。接下來,MK米客方德將深入探討這三種存儲介質(zhì)的性能、特點(diǎn)以及適用領(lǐng)域,提供一份
    的頭像 發(fā)表于 06-14 15:48 ?898次閱讀
    SD卡、MicroSD卡和SD NAND的<b class='flag-5'>性能</b>與應(yīng)用<b class='flag-5'>對比</b>

    控制繼電器與PLC的對比分析

    將對控制繼電器和PLC進(jìn)行詳細(xì)的對比分析,旨在幫助讀者更好地理解兩者的差異,以便在實(shí)際應(yīng)用中做出更合適的選擇。
    的頭像 發(fā)表于 06-03 15:01 ?1.8w次閱讀

    火電廠凝汽器不停車在線清洗與凝汽器停車清洗八種技術(shù)對比分析

    通過凝汽器結(jié)垢對發(fā)電機(jī)組運(yùn)行安全性和經(jīng)濟(jì)性的影響分析,以及對火電行業(yè)現(xiàn)有凝汽器清洗技術(shù)的優(yōu)劣對比介紹,并通過火電廠凝汽器在線化學(xué)清洗技術(shù)案例,對清洗前后凝汽器運(yùn)行性能數(shù)據(jù)進(jìn)行了對比分析
    的頭像 發(fā)表于 03-21 19:57 ?483次閱讀
    火電廠凝汽器不停車在線清洗與凝汽器停車清洗八種技術(shù)<b class='flag-5'>對比分析</b>

    DC電源模塊與AC電源模塊的對比分析

    DC電源模塊與AC電源模塊的對比分析 BOSHIDA DC電源模塊和AC電源模塊是兩種常見的電源模塊,它們在供電方式、穩(wěn)定性、適用范圍等方面有所不同,下面是它們的對比分析: 1. 供電方式: DC
    的頭像 發(fā)表于 01-15 14:01 ?961次閱讀
    DC電源模塊與AC電源模塊的<b class='flag-5'>對比分析</b>