電子發(fā)燒友網(wǎng)報道(文/黃晶晶)邊緣AI應用需要更多的高性能計算和算力的支持,AMD的Versal和Zynq系列產(chǎn)品一直支持醫(yī)療、交通、智能零售、智能工廠、智能城市等領域的邊緣AI落地。最近,AMD宣布擴展 AMD Versal? 自適應片上系統(tǒng)( SoC)產(chǎn)品組合,推出全新第二代 VersalAI Edge系列和第二代 VersalPrime系列自適應 SoC,其將預處理、AI 推理與后處理集成于單器件中,能夠為 AI 驅動型嵌入式系統(tǒng)提供端到端加速。
AI驅動型嵌入式系統(tǒng)的三個階段
在嵌入式系統(tǒng)中,預處理、AI推理、后處理是AI驅動型嵌入式系統(tǒng)的三個重要階段。
在預處理器部分,主要是各類傳感器包括毫米波雷達、激光雷達、攝像頭等進行處理與融合、數(shù)據(jù)調節(jié)等等???a href="http://wenjunhu.com/v/tag/1315/" target="_blank">編程邏輯能夠非常靈活,實時地支持各類傳感器接口,保證低延時、穩(wěn)定運算,并且在現(xiàn)場部署之后還能夠升級。
在推理過程當中一般使用矢量處理器,市場上已有很多類型。在后處理階段,通常使用高性能的嵌入式CPU。
另外,也可以通過第一代Versal AI Edge系列產(chǎn)品當中的可編程邏輯來做預處理,用矢量處理或者人工智能引擎來做推理。但是在后處理過程需要加上外部的處理器。無論如何,此前還沒有哪一類處理器能夠針對這三個階段進行優(yōu)化。
AMD自適應與嵌入式計算事業(yè)部( AECG) Versal產(chǎn)品營銷總監(jiān)Manuel Uhm分析,采用多顆芯片會給整個嵌入式系統(tǒng)帶來諸多限制。例如更高的功率、供電復雜性、更高的占板面積和終端系統(tǒng)尺寸,以及更高的內存要求,芯片間通信帶來的時延,更多安全漏洞和故障點,還有板卡設計的工作量等。
此次,AMD嵌入式系統(tǒng)的單芯片智能性方案推出兩個系列的產(chǎn)品,第二代Versal AI Edge系列,面向AI驅動型嵌入式系統(tǒng);以及第二代Versal Prime系列,面向經(jīng)典嵌入式系統(tǒng)。較上一代產(chǎn)品,采用下一代AI引擎帶來高達3倍的每瓦TOPS,采用全新高性能集成CPU帶來高達10標的標量計算。通過AMD可編程邏輯實現(xiàn)世界領先的自適應計算。
第二代Versal自適應SoC——單芯片智能性
第二代Versal自適應SoC單芯片就能實現(xiàn)三個階段的加速。具體來看,預處理階段,AMD可編程邏輯進行傳感器融合和數(shù)據(jù)調節(jié)。此外還加入新的硬圖像和視頻處理,無需可編程邏輯進行處理。
下一代AI引擎AIE-ML v2可以實現(xiàn)高達3倍的每瓦TOPS,實現(xiàn)高效AI推理。基于AMD的VitisAI開發(fā)環(huán)境進行快速部署,開發(fā)者可以使用他們原本非常熟悉的開源工具,比如說PyTorch、TensorFlow等等在Vitis中進行優(yōu)化、推理。
有了AI引擎的加持,可以支持更多的數(shù)據(jù)類型,支持不同的精度和吞吐量,比如支持共享指數(shù)數(shù)據(jù)類型,可以在提高吞吐量的情況下不減損它的精準度。
AMD自適應與嵌入式計算事業(yè)部 Versal AI Edge系列高級產(chǎn)品線經(jīng)理Steph Gauthie分析,二代Versal AI Edge系列器件中的DenseTOPS,以數(shù)據(jù)類型MX6來看,算力最高達到370TFLOPS。如果采用稀疏度計算,性能可以翻番,同時它還可以達到370TFLOPS。以INT8來看最高端可以做到184TOPS。另外,采用AIE-MLv2,還能夠做一些數(shù)據(jù)信號的處理,比如說FIR、FFT等等。
CPU性能大幅提升,實現(xiàn)高達10倍的標量計算。集成2-8個CortexA78AE內核,每核心最高頻率高達2.2GHz,以及高達200.3K的DMIPS算力。10個ArmCortex-R52實時處理器。每核心最高頻率高達1.05GHz,高達28.5K的DMIPS算力。
考慮到邊緣計算對于信息安全和功能安全的要求,還能夠支持ASIL D、SIL 3等級規(guī)格,可應用于自動駕駛和工業(yè)領域。
Steph Gauthie舉例,在高級自動駕駛輔助系統(tǒng)L2和L3中,作為單芯片域控制器與前一代AIEdge相比在相近的功率資源下圖像處理能力增加4倍。
此外,智慧城市的攝像頭系統(tǒng)中,與前一代AIEdge相比每路視頻流占板面板縮小65%。應用于專業(yè)的音視頻和廣播的視頻流,與Zyng MPSoC相比,能夠提供2倍的視頻處理能力,每路視頻流占板面積縮小35%。
總之,第二代Versal系列產(chǎn)品面向AI驅動型及經(jīng)典嵌入式系統(tǒng)的中央計算。
已應用于汽車視覺系統(tǒng)等
在基于攝像頭的3D感知視覺案例中,我們可以看到數(shù)據(jù)預處理完成后被傳輸?shù)紸I引擎,利用3D模型比如BEVFormer俯瞰視覺模型進行處理,再到應用處理單元進行行為模式的規(guī)劃或實時傳感。
目前第二代VersalAI Edge系列產(chǎn)品已經(jīng)應用于汽車廠商斯巴魯?shù)腅yeSight視覺系統(tǒng),可以支持碰撞前制動、車道偏離預警、自適應巡航控制和車道保持輔助。
第二代VersalAI Edge系列產(chǎn)品能夠支持先進的數(shù)據(jù)類型、確保處理的低時延、高吞吐量以及高精度,還支持ISO26262功能安全等。利用可編程邏輯的靈活性,斯巴魯?shù)南乱淮鶨yeSight系統(tǒng)可以實時修改攝像頭的傳感器參數(shù),從而助力斯巴魯強化車輛的安全性,并力爭實現(xiàn)2030年沒有致命道路事故的安全目標。
據(jù)悉,客戶現(xiàn)在就可以采用第一代評估板和設計工具展開設計。第二代VersalAI Edge系列和第二代Versal Prime系列產(chǎn)品的芯片樣片將于2025年上半年發(fā)布,評估套件和系統(tǒng)模塊將于2025年年中推出,量產(chǎn)芯片將于2025年末面世。
小結:
以汽車領域來看,汽車電子電氣架構的演進突顯了中央計算平臺的重要性。當前業(yè)內不少企業(yè)也推出了車載中央計算芯片,不過相比之下,AMD第二代Versal AI Edge系列產(chǎn)品,是一顆芯片覆蓋了預處理、AI推理以及后處理這三個階段,AMD也是全球少數(shù)幾家擁有預處理可編程邏輯能力的公司,從而能夠把可編程邏輯的優(yōu)勢去融合到一個芯片當中。
Manuel Uhm表示,AMD第二代Versal自適應SoC平臺的設計考慮到未來五年的需求恐將飛速變化,具有較好的靈活性和伸縮性,提供廣泛的性能和算力支持,如此才能應對不斷變化的市場應用。
-
amd
+關注
關注
25文章
5468瀏覽量
134149 -
AI
+關注
關注
87文章
30887瀏覽量
269065
發(fā)布評論請先 登錄
相關推薦
評論