0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
电子发烧友
开通电子发烧友VIP会员 尊享10大特权
海量资料免费下载
精品直播免费看
优质内容免费畅学
课程9折专享价
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

ADS2.0算法演進(jìn)與對算力的新需求

佐思汽車研究 ? 來源:佐思汽車研究 ? 作者:Dr. Luo ? 2022-06-14 11:13 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

愛因斯坦有曰,“瀚宇初開,萬物當(dāng)生也。萬物可謂振動,能光旋律之蕩漾焉?!保ㄗⅲ鹤髡咧凶g)。AI新技術(shù)革命時代,大算力芯片也撥響了自動駕駛ADS的琴弦。大珠小珠般的AI算法在大算力驅(qū)動下應(yīng)運(yùn)而振,應(yīng)時而動,解決了ADS從L2到L5逐級演進(jìn)中的眾多技術(shù)難題。ADS每增加一級,算力需求也會呈現(xiàn)十倍速上升,L4級別可預(yù)計的算力需求在1000TOPS,L5級別估計在2000-10000TOPS。如圖1所示,后摩爾時代工藝更新性能提升放緩,延續(xù)性創(chuàng)新的邊際效益遞減,新興的大算力架構(gòu)在不斷涌現(xiàn),加上駕駛AI算法高速迭代演進(jìn),在未來5-10年內(nèi)可能會為后來的技術(shù)追趕者提供非常奇妙的一個直線超車的機(jī)會窗口。

8f14599e-eb8f-11ec-ba43-dac502259ad0.png

圖1. 大算力時代自動駕駛ADS領(lǐng)域的機(jī)遇與挑戰(zhàn)

當(dāng)前ADS自動駕駛采用決策層后融合的方式,其局限性主要表現(xiàn)在在極端惡劣氣候與復(fù)雜遮擋等不確定性場景下分別進(jìn)行單模結(jié)構(gòu)化信息提取后再進(jìn)行融合決策,每個通道信息會有不同層面丟失,很難能夠進(jìn)行多模有效互補(bǔ)與特征提取共享,算力內(nèi)卷且性能遠(yuǎn)低于預(yù)期。 未來ADS算法會進(jìn)入一個全新的2.0階段,4D空間下基于時空的多模感知與融合推理, 也就是特征提取/統(tǒng)計推斷/應(yīng)急預(yù)測相結(jié)合,實(shí)現(xiàn)在動態(tài)復(fù)雜的有噪聲干擾等場景下,全程安全無碰撞的高效行駛。挑戰(zhàn)可以體現(xiàn)在,動態(tài)隨機(jī)的人車物交互,多變天氣路況,以及突發(fā)交通事件等。

ADS算法2.0從決策層后融合走向特征級前融合,當(dāng)前行業(yè)ADS2.0算法主要演進(jìn)方向?yàn)椋?/p>

多模感知:主要是針對Camera/LiDAR/Radar海量數(shù)據(jù)流進(jìn)行特征提取,DL網(wǎng)絡(luò)主流趨勢是卷積CNN或者貝葉斯NN+Transformer的組合架構(gòu),在統(tǒng)一的特征空間實(shí)現(xiàn)多模感知,特征融合共享以及多任務(wù)來提升算力的整體效率。

融合推理:主要是基于模型與基于數(shù)據(jù)的雙學(xué)習(xí)模式,DL網(wǎng)絡(luò)主流趨勢是基于目標(biāo)交互GNN或基于統(tǒng)計模型的貝葉斯RL強(qiáng)化學(xué)習(xí)或On-Policy應(yīng)急學(xué)習(xí),實(shí)現(xiàn)ADS安全可信的預(yù)測規(guī)劃與控制。

ADS2.0算法演進(jìn)與對算力的新需求,可以總結(jié)為:

演進(jìn)趨勢1:感知定位預(yù)測決策控制模塊化處理流程中, 從決策層后融合走向感知層前融合,算法能夠在統(tǒng)一空間支持多模融合,多任務(wù)共享;

演進(jìn)趨勢2:預(yù)測與規(guī)劃聯(lián)合建模,從可獲得的Off-policy數(shù)據(jù)進(jìn)行學(xué)習(xí),能夠自學(xué)習(xí)處理不確定性下的安全性問題,解決可解釋問題,持續(xù)學(xué)習(xí)解決新場景問題;

算力新需求:從compute-bound(矩陣-矩陣乘)走向memory-bound(矩陣-矢量乘),從偏計算走向偏存取。

當(dāng)前市場上主流算力NPU芯片,都存在幾個共性問題,一是算法效率低,多數(shù)只針對CNN(例如3x3卷積)優(yōu)化;二是內(nèi)存墻問題:處理單元PE存算分離,數(shù)據(jù)共享難;三是能耗墻問題:數(shù)據(jù)重復(fù)搬移,耗能增加>30-70%。所以,當(dāng)前針對某些特定算法的芯片,無法解決未來ADS 2.0的需求。

從工程實(shí)踐上看,ADS 2.0算法需通過“硬件預(yù)埋,算法迭代,算力均衡”,提供一個向前兼容的解決方案,以通用大算力(CPU的5-10倍性能提升,NPU的100-500倍性能提升)來解決未來不確定性的算法演進(jìn):

底層架構(gòu)的演進(jìn):從存算分離過渡到近內(nèi)存計算,最終走向內(nèi)存計算;

數(shù)據(jù)通道與模型:高速數(shù)據(jù)接口;數(shù)據(jù)壓縮+模型壓縮+低精度逼近計算+稀疏計算加速;

并行的頂層架構(gòu):模型-硬件聯(lián)合設(shè)計,以及硬設(shè)計可配置+硬件調(diào)度+軟運(yùn)行可編程調(diào)度引擎。

未來,自動駕駛算法不會止步于ADS 2.0,而能夠真正支持人類自動駕駛夢想的算法ADS 3.0趨勢,我們估計會采用一個DNN網(wǎng)絡(luò)來進(jìn)行端到端學(xué)習(xí)。設(shè)想一下,有足夠的專家駕駛數(shù)據(jù)用來做模仿學(xué)習(xí)或采用RL自學(xué)習(xí)模式,可以有效降低數(shù)據(jù)標(biāo)注的信息瓶頸與嚴(yán)重依賴,從而能夠從多模多樣化數(shù)據(jù)層面進(jìn)行非直接的推理或者博弈類的對抗學(xué)習(xí)。ADS 3.0目前來看模型的可信與可解釋程度依然遠(yuǎn)低于預(yù)期。ADS系統(tǒng)的總體演進(jìn)趨勢,可以總結(jié)為:

場景演進(jìn):負(fù)載多樣性

?從數(shù)量有限的攝像頭設(shè)置走向 Camera + LiDAR + Radar 多模態(tài)組合。

趨勢演進(jìn):算法多樣性

?從CNN+Rule-based方案走向CNN, RNN,Transformer, GNN, Bayesian, Deep ReinforcementLearning, Dynamic DNN, NAS Generated DNN, Variably Quantized DNN多算法組合。

大算力時代,ADS系統(tǒng)首先是模仿人類的駕駛行為,通過注意力機(jī)制,期望在感知定位預(yù)測規(guī)劃控制領(lǐng)域提供遠(yuǎn)超人類的決策能力。這需要我們在AI的三要素(算法、算力、數(shù)據(jù))基礎(chǔ)上添加第四要素,知識或者常識。

8f88890e-eb8f-11ec-ba43-dac502259ad0.png

而上述要素,均需要在充分理解算法的快速迭代的大趨勢下,擁有充足的超大通用算力,ADS系統(tǒng)在離線模仿學(xué)習(xí)人類駕駛先驗(yàn)知識經(jīng)驗(yàn)與規(guī)則的基礎(chǔ)上,能夠提供在線自主學(xué)習(xí)能力,通過自學(xué)習(xí)激勵與博弈共贏策略應(yīng)對眾多不確定性的人機(jī)交互的復(fù)雜環(huán)境,能夠?qū)Q策不充分的場景下做到安全應(yīng)對和提供可信解釋能力。此外,大算力芯片也需要能夠通過額外的算力,對芯片內(nèi)百萬級的并行計算單元提供故障檢測與安全規(guī)避能力,對大量多模傳感器的部分或者完全失效進(jìn)行有效檢測與應(yīng)對決策處理,對駕駛環(huán)境針對傳感器的主動攻擊與外界目標(biāo)非主動干擾進(jìn)行有效檢測與實(shí)時決策處理。

審核編輯 :李倩

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 算法
    +關(guān)注

    關(guān)注

    23

    文章

    4708

    瀏覽量

    95316
  • ADS1220
    +關(guān)注

    關(guān)注

    24

    文章

    488

    瀏覽量

    125655
  • 自動駕駛
    +關(guān)注

    關(guān)注

    788

    文章

    14306

    瀏覽量

    170530

原文標(biāo)題:自動駕駛行業(yè)快速迭代演變的算法和算力淺論

文章出處:【微信號:zuosiqiche,微信公眾號:佐思汽車研究】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 0人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點(diǎn)推薦

    下一代云端生產(chǎn)的核心特征與技術(shù)演進(jìn)

    43EFLOPS(FP16),量子1138Qubit。這種多模態(tài)的協(xié)同調(diào)度,為AI推理、大模型訓(xùn)練等復(fù)雜場景提供支撐。 網(wǎng)智腦
    的頭像 發(fā)表于 04-22 07:42 ?228次閱讀
    下一代云端生產(chǎn)<b class='flag-5'>力</b>的核心特征與技術(shù)<b class='flag-5'>演進(jìn)</b>

    智能最具潛力的行業(yè)領(lǐng)域

    ?; 數(shù)據(jù)治理與聯(lián)合創(chuàng)新?:民生銀行與華為、阿里云等共建AI實(shí)驗(yàn)室,通過“數(shù)據(jù)湖+模型體系”提升服務(wù)精準(zhǔn)度?; 需求驅(qū)動?:金融大模型推理對GPU
    的頭像 發(fā)表于 04-11 08:20 ?369次閱讀
    智能<b class='flag-5'>算</b><b class='flag-5'>力</b>最具潛力的行業(yè)領(lǐng)域

    DeepSeek推動AI需求:800G光模塊的關(guān)鍵作用

    隨著人工智能技術(shù)的飛速發(fā)展,AI需求正以前所未有的速度增長。DeepSeek等大模型的訓(xùn)練與推理任務(wù)對
    發(fā)表于 03-25 12:00

    中心的如何衡量?

    作為當(dāng)下科技發(fā)展的重要基礎(chǔ)設(shè)施,其的衡量關(guān)乎其能否高效支撐人工智能、大數(shù)據(jù)分析等智能應(yīng)用的運(yùn)行。以下是對智中心算衡量的詳細(xì)闡述:一、
    的頭像 發(fā)表于 01-16 14:03 ?2398次閱讀
    <b class='flag-5'>算</b>智<b class='flag-5'>算</b>中心的<b class='flag-5'>算</b><b class='flag-5'>力</b>如何衡量?

    科技云報到:要更要“利”,“精裝”觸發(fā)大模型產(chǎn)業(yè)新變局?

    科技云報到:要更要“利”,“精裝”觸發(fā)大模型產(chǎn)業(yè)新變局?
    的頭像 發(fā)表于 01-16 10:24 ?460次閱讀

    澎峰科技助力中國移動 重磅發(fā)布智“芯合”原生基礎(chǔ)軟件棧2.0

    原生基礎(chǔ)軟件棧2.0。 芯片是智生態(tài)的基石,基礎(chǔ)軟件棧是智生態(tài)的核心。澎峰科技憑借在高性能計算庫和跨架構(gòu)領(lǐng)域的深厚積累,自
    的頭像 發(fā)表于 12-03 15:08 ?724次閱讀
    澎峰科技助力中國移動 重磅發(fā)布智<b class='flag-5'>算</b>“芯合”<b class='flag-5'>算</b><b class='flag-5'>力</b>原生基礎(chǔ)軟件棧<b class='flag-5'>2.0</b>

    澎峰科技助力中國移動發(fā)布智“芯合”原生基礎(chǔ)軟件棧2.0

    近日 ,由中國通信學(xué)會主辦、中國移動研究院承辦的2024中國信息通信大會“網(wǎng)絡(luò)網(wǎng)一體創(chuàng)新發(fā)展論壇 ”在成都召開。中國移動研究院攜手澎峰科技等產(chǎn)業(yè)合作伙伴在本次論壇重磅發(fā)布了智
    的頭像 發(fā)表于 12-03 13:29 ?629次閱讀

    基礎(chǔ)篇:從零開始了解

    即計算能力(Computing Power),狹義上指對數(shù)字問題的運(yùn)算能力,而廣義上指對輸入信息處理后實(shí)現(xiàn)結(jié)果輸出的一種能力。雖然處理的內(nèi)容不同,但處理過程的能力都可抽象為。比
    的頭像 發(fā)表于 11-15 14:22 ?2213次閱讀
    <b class='flag-5'>算</b><b class='flag-5'>力</b>基礎(chǔ)篇:從零開始了解<b class='flag-5'>算</b><b class='flag-5'>力</b>

    企業(yè)AI租賃是什么

    企業(yè)AI租賃是指企業(yè)通過互聯(lián)網(wǎng)向?qū)I(yè)的提供商租用所需的計算資源,以滿足其AI應(yīng)用的需求。以下是對企業(yè)AI
    的頭像 發(fā)表于 11-14 09:30 ?2395次閱讀

    GPU開發(fā)平臺是什么

    隨著AI技術(shù)的廣泛應(yīng)用,需求呈現(xiàn)出爆發(fā)式增長。AI租賃作為一種新興的服務(wù)模式,正逐漸成為企業(yè)獲取
    的頭像 發(fā)表于 10-31 10:31 ?664次閱讀

    【「芯片 | 高性能 CPU/GPU/NPU 微架構(gòu)分析」閱讀體驗(yàn)】--全書概覽

    本帖最后由 1653149838.791300 于 2024-10-16 22:19 編輯 感謝平臺提供的書籍,厚厚的一本,很有分量,感謝作者的傾力付出成書。 本書主要講芯片CPU
    發(fā)表于 10-15 22:08

    中國大會召開,業(yè)界首個高質(zhì)量評估體系發(fā)布

    首次完整地構(gòu)建了人工智能時代高質(zhì)量的理論體系,并探索性提出業(yè)界首個 "五位一體"的高質(zhì)量評估體系。 發(fā)布現(xiàn)場 在當(dāng)前由大模型和AIGC驅(qū)動的AI時代,
    的頭像 發(fā)表于 09-28 16:50 ?478次閱讀
    中國<b class='flag-5'>算</b><b class='flag-5'>力</b>大會召開,業(yè)界首個<b class='flag-5'>算</b><b class='flag-5'>力</b>高質(zhì)量評估體系發(fā)布

    大模型時代的需求

    現(xiàn)在AI已進(jìn)入大模型時代,各企業(yè)都爭相部署大模型,但如何保證大模型的,以及相關(guān)的穩(wěn)定性和性能,是一個極為重要的問題,帶著這個極為重要的問題,我需要在此書中找到答案。
    發(fā)表于 08-20 09:04

    中科曙光入選2024服務(wù)產(chǎn)業(yè)圖譜及服務(wù)產(chǎn)品名錄

    近日,中國信通院公布首個《服務(wù)產(chǎn)業(yè)圖譜(2024年)》及《服務(wù)產(chǎn)品名錄(2024年)》。曙光智構(gòu)建的全國一體化
    的頭像 發(fā)表于 08-06 14:23 ?1346次閱讀

    電子發(fā)燒友

    中國電子工程師最喜歡的網(wǎng)站

    • 2931785位工程師會員交流學(xué)習(xí)
    • 獲取您個性化的科技前沿技術(shù)信息
    • 參加活動獲取豐厚的禮品