0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

借助Hydra-MDP框架實(shí)現(xiàn)端到端自動(dòng)駕駛

NVIDIA英偉達(dá)企業(yè)解決方案 ? 來(lái)源:NVIDIA英偉達(dá)企業(yè)解決方案 ? 2024-09-06 14:28 ? 次閱讀

構(gòu)建一個(gè)能在復(fù)雜物理世界中導(dǎo)航的自動(dòng)駕駛系統(tǒng)極具挑戰(zhàn)性。系統(tǒng)必須感知周?chē)h(huán)境并做出快速且明智的決策。乘客體驗(yàn)也很重要,需要考慮加速、曲率、平滑度、路面附著力、碰撞時(shí)間等因素。

本文將介紹 Hydra-MDP,這個(gè)創(chuàng)新的框架將推動(dòng)端到端自動(dòng)駕駛領(lǐng)域的發(fā)展。Hydra-MDP 采用新穎的多教師、學(xué)生-教師知識(shí)提煉架構(gòu),整合了來(lái)自人類(lèi)和基于規(guī)則的規(guī)劃器的知識(shí)。這使模型能夠?qū)W習(xí)不同的軌跡,從而提高在不同駕駛環(huán)境和條件下的通用性。

wKgaombaoSyAcPunAAgXaVMvpo0759.png

圖 1 端到端規(guī)劃范式比較

Hydra-MDP 所提供的通用框架展示了如何通過(guò)基于規(guī)則的規(guī)劃器來(lái)增強(qiáng)基于機(jī)器學(xué)習(xí)的規(guī)劃。這一整合確保模型不僅能模仿人類(lèi)駕駛行為,還能遵守交通規(guī)則和安全標(biāo)準(zhǔn),打破了傳統(tǒng)模仿學(xué)習(xí)的局限性。

Hydra-MDP 以數(shù)據(jù)驅(qū)動(dòng)的擴(kuò)展法則展現(xiàn)了其魯棒性和適應(yīng)性。通過(guò)使用具有大量數(shù)據(jù)和 GPU 小時(shí)數(shù)的預(yù)訓(xùn)練基礎(chǔ)模型,Hydra-MDP 展示了其可擴(kuò)展性以及持續(xù)改進(jìn)的潛力。

NVIDIA 的 Hydra-MDP 模型在 CVPR 2024 大規(guī)模端到端駕駛挑戰(zhàn)賽中獲得了第一名和創(chuàng)新獎(jiǎng),并且在 nuPlan 基準(zhǔn)測(cè)試中的表現(xiàn)優(yōu)于當(dāng)前最先進(jìn)的規(guī)劃器。它為基于 ML 的規(guī)劃系統(tǒng)在自動(dòng)駕駛中的應(yīng)用開(kāi)辟了一條前景廣闊的道路。

端到端自動(dòng)駕駛是一套系統(tǒng)接收來(lái)自攝像頭、雷達(dá)和激光雷達(dá)的原始傳感器數(shù)據(jù)并直接輸出車(chē)輛控制的完整方法。

相關(guān)論文

Hydra-MDP:多目標(biāo) Hydra-Distillation 端到端多模式規(guī)劃

Hydra-MDP 采用新穎的多教師、學(xué)生-教師知識(shí)提煉架構(gòu),整合了來(lái)自人類(lèi)和基于規(guī)則的規(guī)劃器的知識(shí)。

借助基于規(guī)則的教師知識(shí),Hydra-MDP 可以學(xué)習(xí)環(huán)境如何以端到端的方式影響規(guī)劃,而不是求助于無(wú)差別的后處理,使其在不同駕駛環(huán)境和條件下的通用性有了顯著提高。

通過(guò)多目標(biāo) Hydra-Distillation

加強(qiáng)多模態(tài)規(guī)劃

在開(kāi)發(fā) Hydra-MDP 的過(guò)程中,NVIDIA 學(xué)到了一些關(guān)鍵的經(jīng)驗(yàn),這些經(jīng)驗(yàn)決定了 Hydra-MDP 的架構(gòu)及其成功。Hydra-MDP 將人類(lèi)和基于規(guī)則的知識(shí)提煉相結(jié)合,創(chuàng)建出一個(gè)強(qiáng)大的多功能自動(dòng)駕駛模型。

以下是 NVIDIA 學(xué)習(xí)到的關(guān)鍵經(jīng)驗(yàn):

認(rèn)識(shí)到多模態(tài)和多目標(biāo)規(guī)劃的復(fù)雜性

利用多目標(biāo) Hydra-Distillation 的強(qiáng)大功能

克服后處理的局限性

了解環(huán)境背景的重要性

通過(guò)模擬反復(fù)完善

使用有效的模型組合

認(rèn)識(shí)到多模態(tài)和多目標(biāo)規(guī)劃的復(fù)雜性

認(rèn)識(shí)到多模態(tài)和多目標(biāo)規(guī)劃的必要性是一門(mén)“基礎(chǔ)課”。

傳統(tǒng)的端到端自動(dòng)駕駛系統(tǒng)通常只側(cè)重于單個(gè)模態(tài)和目標(biāo),這限制了其在現(xiàn)實(shí)世界中的有效性。Hydra-MDP 整合了根據(jù)安全、效率、舒適度等多個(gè)指標(biāo)定制的不同軌跡,確保模型不只是模仿人類(lèi)駕駛員,而是能夠適應(yīng)復(fù)雜的駕駛環(huán)境。

wKgZombaoWGAe5LhAAbXk3u5PTY946.png

圖 2 Hydra-MDP 架構(gòu)

利用多目標(biāo) Hydra-Distillation 的強(qiáng)大功能

多目標(biāo) Hydra-Distillation 是一個(gè)教師-學(xué)生多模態(tài)框架,它是 NVIDIA 方法中的關(guān)鍵策略。通過(guò)采用多個(gè)專業(yè)教師(既有人類(lèi)教師,也有基于規(guī)則的教師),模型能夠?qū)W會(huì)預(yù)測(cè)與各種模擬指標(biāo)相一致的軌跡。該技術(shù)提高了模型在不同駕駛條件下的通用性。

NVIDIA 了解到加入基于規(guī)則的規(guī)劃器提供了一個(gè)結(jié)構(gòu)化框架,而加入人類(lèi)教師則帶來(lái)了適應(yīng)性和細(xì)致的決策能力,這對(duì)于適應(yīng)不可預(yù)測(cè)的場(chǎng)景至關(guān)重要。

克服后處理的局限性

另一個(gè)洞察是依賴后處理進(jìn)行軌跡選擇存在固有的局限性。

傳統(tǒng)方法通常會(huì)將感知和規(guī)劃分離成不同且不可微分的步驟,從而丟失有價(jià)值的信息。Hydra-MDP 的端到端架構(gòu)將感知和規(guī)劃整合成一個(gè)無(wú)縫銜接的工作流,并在整個(gè)決策過(guò)程中保持了環(huán)境數(shù)據(jù)的豐富性。通過(guò)這種整合,使預(yù)測(cè)變得更加明智且準(zhǔn)確。

了解環(huán)境背景的重要性

加入詳細(xì)的環(huán)境背景對(duì)于規(guī)劃的準(zhǔn)確性來(lái)說(shuō)至關(guān)重要。

Hydra-MDP 的感知網(wǎng)絡(luò)以 Transfuser 基線為基礎(chǔ)構(gòu)建而成,它將激光雷達(dá)和攝像機(jī)輸入所具有的特征加以組合。這種多模態(tài)融合有助于模型更好地理解和應(yīng)對(duì)復(fù)雜的駕駛環(huán)境。

Transformer 層將這些模態(tài)連接起來(lái),保證了對(duì)環(huán)境背景的全面編碼,并提供豐富、可操作的洞察。

通過(guò)模擬反復(fù)完善

事實(shí)證明,離線模擬促進(jìn)的反復(fù)完善過(guò)程非常有價(jià)值。

在整個(gè)訓(xùn)練數(shù)據(jù)集上運(yùn)行模擬生成了各項(xiàng)指標(biāo)的基準(zhǔn)真實(shí)模擬分?jǐn)?shù)。這些數(shù)據(jù)隨后被用于監(jiān)督訓(xùn)練過(guò)程,使模型能夠從各種模擬駕駛場(chǎng)景中學(xué)習(xí)。

該步驟凸顯了大量模擬在填補(bǔ)理論性能與實(shí)際應(yīng)用之間差距的重要性。

wKgZombaoXKAHvDMAACRyjjmGK4293.png

表 1 Hydra-MDP 的準(zhǔn)確性與輸入圖像分辨率、預(yù)訓(xùn)練和骨干架構(gòu)的函數(shù)關(guān)系。獲勝方案 Hydra-MDP-C 通過(guò)將這些因素結(jié)合在一起提高了性能。

使用有效的模型集合

有效的模型集合是取得成功的關(guān)鍵。

NVIDIA 使用了混合編碼器和子分?jǐn)?shù)集合等技術(shù)來(lái)結(jié)合模型的優(yōu)勢(shì)。這提高了 Hydra-MDP 的魯棒性,保證了最終模型能夠以高精度處理各種駕駛場(chǎng)景。

集合技術(shù)兼顧了計(jì)算效率和性能,對(duì)于實(shí)時(shí)應(yīng)用至關(guān)重要。

結(jié)論

Hydra-MDP 的開(kāi)發(fā)是一個(gè)創(chuàng)新、實(shí)驗(yàn)和不斷學(xué)習(xí)的過(guò)程。通過(guò)采用多模態(tài)和多目標(biāo)規(guī)劃、利用多目標(biāo) Hydra-Distillation,以及通過(guò)大量模擬加以完善, NVIDIA 創(chuàng)建了一個(gè)明顯優(yōu)于當(dāng)前最先進(jìn)方法的模型。這些經(jīng)驗(yàn)造就了 Hydra-MDP 的成功,并為未來(lái)自動(dòng)駕駛技術(shù)的進(jìn)步提供了寶貴的啟發(fā)。

更多信息,參見(jiàn) Hydra-MDP:借助多目標(biāo) Hydra-Distillation 實(shí)現(xiàn)端到端多模態(tài)規(guī)劃。相關(guān)工作參見(jiàn)自動(dòng)駕駛汽車(chē)應(yīng)用研究。

聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • NVIDIA
    +關(guān)注

    關(guān)注

    14

    文章

    5048

    瀏覽量

    103348
  • 模型
    +關(guān)注

    關(guān)注

    1

    文章

    3277

    瀏覽量

    48964
  • 機(jī)器學(xué)習(xí)

    關(guān)注

    66

    文章

    8428

    瀏覽量

    132831
  • 自動(dòng)駕駛
    +關(guān)注

    關(guān)注

    784

    文章

    13892

    瀏覽量

    166687

原文標(biāo)題:借助 Hydra-MDP 實(shí)現(xiàn)大規(guī)模端到端駕駛

文章出處:【微信號(hào):NVIDIA-Enterprise,微信公眾號(hào):NVIDIA英偉達(dá)企業(yè)解決方案】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏

    評(píng)論

    相關(guān)推薦

    自動(dòng)駕駛真的會(huì)來(lái)嗎?

    自動(dòng)駕駛面臨的主要挑戰(zhàn)是基于圖像的機(jī)器學(xué)習(xí)能力?! ±碚撋?,基于圖像的機(jī)器學(xué)習(xí)可以讓汽車(chē)實(shí)現(xiàn)自動(dòng)駕駛,但在實(shí)際技術(shù)發(fā)展方面,仍有很多問(wèn)題無(wú)法解決。例如現(xiàn)在特斯拉的輔助駕駛只能在高速公路
    發(fā)表于 07-21 09:00

    自動(dòng)駕駛技術(shù)的實(shí)現(xiàn)

    的帶寬有了更高的要求。從而使用以太網(wǎng)技術(shù)及中央域控制(Domain)和區(qū)域控制(Zonal)架構(gòu)是下一代車(chē)載網(wǎng)絡(luò)的發(fā)展方向。然而對(duì)于自動(dòng)駕駛技術(shù)的實(shí)現(xiàn),涉及感知、規(guī)劃、執(zhí)行三個(gè)層面。由于車(chē)輛行...
    發(fā)表于 09-03 08:31

    如何基于深度神經(jīng)網(wǎng)絡(luò)設(shè)計(jì)一個(gè)自動(dòng)駕駛模型?

    如何基于深度神經(jīng)網(wǎng)絡(luò)設(shè)計(jì)一個(gè)自動(dòng)駕駛模型?如何設(shè)計(jì)一個(gè)基于增強(qiáng)學(xué)習(xí)的自動(dòng)駕駛決策系統(tǒng)?
    的頭像 發(fā)表于 04-29 16:44 ?4928次閱讀
    如何基于深度神經(jīng)網(wǎng)絡(luò)設(shè)計(jì)一個(gè)<b class='flag-5'>端</b><b class='flag-5'>到</b><b class='flag-5'>端</b>的<b class='flag-5'>自動(dòng)駕駛</b>模型?

    基于自動(dòng)駕駛系統(tǒng)只能做demo嗎

    只配做demo嗎?由劍橋大學(xué)團(tuán)隊(duì)創(chuàng)辦的Wayve無(wú)人駕駛軟件公司卻不這么認(rèn)為。
    的頭像 發(fā)表于 12-26 10:39 ?518次閱讀

    自動(dòng)駕駛到底是什么?

    UniAD 統(tǒng)一自動(dòng)駕駛關(guān)鍵任務(wù),但是的訓(xùn)練難度極大,對(duì)數(shù)據(jù)的要求和工程能力的要求比常規(guī)的技術(shù)棧要高,但是由此帶來(lái)的全局一致性讓整個(gè)系統(tǒng)變得更加簡(jiǎn)潔,也能夠防止某個(gè)模塊進(jìn)入局部最
    發(fā)表于 06-28 14:47 ?3732次閱讀
    <b class='flag-5'>端</b><b class='flag-5'>到</b><b class='flag-5'>端</b><b class='flag-5'>自動(dòng)駕駛</b>到底是什么?

    基于矢量化場(chǎng)景表征的自動(dòng)駕駛算法框架

    在ICCV 2023上,地平線和華中科技大學(xué)提出基于矢量化場(chǎng)景表征的自動(dòng)駕駛算法——VAD。VAD擯棄了柵格化表征,對(duì)整個(gè)駕駛場(chǎng)景進(jìn)行
    發(fā)表于 08-31 09:28 ?1197次閱讀
    基于矢量化場(chǎng)景表征的<b class='flag-5'>端</b><b class='flag-5'>到</b><b class='flag-5'>端</b><b class='flag-5'>自動(dòng)駕駛</b>算法<b class='flag-5'>框架</b>

    理想汽車(chē)自動(dòng)駕駛模型實(shí)現(xiàn)

    理想汽車(chē)在感知、跟蹤、預(yù)測(cè)、決策和規(guī)劃等方面都進(jìn)行了模型化,最終實(shí)現(xiàn)的模型。這種模型不僅完全模型化,還能夠虛擬化,即在模擬環(huán)境中進(jìn)行訓(xùn)練和測(cè)試。
    發(fā)表于 04-12 12:17 ?476次閱讀
    理想汽車(chē)<b class='flag-5'>自動(dòng)駕駛</b><b class='flag-5'>端</b><b class='flag-5'>到</b><b class='flag-5'>端</b>模型<b class='flag-5'>實(shí)現(xiàn)</b>

    佐思汽研發(fā)布《2024年自動(dòng)駕駛研究報(bào)告》

    自動(dòng)駕駛是直接從傳感器信息輸入(如攝像頭圖像、LiDAR等)控制命令輸出(如轉(zhuǎn)向、加減速等)映射的一套系統(tǒng),最早出現(xiàn)在1988年的A
    的頭像 發(fā)表于 04-20 11:21 ?3450次閱讀
    佐思汽研發(fā)布《2024年<b class='flag-5'>端</b><b class='flag-5'>到</b><b class='flag-5'>端</b><b class='flag-5'>自動(dòng)駕駛</b>研究報(bào)告》

    智行者聯(lián)合清華完成國(guó)內(nèi)首套全棧式自動(dòng)駕駛系統(tǒng)的開(kāi)放道路測(cè)試

    近日,智行者與清華大學(xué)車(chē)輛學(xué)院李克強(qiáng)院士、李升波教授領(lǐng)導(dǎo)的研究團(tuán)隊(duì),完成了國(guó)內(nèi)首套全棧式自動(dòng)駕駛系統(tǒng)的開(kāi)放道路測(cè)試。
    的頭像 發(fā)表于 04-22 09:24 ?809次閱讀
    智行者聯(lián)合清華完成國(guó)內(nèi)首套全棧式<b class='flag-5'>端</b><b class='flag-5'>到</b><b class='flag-5'>端</b><b class='flag-5'>自動(dòng)駕駛</b>系統(tǒng)的開(kāi)放道路測(cè)試

    理想汽車(chē)加速自動(dòng)駕駛布局,成立“”實(shí)體組織

    近期,理想汽車(chē)在其智能駕駛領(lǐng)域邁出了重要一步,正式成立了專注于“自動(dòng)駕駛”的實(shí)體組織,該組織規(guī)模超過(guò)200人,標(biāo)志著理想在
    的頭像 發(fā)表于 07-17 15:42 ?1371次閱讀

    實(shí)現(xiàn)自動(dòng)駕駛,唯有?

    ,去年行業(yè)主流方案還是輕高精地圖城區(qū)智駕,今年大家的目標(biāo)都瞄到了(End-to-End, E2E)。
    的頭像 發(fā)表于 08-12 09:14 ?784次閱讀
    <b class='flag-5'>實(shí)現(xiàn)</b><b class='flag-5'>自動(dòng)駕駛</b>,唯有<b class='flag-5'>端</b><b class='flag-5'>到</b><b class='flag-5'>端</b>?

    Mobileye自動(dòng)駕駛解決方案的深度解析

    自動(dòng)駕駛技術(shù)正處于快速發(fā)展之中,各大科技公司和汽車(chē)制造商均在爭(zhēng)相布局,試圖在這個(gè)新興領(lǐng)域占據(jù)一席之地。Mobileye作為全球自動(dòng)駕駛技術(shù)的領(lǐng)軍企業(yè)之一,憑借其獨(dú)特的
    的頭像 發(fā)表于 10-17 09:35 ?409次閱讀
    Mobileye<b class='flag-5'>端</b><b class='flag-5'>到</b><b class='flag-5'>端</b><b class='flag-5'>自動(dòng)駕駛</b>解決方案的深度解析

    Waymo利用谷歌Gemini大模型,研發(fā)端自動(dòng)駕駛系統(tǒng)

    邁新步,為其機(jī)器人出租車(chē)業(yè)務(wù)引入了一種基于谷歌多模態(tài)大語(yǔ)言模型(MLLM)“Gemini”的全新訓(xùn)練模型——“多模態(tài)自動(dòng)駕駛模型”(EMMA)。
    的頭像 發(fā)表于 10-31 16:55 ?1111次閱讀

    連接視覺(jué)語(yǔ)言大模型與自動(dòng)駕駛

    自動(dòng)駕駛在大規(guī)模駕駛數(shù)據(jù)上訓(xùn)練,展現(xiàn)出很強(qiáng)的決策規(guī)劃能力,但是面對(duì)復(fù)雜罕見(jiàn)的駕駛場(chǎng)景,依然
    的頭像 發(fā)表于 11-07 15:15 ?294次閱讀
    連接視覺(jué)語(yǔ)言大模型與<b class='flag-5'>端</b><b class='flag-5'>到</b><b class='flag-5'>端</b><b class='flag-5'>自動(dòng)駕駛</b>

    自動(dòng)駕駛技術(shù)研究與分析

    傳遞和全局優(yōu)化的優(yōu)勢(shì),成為智能駕駛技術(shù)發(fā)展的重要方向。與傳統(tǒng)模塊化架構(gòu)相比,技術(shù)通過(guò)深度神經(jīng)網(wǎng)絡(luò)實(shí)現(xiàn)從傳感器數(shù)據(jù)輸入
    的頭像 發(fā)表于 12-19 13:07 ?251次閱讀