如果故事的開(kāi)頭,從端到端和模塊化兩種自動(dòng)駕駛系統(tǒng)的發(fā)展溯源講起,人們會(huì)發(fā)現(xiàn),路線(xiàn)之爭(zhēng)對(duì)于高階智駕而言并非是問(wèn)題的關(guān)鍵。系統(tǒng)的性能、可靠性、安全性等因素需要以人為核心尋找合理的“設(shè)計(jì)交集”,從而共同約束相關(guān)發(fā)展路徑的實(shí)際應(yīng)用和效果呈現(xiàn)。
自2024年開(kāi)始,城區(qū)NOA普及速度不斷加快。然則在一些研究機(jī)構(gòu)的報(bào)告中顯示,截至2023年底,只有3%的城區(qū)NOA滲透率說(shuō)明其中仍有明顯的應(yīng)用鴻溝等待跨越。其中原因就是現(xiàn)實(shí)的隨機(jī)性為正確預(yù)測(cè)下一秒造成了極大的困難,反映到實(shí)際自動(dòng)駕駛行為中的表現(xiàn)就是:決策保守,應(yīng)對(duì)死板、機(jī)械,效率低。在地平線(xiàn)看來(lái),選擇一條可達(dá)成的發(fā)展路徑需要遵循“用戶(hù)價(jià)值”,從場(chǎng)景出發(fā),地平線(xiàn)全新一代智駕方案Horizon SuperDrive(下簡(jiǎn)稱(chēng)“SuperDrive”)為了解決城區(qū)的規(guī)控難題采用了更擬人、更像老司機(jī)的“交互博弈”。
讓智駕系統(tǒng)更“老練”的交互博弈
什么樣的智能駕駛能被稱(chēng)為老司機(jī)?首先來(lái)看一些SuperDrive在城市中的行駛片段——
從以上場(chǎng)景的自動(dòng)駕駛行為可以看到,SuperDrive系統(tǒng)已經(jīng)具備一個(gè)老練司機(jī)的開(kāi)車(chē)本能。例如,當(dāng)遇到騎行人或行人主動(dòng)避讓、等待車(chē)輛先行時(shí),它會(huì)果決判斷、不猶豫地行駛過(guò)去,而不是僵硬地只滿(mǎn)足行人先行的約束條件(為了安全);直行遇到左轉(zhuǎn)高頻場(chǎng)景,在判定擁有路權(quán)的時(shí)候SuperDrive會(huì)選擇徑直過(guò)去,而不會(huì)像其他系統(tǒng)一樣躊躇;及時(shí)檢測(cè)到前方占道車(chē)輛然后減速繞行,整個(gè)繞行路徑優(yōu)雅從容,讓駕駛者獲得如同自己正常駕駛一樣的體驗(yàn),并且有效避免了當(dāng)識(shí)別到前方占道車(chē)輛減速剎停時(shí),無(wú)法主動(dòng)繞行最終被迫接管的窘境。
SuperDrive想要做的,就是能夠平順地處理很多場(chǎng)景(優(yōu)雅),不會(huì)僅為了安全而不去做一些人會(huì)做的博弈行為(不慫),并且能夠感知到車(chē)的狀態(tài),像人一樣在一個(gè)相對(duì)長(zhǎng)的時(shí)間周期里通過(guò)思考明白要如何去行動(dòng),而不會(huì)很猶豫、糾結(jié),出現(xiàn)方向盤(pán)無(wú)目的地亂擺導(dǎo)致車(chē)身不明所以地?fù)u晃等(從容篤定),可謂謀定而后動(dòng)。
其背后,有兩大技術(shù)支撐。一個(gè)是讓智駕系統(tǒng)“看”得更明白的“端到端感知架構(gòu)”;另一個(gè)是讓智駕系統(tǒng)“想”得清楚的“交互式博弈算法”。后者作為整個(gè)智駕系統(tǒng)的決策規(guī)劃核心,最主要的是為高階智駕提供了一種思維路徑,而非一種設(shè)計(jì)定式。在實(shí)現(xiàn)端到端感知的基礎(chǔ)上,SuperDrive系統(tǒng)還需要具備超強(qiáng)的博弈能力,才能針對(duì)復(fù)雜多元的城區(qū)場(chǎng)景以及中國(guó)式交通參與者,實(shí)現(xiàn)“優(yōu)雅不慫,從容篤定”。
SuperDrive的整個(gè)規(guī)控系統(tǒng)的輸入擁有Tensor級(jí)別的先驗(yàn)和實(shí)時(shí)結(jié)果,憑借著系統(tǒng)內(nèi)的搜索模塊,在大量數(shù)據(jù)和可能性中尋找最優(yōu)解或相關(guān)信息,同時(shí)考慮時(shí)間和空間因素,根據(jù)輸入數(shù)據(jù)和推理結(jié)果,生成物體或事件隨著時(shí)間和空間變化的軌跡,然后做出預(yù)測(cè)或決策,制定運(yùn)動(dòng)規(guī)劃,最終控制車(chē)子做出相應(yīng)的駕駛行為。
地平線(xiàn)認(rèn)為,上述所有的處理過(guò)程都會(huì)有一個(gè)交互式預(yù)測(cè)決策神經(jīng)網(wǎng)絡(luò)的Core,能夠讓系統(tǒng)真正的實(shí)現(xiàn)交互式博弈,整個(gè)推理過(guò)程最重要的是輸出Plan/Prediction Pairs,包含自車(chē)和他車(chē)的,這樣才能更準(zhǔn)確的給出是搶還是讓的決策,且這一過(guò)程并不是一次性的,而是所有可能性在每一個(gè)“Planning Cycle”里能夠調(diào)用推演,這能使得系統(tǒng)能夠真的像人一樣在“反復(fù)博弈、尋求最優(yōu)解”,而不是單向從A問(wèn)題到B結(jié)論般的直白、僵硬。
但當(dāng)輸入的信息超越了過(guò)往的“經(jīng)驗(yàn)”,系統(tǒng)則能夠自行做出交互式思考和判斷,從而生成合理的駕駛行為,整體的交互博弈,能夠反復(fù)迭代、推演、強(qiáng)化,在不斷的進(jìn)化中,離“更擬人”無(wú)窮近。這相對(duì)于之前串行預(yù)測(cè)決策的規(guī)控有著很大的區(qū)別。
在目前的應(yīng)用試驗(yàn)中,除了本節(jié)上述的場(chǎng)景外,地平線(xiàn)SuperDrive在面對(duì)施工區(qū)避讓、城市環(huán)島通行、路口交互-動(dòng)態(tài)Driveline、效率變道、擁堵變道、擁堵匯流等城市典型場(chǎng)景時(shí),均能夠給用戶(hù)帶來(lái)優(yōu)雅不慫的智能駕乘體驗(yàn)。典型動(dòng)態(tài)現(xiàn)場(chǎng)案例如下:
背后思考:慢思考
相對(duì)于傳統(tǒng)智駕領(lǐng)域的決策規(guī)劃而言,交互博弈是更復(fù)雜的一種決策行為。地平線(xiàn)創(chuàng)始人兼CEO余凱博士介紹,高階智駕系統(tǒng)不能僅僅只在簡(jiǎn)單的case里靠直覺(jué)去處理,在復(fù)雜的case里,也能夠通過(guò)自己的自主思考、博弈去“舉一反三”,也就是說(shuō)自主思考的背后需要邏輯推演鏈條更長(zhǎng)的反復(fù)思考,最終要求達(dá)到anytime、anywhere的反復(fù)博弈,這時(shí)的車(chē)子仿佛擁有了一顆“大腦”,能夠全天候、全場(chǎng)景地仿真、想象、演繹甚至腦補(bǔ)。
由此可以引申出SuperDrive設(shè)計(jì)交互博弈背后的思維動(dòng)因,地平線(xiàn)稱(chēng)之為“慢思考”?!奥伎肌边@個(gè)概念來(lái)自于美國(guó)心理學(xué)家丹尼爾·卡尼曼的著作《思考,快與慢》。丹尼爾·卡尼曼認(rèn)為,人類(lèi)大腦有快與慢兩種做決定的方式??焖伎家蕾?lài)情感、記憶和經(jīng)驗(yàn)迅速作出判斷,它見(jiàn)聞廣博,能夠迅速對(duì)眼前的情況做出反應(yīng),但是這樣的思考過(guò)程固守“眼見(jiàn)即為事實(shí)”的原則,很容易被蠱惑進(jìn)而上當(dāng);而慢思考通過(guò)調(diào)動(dòng)注意力來(lái)分析和解決問(wèn)題,它擁有一個(gè)不斷反芻的思維過(guò)程,比較慢,不容易出錯(cuò),但有時(shí)也會(huì)偷懶,選擇讓“快思考”直接接管,用直覺(jué)來(lái)“走捷徑”。地平線(xiàn)認(rèn)為,智駕系統(tǒng)的交互博弈應(yīng)當(dāng)像人一樣思考,更多的時(shí)候強(qiáng)調(diào)“快和慢”相結(jié)合,以便能夠在動(dòng)態(tài)和不可預(yù)測(cè)的環(huán)境中做出更加合理和有效的決策。
現(xiàn)如今,很多決策規(guī)劃模塊的開(kāi)發(fā)過(guò)程中,隨著應(yīng)用場(chǎng)景無(wú)限趨于開(kāi)集形態(tài),依賴(lài)人類(lèi)工程師不斷手寫(xiě)的(if.else,搜索,優(yōu)化)規(guī)則去對(duì)抗自動(dòng)駕駛問(wèn)題不僅在技術(shù)上陷入窮途末路,而且也沒(méi)有無(wú)上限的資金用以支持類(lèi)似的“黑洞投入”。智能駕駛目前遇到的最大瓶頸是“開(kāi)集和非白名單”的問(wèn)題,僅靠if.else很難精確地描述并處理不斷變幻的駕駛場(chǎng)景,因此在智能駕駛系統(tǒng)中,人們逐漸采取神經(jīng)網(wǎng)絡(luò)替換掉手寫(xiě)規(guī)則,憑借數(shù)據(jù)驅(qū)動(dòng)和大模型解決人工短板。
但是地平線(xiàn)想的更進(jìn)一步,雖然基于鑒別式或者單模態(tài)生成式的機(jī)器學(xué)習(xí)技術(shù)能夠通過(guò)數(shù)據(jù)的閉環(huán),經(jīng)由算力支持換來(lái)了效率,但是仍然無(wú)法解決“開(kāi)集和白名單”的問(wèn)題,越來(lái)越多的判定已經(jīng)達(dá)成共識(shí),機(jī)器學(xué)習(xí)技術(shù)需要具有Common sense(常識(shí)),即在沒(méi)有特定任務(wù)的訓(xùn)練樣本的情況下,讓模型完成任務(wù)(Zero-shot)。這就涉及到上文所述的“開(kāi)城”和“ODD無(wú)限延展”的問(wèn)題,智能駕駛的未來(lái)就是要讓整個(gè)決策規(guī)劃無(wú)限適應(yīng)和處理從來(lái)沒(méi)有見(jiàn)過(guò)的case,而不是遇到問(wèn)題就簡(jiǎn)單粗暴地“confused”,或者直接選擇人為接管。
因此,基于“快、慢”思考的定義,地平線(xiàn)設(shè)計(jì)SuperDrive的時(shí)候也充分注意到了有些場(chǎng)景難以通過(guò)直接反饋的方式去處理,而是要像下棋一樣經(jīng)過(guò)步驟推演,最好能夠舉一反三(即泛化能力),而不是只有見(jiàn)到才能學(xué)到。針對(duì)一些全新的場(chǎng)景,地平線(xiàn)希望做到的是系統(tǒng)能夠完全“從0到1”,這個(gè)“0”并非是數(shù)學(xué)意義上的“空集”,而是能夠在原有的經(jīng)驗(yàn)(這個(gè)經(jīng)驗(yàn)有可能與當(dāng)下場(chǎng)景相關(guān)、準(zhǔn)相關(guān)甚至無(wú)關(guān))之上,通過(guò)自行比對(duì)、自主思考、經(jīng)驗(yàn)推理、不斷模仿,生成更加理性的、符合現(xiàn)實(shí)需要的決策,而不是將一些行駛標(biāo)準(zhǔn)孤立、割裂地看待,導(dǎo)致出現(xiàn)“為了安全能走卻不走”、“遇到突發(fā)狀況毫無(wú)變通”的狀況。地平線(xiàn)認(rèn)為,讓系統(tǒng)在交互中學(xué)會(huì)“博弈”,才能跨過(guò)智能駕駛迭代過(guò)程中的“嘆息之墻”。
軟硬協(xié)同:“1+1>2”
從可用躍遷至好用,對(duì)于地平線(xiàn)而言,無(wú)論是端到端感知還是交互博弈,最終都需要通過(guò)高效的硬件架構(gòu)去運(yùn)行。換句話(huà)說(shuō),硬件實(shí)力決定了迭代底盤(pán),與此同時(shí)軟件和硬件彼此協(xié)同才能發(fā)揮出“1+1>2”的效用。在交互博弈方面,由于跟以前的串行神經(jīng)網(wǎng)絡(luò)推理模式不一樣,需要相對(duì)通用的計(jì)算單元和相對(duì)快速的專(zhuān)用計(jì)算單元來(lái)完成博弈,因此BPU架構(gòu)也能更加快速高效地處理Close-Loop交互。
基于BPU Nash架構(gòu)的征程6,相比上一代性能上有了大幅提升,其中包含強(qiáng)大的并行浮點(diǎn)計(jì)算能力,以及特別優(yōu)化的超越函數(shù),存儲(chǔ)性能上也進(jìn)行了大面積優(yōu)化,能夠用更加無(wú)感的方式、更快的速度實(shí)現(xiàn)各種推理過(guò)程。給新一代的計(jì)算架構(gòu)起名為BPU Nash,是意在致敬偉大的數(shù)學(xué)家約翰·納什以及他的著名理論——納什博弈(納什均衡)。所謂的納什博弈,描述了在博弈過(guò)程中,無(wú)論對(duì)方的選擇如何,當(dāng)事人一方都會(huì)選擇某個(gè)確定的策略,任何一方在此策略組合下單方面改變自己的策略(他方策略不變),都不會(huì)提高自身的收益。這個(gè)理論形象地勾勒了地平線(xiàn)在交互博弈算法構(gòu)建過(guò)程中想要達(dá)到的最佳狀態(tài):如果這個(gè)系統(tǒng)能夠達(dá)到納什博弈的水平,那么完成對(duì)于“人類(lèi)操作”的替代、實(shí)現(xiàn)自動(dòng)駕駛就不再是空想。
“單點(diǎn)的算法突破或者算力性能突破,都不是高階智駕達(dá)到好用的關(guān)鍵,充分發(fā)揮硬件和軟件的協(xié)同效應(yīng),并以極致開(kāi)放打造極致效率,才是抵達(dá)高階智駕終局的最佳路徑。”余凱表示。在地平線(xiàn)的邏輯里,軟件與硬件結(jié)合的緊密程度,不僅關(guān)乎計(jì)算效率和能耗降低,也是確保系統(tǒng)和硬件的協(xié)同進(jìn)步、提升整體系統(tǒng)性能效率的核心。
這同樣也是一種全新的開(kāi)集:實(shí)際駕駛環(huán)境需要系統(tǒng)進(jìn)行徹底的交互博弈,用以完成“擬人化”的終極進(jìn)化,而無(wú)論是端到端還是模塊化發(fā)展路徑,都需要硬件基礎(chǔ)的算力支持,在不斷的迭代過(guò)程中,軟件層面需要為硬件配備找到效率的邊際拐點(diǎn),硬件需要根據(jù)場(chǎng)景、模型、數(shù)據(jù)的不斷演進(jìn),在提供基礎(chǔ)算力的同時(shí)完成自我革新。
因此,軟硬協(xié)同的邏輯最終孕生的是一個(gè)更加廣袤的產(chǎn)業(yè)生態(tài),軟硬結(jié)合的產(chǎn)業(yè)支柱是所有的參與者開(kāi)放協(xié)作,由此才能在大模型框架、深度學(xué)習(xí)語(yǔ)料、算法升級(jí)和軟硬結(jié)合等層面實(shí)現(xiàn)全業(yè)態(tài)式的互補(bǔ)。目前,地平線(xiàn)已經(jīng)搭建了國(guó)內(nèi)最為成熟、高效、開(kāi)放的生態(tài)體系之一,并與全球超過(guò)30家車(chē)企達(dá)成了前裝量產(chǎn)合作,合作的量產(chǎn)車(chē)型已經(jīng)超過(guò)110款。
高階智駕的未來(lái),將是一個(gè)不斷擬人、類(lèi)人的過(guò)程。
從響應(yīng)人,到服務(wù)人,再到解放人,智能駕駛在不斷演進(jìn)的過(guò)程中,完成的是人的高維延伸,用優(yōu)雅不慫、從容篤定形容的高階智駕系統(tǒng),一定能夠像“老司機(jī)”一樣預(yù)測(cè)、推理、學(xué)習(xí)、決策。在這里,讓我們放下路徑之爭(zhēng)的自我偏見(jiàn),聚焦到智能駕駛讓人類(lèi)生活更安全、更美好的目標(biāo)本質(zhì)。當(dāng)高階智駕走向平權(quán)時(shí)代,選擇一種“可達(dá)成”的路線(xiàn),是地平線(xiàn)的現(xiàn)實(shí)選擇,而當(dāng)智駕產(chǎn)業(yè)邁向以用戶(hù)、市場(chǎng)需求為導(dǎo)向的公眾利他之時(shí),多方博弈之下,一定會(huì)窮舉出一個(gè)產(chǎn)業(yè)發(fā)展核心:那就是在產(chǎn)品量產(chǎn)、用戶(hù)體驗(yàn)、公眾利益互相交融的智駕市場(chǎng),技術(shù)普惠最終會(huì)給體驗(yàn)普惠,讓渡出一個(gè)“體驗(yàn)上更擬人、技術(shù)上更類(lèi)人”的落地空間。
-
智能駕駛
+關(guān)注
關(guān)注
3文章
2589瀏覽量
48874 -
自動(dòng)駕駛
+關(guān)注
關(guān)注
784文章
13924瀏覽量
166871 -
地平線(xiàn)
+關(guān)注
關(guān)注
0文章
354瀏覽量
15006
原文標(biāo)題:SuperDrive背后的“思考”:如何讓智駕決策更像老司機(jī)
文章出處:【微信號(hào):horizonrobotics,微信公眾號(hào):地平線(xiàn)HorizonRobotics】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
評(píng)論