我們要真正的形成中國的海量大數(shù)據(jù),選擇適合我們的芯片。
9月8日,在CTDC首席技術(shù)官領(lǐng)袖峰會(huì)上,小鵬汽車自動(dòng)駕駛副總裁谷俊麗博士發(fā)表了題為“AI car 和自動(dòng)駕駛進(jìn)化論”的主題演講,分享了小鵬汽車正在推動(dòng)的中國式自動(dòng)駕駛研發(fā)之路以及在這一領(lǐng)域的最近進(jìn)展。
小鵬汽車自動(dòng)駕駛副總裁谷俊麗博士
同期,谷俊麗博士宣布,小鵬汽車近期已經(jīng)獲得美國加州自動(dòng)駕駛路測許可。
小鵬汽車已經(jīng)獲得美國加州自動(dòng)駕駛路測許可
CTDC首席技術(shù)官領(lǐng)袖峰會(huì)是國內(nèi)最頂級(jí)、最具前瞻性的互聯(lián)網(wǎng)峰會(huì)之一,聚集了業(yè)內(nèi)頂尖的技術(shù)領(lǐng)導(dǎo)者?!癆I智享未來”是本屆峰會(huì)的主題,功能汽車到智能汽車的變革也是本屆峰會(huì)探索的重要議題。
”自動(dòng)駕駛國際化存在不少瓶頸,自動(dòng)化駕駛進(jìn)化的必然趨勢是軟件的強(qiáng)本地化。沒有中國實(shí)際駕駛場景數(shù)據(jù)的積累,很多自動(dòng)駕駛功能在中國“水土不服”、甚至“目中無物”,無法適應(yīng)中國的實(shí)際駕駛路況、交通密度和中國用戶的駕駛習(xí)慣,”谷俊麗博士表示:“小鵬汽車的目標(biāo)是大規(guī)模量產(chǎn)具備六維感知能力的高智能互聯(lián)網(wǎng)汽車(AI Car),使得車輛能夠具備自我感知、物體感知、高精定位、預(yù)測未來、交互和事件及決策推理能力,提高自動(dòng)駕駛在中國駕駛場景的安全和創(chuàng)新?!?/p>
今年年內(nèi),小鵬G3即將上市,并啟動(dòng)交付。小鵬G3將搭載領(lǐng)先的自動(dòng)駕駛硬件,配有20余個(gè)智能感應(yīng)設(shè)備,適配本地化自動(dòng)駕駛,并將提供覆蓋高頻生活場景的自動(dòng)泊車功能。
以下為谷俊麗博士演講實(shí)錄:
謝謝大家!今天非常高興有機(jī)會(huì)和大家分享關(guān)于中國式自動(dòng)駕駛的思考。
先簡單自我介紹一下,我去年10月份加入小鵬汽車,之前在特斯拉總部負(fù)責(zé)人工智能和自動(dòng)駕駛,帶領(lǐng)團(tuán)隊(duì)做了Autopilot。從對(duì)AI的思考,到自動(dòng)駕駛的研發(fā),我都是從最前期開始介入的,個(gè)人有一些感觸今天來跟大家分享。
我重點(diǎn)講解一下自動(dòng)駕駛,它本身是一個(gè)AI驅(qū)動(dòng)的技術(shù),一個(gè)系統(tǒng),我叫它AI Car。我會(huì)跟大家分享自動(dòng)駕駛整體的國際上的進(jìn)化論,以及在中國我們想怎么做。
首先,我先來總結(jié)一下,在中國,自動(dòng)駕駛概念從2016年開始炒,到2017年炒到火爆,到現(xiàn)在我覺得公眾已經(jīng)失去感知了,已經(jīng)不知道自動(dòng)駕駛是什么了。所以,我想講解一下自動(dòng)駕駛到底是什么,以及西方的技術(shù)并不能真正拿到中國來使用,比如說特斯拉的Autopilot。
我先講解一下人類歷史的交通變革。我經(jīng)常想,人類歷史的交通從擺脫原始的交通工具,比如說馬車、驢車,到現(xiàn)在林林總總的各種汽車,其實(shí)也只有一百年的時(shí)間。那發(fā)生了什么?
我們從原始到模擬的機(jī)械器件,然后通過(裝有)汽車輪子的福特Model T(T型車)往前演進(jìn),出現(xiàn)奧迪、奔馳這樣的品牌。我們在機(jī)械、控制層面,在發(fā)動(dòng)機(jī)、燃油機(jī)層面做了一百年的工作,現(xiàn)在已經(jīng)幾乎飽和了。
車正在悄然發(fā)生變化,它在從模擬的器件悄悄變成數(shù)字化的器件,就像21世紀(jì)初,我們還在用諾基亞的功能機(jī),通過鍵盤來按,到后來慢慢地我們幾乎所有人都不再用一個(gè)滿是按鈕的手機(jī)了。從功能機(jī)到數(shù)字機(jī)到智能機(jī)的演變,同樣的革命正發(fā)生在車輛上。數(shù)字化要有傳感器,計(jì)算單元,要嵌到車上,且讓用戶感覺不出來,這是數(shù)字化的過程,是對(duì)車本身變革的過程。在這個(gè)基礎(chǔ)上,我們再做一些輔助駕駛、預(yù)警,然后脫手,眼睛可以離開的,各種智能化的工具功能,它是這么一個(gè)變革過程。
拋去外表發(fā)生的變化,在技術(shù)本身,自動(dòng)駕駛讓我自學(xué)了很多專業(yè),從做芯片到做AI算法,到軟件,到做自動(dòng)駕駛。自動(dòng)駕駛是我做過的最難的、最復(fù)雜的一個(gè)工程,沒有其一。為什么呢?因?yàn)閽侀_自動(dòng)駕駛這幾個(gè)字,它里面涵蓋了人類過去一百年幾乎所有最重要的技術(shù)、信息革命的一些關(guān)鍵突破。我來講解一下在我眼中大家所說的自動(dòng)駕駛包含哪幾代技術(shù)的框架。
自動(dòng)駕駛第一代是由像特斯拉這樣的公司搞起來的,當(dāng)時(shí)用的是采用融合供應(yīng)商的方案,比如說目前主流的國外融合MobileEye,國內(nèi)融合博世。國內(nèi)的自動(dòng)駕駛絕大部分由博世控制,這就是第一代集成方案。汽車本身是一個(gè)復(fù)雜的工程,是一個(gè)拼接的系統(tǒng)工程,就是把上萬個(gè)零部件集成到一起。造車本身不是一個(gè)造技術(shù)的過程,技術(shù)是由供應(yīng)商在各個(gè)角度,比如說控制單元,發(fā)動(dòng)機(jī)單元,電池單元以及感知算法單元,分別去突破的。這是第一代技術(shù)。
第一代技術(shù)有一個(gè)瓶頸,無法打通,供應(yīng)商的東西是無法改變的。所以出現(xiàn)了第二代,自己選擇一個(gè)芯片,把車、數(shù)據(jù)以及自我編程打通,可以改變我的功能。這是第二代,在芯片以及自主研發(fā)的算法上做自己的軟硬一體的設(shè)計(jì)。
我們現(xiàn)在發(fā)現(xiàn)AI是一個(gè)對(duì)計(jì)算能力需求無窮盡的應(yīng)用,尤其對(duì)自動(dòng)駕駛,在私家車上做應(yīng)用,它的場景是無限量的,你無法完全描述自動(dòng)駕駛的車會(huì)遇到什么。所以,它對(duì)計(jì)算的需求也是無窮盡的。現(xiàn)在出現(xiàn)了很多公司,國際巨頭Waymo也好,特斯拉也好,都是自己做芯片,為什么?過去人類60年做的所有芯片是針對(duì)通用計(jì)算的。真正到車上,這種復(fù)雜的流水需要更強(qiáng)大的芯片。這是第三代。
大家想起自動(dòng)駕駛,可能都想起各種各樣的車。Waymo的車上面架了一個(gè)像船一樣的盒子,Cruise的車上pony 面架了8到10個(gè)雷達(dá)。中國的很多自動(dòng)駕駛公司,包括景馳,都是上面掛著很多東西。這是第四代自動(dòng)駕駛,通常是說在特定場景下不需要人了,是完全的driverless,沒有駕駛員。
為了做到這一點(diǎn),它很難,我先限定場景,再在車上針對(duì)這個(gè)場景掛各種傳感器,做各種計(jì)算單元。所以,到第四代,車就為自動(dòng)駕駛設(shè)計(jì)的。你看它不像臺(tái)車,是因?yàn)閭鹘y(tǒng)的車不涵蓋這個(gè)東西,現(xiàn)在兩者是一種嫁接關(guān)系,還不是一個(gè)產(chǎn)品的形態(tài)。
我從特斯拉來到小鵬,是想解決中國化的自動(dòng)駕駛。我們第一代車,今年的量產(chǎn)車上會(huì)介于第一代跟第二代技術(shù)之間,我們會(huì)采用部分集成供應(yīng)商,部分自主研發(fā)。這也是基于的我們自主研發(fā)的節(jié)奏,需要一定的時(shí)間去啟動(dòng)。我們在第二代車上,2020年的車上,會(huì)將自動(dòng)駕駛自主研發(fā)的通道從算法到芯片,一直到車上打通。
我們?yōu)槭裁匆鲞@個(gè)事情?很多人來問我,不管是吉利,沃爾沃,特斯拉,都有這個(gè)產(chǎn)品,為什么還要再做?是,是有這個(gè)產(chǎn)品,但是在大部分的中國場景下沒人敢用,因?yàn)樗贿m合中國的駕駛場景。它會(huì)有水土不服,比如說中國路上的障礙物是不規(guī)則的,幾乎無法辨別在中國道路上遇到的所有障礙物。中國的交通規(guī)則是不規(guī)范的,因?yàn)橹袊幕鞣轿幕遣灰粯拥?,駕駛問題確實(shí)是反映人的文化問題、習(xí)慣問題以及社交問題。它不是簡單的在實(shí)驗(yàn)室內(nèi)的技術(shù),有水土不服的問題,也就是說,為什么中國這么多車,但使用率不是特別高。
我個(gè)人認(rèn)為,中國的自動(dòng)駕駛只能中國人自己來解決。還有人在微博上提問我,說從來沒有聽任何一個(gè)技術(shù)是帶著國家邊界的。我倒不是說這是國家邊界,而是說整個(gè)通道,就像任督二脈,我們現(xiàn)在還沒有打通。我們要真正的形成中國的海量大數(shù)據(jù),選擇適合我們的芯片。在這個(gè)基礎(chǔ)上,要搭建適合中國自動(dòng)駕駛的傳感器系統(tǒng),而這個(gè)系統(tǒng)一定要針對(duì)中國的場景,要涵蓋中國的一些特定軌跡、特定場景、特定交通動(dòng)態(tài)。在這個(gè)基礎(chǔ)上,再做中國的算法研究。我認(rèn)為在中國解決自動(dòng)駕駛技術(shù)要比西方難十倍以上,這是一個(gè)框架性的問題,也是一個(gè)創(chuàng)新性的問題,也是需要很多技術(shù)積累的問題。一定要中國人自己來深耕解決。
第二部分,我想講解一下小鵬汽車對(duì)AI Car的定義。定義很重要。我認(rèn)為車應(yīng)該有三重智能才能在中國的馬路上開,這是一個(gè)科普性的概念吧。我們先說AI Car,它包含著很多東西,比如說有幾十個(gè)傳感器來感知環(huán)境,有互聯(lián)的功能,然后去取地圖,有云的功能、芯片的功能、人工智能實(shí)時(shí)的計(jì)算功能,自適應(yīng)學(xué)習(xí)以及林林總總的功能。我來分解一下,它是怎么一種三重智能。
首先,我個(gè)人認(rèn)為不僅僅依靠云端智能,車一定要自己會(huì)開,所以一定要在車上有實(shí)時(shí)的足夠感知環(huán)境的(比如看200米也好,150米也好)攝像頭加上雷達(dá),再做融合。我們?yōu)槭裁匆鲞@么多種類的傳感器?因?yàn)闆]有一種傳感器能夠滿足駕駛所看到的環(huán)境的需求。比如,攝像頭能看到扁平的二維物體,雷達(dá)能看到速度跟三維,這兩者要加起來。如果有一種傳感器,能夠準(zhǔn)確告知它的三維的方向以及它的語意,這也是對(duì)自動(dòng)駕駛將會(huì)產(chǎn)生推動(dòng)性作用的技術(shù)創(chuàng)新。
AI很重要。沒有人可以否認(rèn)自動(dòng)駕駛,本質(zhì)上就是由AI推動(dòng)的問題,AI將會(huì)對(duì)它周圍的傳感器拿來的數(shù)據(jù)進(jìn)行識(shí)別,對(duì)其他車輛進(jìn)行識(shí)別,從而作出自己的一些決策跟軌跡規(guī)劃。而AI要求的是高性能級(jí)的計(jì)算,所以一定要有高性能級(jí)別的芯片,且滿足車規(guī),在車上運(yùn)行。
可能這個(gè)問題大家一想覺得很簡單,我們不是有很多云,有很多GPU嗎?但那些是不完全滿足車規(guī)的,一輛車跑在馬路上,是五星級(jí)的安全規(guī)格,不允許隨時(shí)硬盤壞掉,隨時(shí)可以重啟。而任何云端的東西都存在故障率,這是不允許的。當(dāng)然了,我們也要互聯(lián),因?yàn)榛ヂ?lián)可以告訴我們地圖,互聯(lián)可以告訴我們交通信息以及更多。剛才講的是個(gè)體智能。
車多了,可以增加群體智能,有十臺(tái)車開過這里,看到這里馬路斷了,就可以告訴后面的車,叫群體智能。就像蟻群一樣,車也可以做到同樣的智能。另外一個(gè)輔助智能,尤其是在中國很流行,我覺得中國政府做事情,彎道超車的概念,很難去避免。
比如說個(gè)體智能做不到這么多東西,那在馬路上加上各種東西,這就是輔助智能。怎么搞,這個(gè)東西沒在車上,這就是輔助智能,借助環(huán)境本身的感知能力。V2X讓車可以給各種東西發(fā)信號(hào),但這只是一種愿景,很難做到把世界(改造),改造一輛車已經(jīng)很難了,把世界都改了,裝上傳感器,且傳感器日異月新,也不是百分之百可靠的,這本身是個(gè)浩大的工程。所以,我個(gè)人認(rèn)為它只是一個(gè)輔助性的東西。
接下來簡單分享一下我們說中國式自主研發(fā),到底它的關(guān)鍵點(diǎn)跟我們自己的分解是怎樣的。做自動(dòng)駕駛有這么多核心的東西,你規(guī)避不開,一定要去深耕,一定要去沉淀。比如芯片一定要有,沒有不要搞AI。第二,自主研發(fā)措施打通任督二脈,把數(shù)據(jù),也就是代表場景跟車,跟算法連接起來,這是真正自動(dòng)駕駛,是一個(gè)框架性的東西。海量中國場景大數(shù)據(jù),不管你再怎么海量,世界天天變,所以這是一個(gè)永恒的難題。
我逐一分解一下,海量大數(shù)據(jù)場景,這個(gè)場景要在公開的任意的,不能是限定場景。我們經(jīng)常有朋友開車,在硅谷開得好好的,一旦開到中國,發(fā)現(xiàn)什么都不行了,就是因?yàn)閳鼍白兞?,一切都變了。所以,場景是一切的源泉,而場景體現(xiàn)在大數(shù)據(jù)里邊,而這個(gè)場景是要不加限制的,只要用戶開過的地方,你都要去開,去搜集。拿這個(gè)數(shù)據(jù)到云端經(jīng)過組織之后,把它進(jìn)行AI的創(chuàng)新,肯定是創(chuàng)新的,你要識(shí)別,所有的東西要做預(yù)測。然后把算法弄到車載上,不要再僅僅在云端控制車輛。弄到車載上,要在車上能算得動(dòng),才有產(chǎn)品。形成閉環(huán)之后,讓算法通過數(shù)據(jù)生長,讓算法在車上得到驗(yàn)證。這是一個(gè)框架,跟智能得以演進(jìn)。解決中國的自動(dòng)駕駛一定要讓這個(gè)框架轉(zhuǎn)起來,要讓智能可演進(jìn),因?yàn)闆]有人可以一步解決所有。
我總結(jié)了大家認(rèn)為對(duì)AI的定義,每個(gè)人有不同的理解。在車上,我們需要AI的“六維感知”,第一維感知,得知道自己是怎么動(dòng)的,怎么運(yùn)轉(zhuǎn),車輛動(dòng)力學(xué)。第二維,要知道周圍是什么物體。第三維,要知道物體精準(zhǔn)的在什么地方。第四維,時(shí)間維度,要知道互相之間它的預(yù)測,未來。人駕駛時(shí)的反應(yīng)弧其實(shí)是很長的,比如是400毫秒,甚至比算法要長。但是人能夠駕駛很好,因?yàn)槿藢?duì)未來有預(yù)測,他是基于預(yù)測在開車,而算法總是基于歷史,過去看到的傳感器看到再算,算完決策,這個(gè)反應(yīng)弧是基于過去在做預(yù)測。所以,我們?yōu)榱藦浹a(bǔ)這種延時(shí),要對(duì)每個(gè)車輛的軌跡,每個(gè)賬號(hào)的軌跡進(jìn)行預(yù)測,別人可能不讓你加塞,別人可能會(huì)換道,你到底怎么想,你才能做出最好的一個(gè)決策。第五維,你做了一個(gè)決策,每個(gè)人開車不一樣,有的人就是我盡快走,有人要安全第一,有人要舒適第一。所以,你做決策要理解基于什么樣一種規(guī)則做的決策,這是第六維。六維感知之后才能真正的做到自動(dòng)駕駛,我們現(xiàn)在的AI其實(shí)最多到了第二維,或者到第2.5維。
從2012年突破大數(shù)據(jù)的深度學(xué)習(xí),給大家提供了一個(gè)很好的水平線,都水漲船高,在一個(gè)水平線上了,能夠識(shí)別上千物體、上萬物體的98%的精度。這是二維。到第三維,我們需要高精定位,高精地圖在量產(chǎn)車上量產(chǎn)方案做,現(xiàn)在是一個(gè)全世界都沒有完全解決的問題。所以,我們現(xiàn)在在二跟三之間,但我們同時(shí)可以在研究界以及算法界可以做第四維、第五維的一些突破,一些預(yù)言,但是,真正落到產(chǎn)品上還需要一些實(shí)踐跟積累。所以,自動(dòng)駕駛真正做起來,是結(jié)合傳統(tǒng)經(jīng)典算法,結(jié)合對(duì)scenarios的理解,有很多 scenarios,有很多場景。再結(jié)合AI做了各種各樣的復(fù)雜流水,所以為什么你看各個(gè)自動(dòng)駕駛公司,有些人說我三個(gè)月車都可以開了,那接下來這兩年你在干嗎?在解決各種 scenarios,沒完沒了的scenarios,且這個(gè)車只要一換城市,發(fā)現(xiàn)什么東西都變了,要重新再搞一下,這就是自動(dòng)駕駛的難處了。
另外,車不是一臺(tái)手機(jī),也不是一個(gè)電腦,安全要第一。要做到安全是很復(fù)雜的,車本身有控制單元,有感知單元,現(xiàn)在又有芯片,各種各樣的東西加到一起。為了解決這個(gè)問題,我們在傳感器上,在控制單元上,在急剎車上都做了一些冗余,把安全以及智能分成了四個(gè)層次的框架系統(tǒng),一層一層往上去漲。
我一個(gè)基本的原則就是,任何高級(jí)的智能都是不能以犧牲性命關(guān)天的安全性為原則。比如說,Uber前幾個(gè)月發(fā)生了一些車禍,就是AEB沒有啟發(fā)。這種情況下,不管整個(gè)車有多智能,我是不會(huì)去用的,因?yàn)锳EB是性命攸關(guān)的。所以,在設(shè)計(jì)我們的系統(tǒng)上,第一步保證傳統(tǒng)一百年造車留下的精華不要被損害。第二層,有一個(gè)冗余。第三層、第四層,我再說高級(jí)的智能,如果高級(jí)的智能做不到,就回到下面的一些智能上去,保證人的性命安全,比智能的fancy的未來更重要。
最后,想跟大家分享一下我們的產(chǎn)品的智能演進(jìn)。我說過,要解決自動(dòng)駕駛問題,我不相信有一家廠商可以站出來說我落后的都解決了,這是不科學(xué)的,這個(gè)問題有它的科學(xué)性。所以它一定有一個(gè)演進(jìn)的道路。
中國人駕駛的焦慮痛點(diǎn)跟外國人不一樣,比如說外國人很少有停車焦慮,停車場都很多。但是中國人停車焦慮是很大的,所以我們第一步先從停車焦慮開始解決,從耳朵,就是先用超聲波,基于超聲波的泊位,像蝙蝠探測一樣,要前后、左右有車輛才能去檢測,超聲波也是現(xiàn)在市場上,大部分的停車系統(tǒng)用的技術(shù)框架。我們在此基礎(chǔ)上加了視覺,車場空空的,超聲波探測不出來任何車位這是很傻的,是人不能理解的。所以加上視覺,讓他能夠看到各種停車位。最后再加上語音,讓人可以跟它交互,再到一些記憶性的東西,一步一步演進(jìn)它的智能。
對(duì)于自動(dòng)駕駛來講,駕駛焦慮,比如說春運(yùn)的時(shí)候長途開高速公路的焦慮,比如說每天上下班,在一線城市每個(gè)人平均50分鐘、一個(gè)小時(shí)的堵車,上下早晚高峰的焦慮。這種焦慮已經(jīng)使得車變成了除了家、公司之外非常重要的生存空間。
我們解決完駕駛焦慮之后,會(huì)從高速自動(dòng)駕駛開始去做,L2就是人可以不允許脫手,手要實(shí)時(shí)在上面,L3可以允許脫手了,長途跋涉的時(shí)候,人的焦慮性、疲勞性可以得到更大程度的改善。到擁堵情況下,車可以自己跟停,handle一些換道,handle一些別人加塞的問題,解決早晚駕駛高峰的焦慮。
再到未來,城市十字路口怎么過,現(xiàn)在也是一個(gè)永恒的難題,怎么上下高速,是真正做到從A點(diǎn)到B點(diǎn)的自動(dòng)駕駛的關(guān)鍵技術(shù)門檻。
到最后,其實(shí)就算這些技術(shù)問題都解決了,自動(dòng)駕駛問題也沒有完全解決,因?yàn)槿说鸟{駛習(xí)慣,用戶體驗(yàn)是我們最重要解決的問題。每個(gè)人駕駛的習(xí)慣不一樣,有人喜歡激進(jìn)型,有人喜歡平穩(wěn)型,最后我們要解決個(gè)性化的駕駛問題,這是我們的演進(jìn)之路,粗框架的。
同時(shí),我們要說車內(nèi)智能也要去做,當(dāng)人越來越多的解放出來之后,雙腳、雙手、眼睛都解放了,人在車?yán)锔蓡??在真正做?a href="http://wenjunhu.com/v/tag/472/" target="_blank">無人駕駛之前,其實(shí)車是一個(gè)人機(jī)共同體,有一部分場景是車,有部分場景是人。只是在L2的時(shí)候,人大部分還要駕駛,車駕駛少部分場景,越往上車越來越多的不需要人去管。在這個(gè)過程中,我們要通過駕駛員狀態(tài)監(jiān)測來告知系統(tǒng),進(jìn)行協(xié)同,人現(xiàn)在疲憊了,要給他十秒鐘的時(shí)間接管,或者是他現(xiàn)在看手機(jī),要八秒鐘的時(shí)間來接管,要提前提醒他。才能夠說在車開的越來越多的情況下,能夠做到更好的無縫的更安全的功能的配合。
最后我想跟大家分享一下,我們現(xiàn)在自動(dòng)駕駛中心是一個(gè)兩岸四地的跨國團(tuán)隊(duì),在廣州總部解決造車測試的問題,在硅谷有團(tuán)隊(duì)解決軟件研發(fā)的問題,在上海,北京也都有團(tuán)隊(duì)。
我們近期也有好消息,小鵬汽車在硅谷取得加州自動(dòng)駕駛路測許可。希望在今年,我們只做少量的事情,其中一件最重要的事情就是把任督二脈打通,把框架建立起來,然后實(shí)現(xiàn)基本的功能,開始真正的上車做實(shí)驗(yàn)。
我希望我們是一個(gè)做正確的事,用正確的方法做事的團(tuán)隊(duì),希望大家能夠關(guān)注我們接下來的成績和結(jié)果。
評(píng)論
查看更多