“自動(dòng)駕駛所需要的計(jì)算力,是過(guò)去任何一臺(tái)計(jì)算機(jī)都沒(méi)有達(dá)到過(guò)的?!?NVIDIA的掌門人黃仁勛曾在公開場(chǎng)合不止一次的說(shuō)過(guò)這句話。
這句話背后,還有另一層意思。2010年之后,GPU類處理器內(nèi)部的晶體管數(shù)量還保持著快速增長(zhǎng)的勢(shì)頭,而CPU已經(jīng)出現(xiàn)了明顯的放緩。
“摩爾定律已經(jīng)終結(jié),晶體管數(shù)每年增長(zhǎng)50%,但CPU的性能每年僅增長(zhǎng)10%,設(shè)計(jì)人員無(wú)法再創(chuàng)造出可以實(shí)現(xiàn)更高指令級(jí)并行性的CPU架構(gòu)?!痹?017年的GTC China上,NVIDIA的掌門人黃仁勛如是說(shuō)。
NVIDIA是一家研發(fā)生產(chǎn)GPU的公司,對(duì)GPU自然有區(qū)別于他人的崇拜,捧GPU貶CPU可以理解。但,摩爾定律確實(shí)失效了。
NVIDIA是一家傳統(tǒng)消費(fèi)電子廠商,但在汽車領(lǐng)域也不是完全的新手。早在2005年,NVIDIA就開發(fā)了用于3D導(dǎo)航信息系統(tǒng)的Tegra處理器,2011年用在了奧迪A8豪華車型上。
到目前為止,NVIDIA的汽車電子業(yè)務(wù)占該公司47億美元銷售額的4%。2015年,NVIDIA發(fā)布了針對(duì)自動(dòng)駕駛的DRIVE PX系列,開啟了自動(dòng)駕駛領(lǐng)域的馳騁,一時(shí)也成為了市場(chǎng)寵兒,股價(jià)扶搖直上。
支撐起這一切的,是NVIDIAGPU給自動(dòng)駕駛帶來(lái)的想象——DRIVE PX運(yùn)算力強(qiáng)大,是自動(dòng)駕駛必備的運(yùn)算力平臺(tái)。這正應(yīng)驗(yàn)了黃教主開頭所說(shuō)的話,此話不僅被競(jìng)爭(zhēng)對(duì)手英特爾聽了去,同時(shí)也被股民聽了去。
那么,自動(dòng)駕駛到底需耗費(fèi)多少算力?誰(shuí)是算力的最大消耗者?GPU碾壓CPU,NVIDIA超車英特爾已成定局?
視覺處理是大頭
自動(dòng)駕駛的實(shí)現(xiàn),需要依賴感知傳感器對(duì)道路環(huán)境的信息進(jìn)行采集,包括超聲波、攝像頭、毫米波雷達(dá)、激光雷達(dá)等,采集的好的數(shù)據(jù)需要傳送到汽車中央處理器進(jìn)行處理,用來(lái)識(shí)別障礙物、可行道路等,最后依據(jù)識(shí)別的結(jié)果,規(guī)劃路徑、制定速度,自動(dòng)驅(qū)使汽車行駛。
整個(gè)過(guò)程需要在瞬時(shí)完成,延時(shí)必須要控制在毫秒甚至微秒級(jí)別,才能保證自動(dòng)駕駛的行駛安全。
要完成瞬時(shí)處理、反饋、決策規(guī)劃、執(zhí)行的效果,對(duì)中央處理器的算力要求非常高。
最直觀的體現(xiàn),便是用于感知道路環(huán)境的攝像頭,通常密布車身,數(shù)量在12個(gè)左右,為了識(shí)別障礙物,處理器需要對(duì)多路攝像頭實(shí)時(shí)拍攝的數(shù)據(jù)進(jìn)行解析,而單顆1080P的高清攝像頭每秒可以產(chǎn)生超過(guò)1G的數(shù)據(jù),數(shù)據(jù)量不可謂不大。而為了準(zhǔn)確識(shí)別圖像、視頻中的有效信息,業(yè)內(nèi)多采用深度學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)。
深度學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)尤其是幾百上千層的神經(jīng)網(wǎng)絡(luò)對(duì)高性能計(jì)算要求非常高,GPU對(duì)處理復(fù)雜運(yùn)算擁有天然的優(yōu)勢(shì):它有出色的并行矩陣計(jì)算能力,對(duì)于神經(jīng)網(wǎng)絡(luò)的訓(xùn)練和分類都可以提供顯著的加速效果。
適用于自動(dòng)巡航功能的 NVIDIA DRIVE PX 2 計(jì)算平臺(tái)采用新型單處理器配置,功率僅為 10 瓦,可以幫助車輛利用深度神經(jīng)網(wǎng)絡(luò)處理來(lái)自多個(gè)攝像頭和傳感器的數(shù)據(jù),運(yùn)算力達(dá)到了24 Tops。
Tops(Terra Operations per second)是一個(gè)單位,意為每秒運(yùn)算10^12次,也稱萬(wàn)億次。這種說(shuō)法通常用于表示處理器的運(yùn)算力。
但汽車是一個(gè)終端,對(duì)功耗要求苛刻,因此根據(jù)TI的官方報(bào)告,通常對(duì)效率、功耗、算力要求較高的時(shí)候,對(duì)運(yùn)算力的表述更為貼切的是GOPS/W of TOPS/W,即消耗單位瓦數(shù)可以完成多少運(yùn)算量。
業(yè)內(nèi)人士表示,在自動(dòng)駕駛中,最耗費(fèi)算力的當(dāng)屬視覺處理,占到全部算力需求的一半以上。而圖像處理是GPU的強(qiáng)項(xiàng),CPU并不占優(yōu)勢(shì),這一點(diǎn)已經(jīng)在傳統(tǒng)領(lǐng)域得到了驗(yàn)證。
Mobileye的ADAS霸業(yè)
那么視覺處理中,不同等級(jí)自動(dòng)駕駛中對(duì)算力的要求有什么區(qū)別?每一家公司在權(quán)衡之后,選擇特定的視覺芯片方案有什么原因?Minieye的CEO劉國(guó)清在面對(duì)《高工智能汽車》的提問(wèn)時(shí)表示,這是一個(gè)業(yè)內(nèi)人士都知但不為外人道的話題。
嗯,聽起來(lái)很神秘,但想要找到答案其實(shí)也并不難。
Mobileye是自動(dòng)駕駛領(lǐng)域視覺處理最領(lǐng)先的公司(這是基于其市場(chǎng)占有率以及車載領(lǐng)域的經(jīng)驗(yàn)而言)。
從2004年開始,Mobileye相繼推出了EyeQ系列的視覺處理芯片,2010年上市的EyeQ2算力為 0.026Tops,功耗2.5w,支持L1的功能;2014年發(fā)布的EyeQ3每秒浮點(diǎn)運(yùn)算為0.256萬(wàn)億次,功耗為2.5w,支持L2;2015年發(fā)布EyeQ4每秒浮點(diǎn)運(yùn)算可達(dá)2.5萬(wàn)億次,功耗為3w,最高可支持L3;EyeQ5計(jì)劃于2020年量產(chǎn),單顆芯片的浮點(diǎn)運(yùn)算能力為12Tops,TDP是5W。
Mobileye通過(guò)EyeQ芯片,驅(qū)動(dòng)單顆攝像頭,可以采集路面信息,對(duì)周圍環(huán)境進(jìn)行精細(xì)解讀,實(shí)現(xiàn)前碰撞預(yù)警(FCW)、前方車距監(jiān)測(cè)與預(yù)警系統(tǒng)(HMW)、車道偏離預(yù)警系統(tǒng)(LDW)、行人探測(cè)與防撞系統(tǒng)(PCW)、城市前碰撞警告 (UUFCW 與智能遠(yuǎn)光燈控制系統(tǒng)(IHC)等功能,準(zhǔn)確預(yù)測(cè)前方道路可以出現(xiàn)的障礙和危險(xiǎn)。
其識(shí)別準(zhǔn)確率達(dá)99.99%,到目前為止,已有超過(guò)千萬(wàn)的出貨量,占市場(chǎng)份額超過(guò)70%。特斯拉的AutoPilot 1.0的硬件方案就選用了Mobileye的EyeQ3。
Mobileye通過(guò)使用專有的計(jì)算cores(加速器)實(shí)現(xiàn)功耗 - 性能成本目標(biāo),這些cores專門針對(duì)各種計(jì)算機(jī)視覺,信號(hào)處理和機(jī)器學(xué)習(xí)任務(wù)進(jìn)行了優(yōu)化,其中包括深度神經(jīng)網(wǎng)絡(luò)。
這些加速器內(nèi)核專為滿足ADAS和自動(dòng)駕駛市場(chǎng)的需求而設(shè)計(jì)。每個(gè)EyeQ ?芯片具有異質(zhì)的,完全可編程的加速器; 每種加速器類型都針對(duì)其自己的算法系列進(jìn)行了優(yōu)化。
加速器體系結(jié)構(gòu)的多樣性使應(yīng)用程序能夠通過(guò)為每項(xiàng)任務(wù)使用最合適的內(nèi)核來(lái)節(jié)省計(jì)算時(shí)間和芯片功耗。優(yōu)化任務(wù)cores的分配從而保證了EyeQ ? 在低功耗范圍內(nèi)提供“超級(jí)計(jì)算機(jī)”功能,實(shí)現(xiàn)高性價(jià)比的被動(dòng)散熱。
Mobileye的core是包含一組工作在1GHZ的工業(yè)級(jí)四核MIPS處理器,支持多線程技術(shù)能更好的進(jìn)行數(shù)據(jù)的控制和管理; 多個(gè)專用的向量微碼處理器(VMP(Vector Microcode Processor,俗稱VMP)),用來(lái)應(yīng)對(duì)ADAS相關(guān)的圖像處理任務(wù)(如:縮放和預(yù)處理、翹曲、跟蹤、車道標(biāo)記檢測(cè)、道路幾何檢測(cè)、濾波和直方圖等);一顆軍工級(jí)MIPS Warrior CPU位于次級(jí)傳輸管理中心,用于處理片內(nèi)片外的通用數(shù)據(jù)。
自動(dòng)駕駛算力之爭(zhēng),NVIDIA領(lǐng)銜
Autopilot 2.0 使用了Drive PX2,DRIVE PX 2有多個(gè)版本,AutoCruise,搭載一顆Tegra Parker,主要支持高速公路自動(dòng)駕駛和高精地圖繪制的計(jì)算;AutoChauffeur,搭載2顆Tegra Parker和2顆獨(dú)立的Pascal架構(gòu)GPU,支持點(diǎn)到點(diǎn)的自動(dòng)駕駛;Fully Autonomous Driving,由多套Drive PX2組成的計(jì)算矩陣。
NVIDIA2015年推出了Drive PX系列,第一代Drive PX搭載TegraX1處理器和10GB內(nèi)存,能夠同時(shí)處理12個(gè)200萬(wàn)像素?cái)z像頭每秒60幀的拍攝圖像,單浮點(diǎn)計(jì)算能力為2Tops,深度學(xué)習(xí)計(jì)算能力為2.3Tops,可支持L2高級(jí)輔助駕駛計(jì)算需求。
2016年發(fā)布的Drive PX2,單精度計(jì)算能力達(dá)到8TFlops,深度學(xué)習(xí)計(jì)算能力達(dá)24Tops,TDP達(dá)250W,可滿足L3級(jí)別的自動(dòng)駕駛需求。
Drive PX2采用16nm FinFET工藝,TDP 250W,支持12路攝像頭輸入、激光定位、雷達(dá)和超聲波傳感器。
它的目的是通過(guò)NVIDIA DIGITS打造一套車輛的深度學(xué)習(xí)訓(xùn)練平臺(tái),讓每輛安裝Drive PX2的車輛都成為都成為NVIDIA DRIVENet深度神經(jīng)網(wǎng)絡(luò)一部分,它將包括3個(gè)卷積碼層,3700萬(wàn)個(gè)神經(jīng)元。傳說(shuō)如果一條信息要在整個(gè)網(wǎng)絡(luò)流經(jīng)一次,將會(huì)產(chǎn)生400億次操作。
根據(jù)黃仁勛在BCW 2017的表述,Drive PX2的方案是針對(duì)L3的方案(作為參考的是奧迪A8推出的有限場(chǎng)景下的L3級(jí)自動(dòng)駕駛,采用的ZF ProAI正是使用了NVIDIA Tegra K1 SoC,及Drive PX2 AutoCruise版本,當(dāng)然負(fù)責(zé)視覺處理的還是Mobileye的EyeQ3),而Xavier則是針對(duì)L4的方案,Xavier的運(yùn)算力達(dá)到了1Tops/W。Drive Xavier于2018年發(fā)布,算力可達(dá)30Tops,TDP為30W。
到目前為止,黃教主給L3、L4級(jí)別的自動(dòng)駕駛算力,列出了自己心目中的標(biāo)準(zhǔn)。這一標(biāo)準(zhǔn)由于標(biāo)新立異,還未有人敢質(zhì)疑。
自動(dòng)駕駛公司在進(jìn)行新項(xiàng)目的研發(fā)時(shí),也往往以NVIDIA的開發(fā)板為首。傳統(tǒng)的芯片巨頭英特爾,在巨資收購(gòu)Mobileye后,心里還不踏實(shí),因?yàn)镸obileye一直針對(duì)的是ADAS,其量產(chǎn)的EyeQ3芯片0.256Tops的算力,跟NVIDIA PX2的8/24Tops相比,似乎差了一個(gè)時(shí)代。
算力的焦慮在困擾著Inter這個(gè)巨頭,自動(dòng)駕駛公司同樣也不輕松,開發(fā)中可以使用NVIDIA打底,量產(chǎn)方案卻少有人嘗鮮。
這一方面是源于價(jià)高非車規(guī)級(jí),另一方面NVIDIA也需要汽車市場(chǎng)的驗(yàn)證。另一頭Mobileye的EyeQ系列,基本為自用,不放心外人擅自開發(fā),NVIDIA和Mobileye的分手據(jù)傳也緣起于此。
那么,留給自動(dòng)駕駛公司的芯片方案,還有哪些呢?市場(chǎng)應(yīng)聲者寥寥無(wú)幾,NXP、高通、英飛凌等公司,推出的都是針對(duì)較低自動(dòng)駕駛等級(jí)的ADAS芯片方案,目前一些有量產(chǎn)項(xiàng)目的ADAS公司,采用的也多是這些傳統(tǒng)車載芯片領(lǐng)域廠商的產(chǎn)品。這些廠商之間的方案有什么異同?留待下一篇文章再述吧~
-
神經(jīng)網(wǎng)絡(luò)
+關(guān)注
關(guān)注
42文章
4777瀏覽量
100973 -
NVIDIA
+關(guān)注
關(guān)注
14文章
5059瀏覽量
103413 -
自動(dòng)駕駛
+關(guān)注
關(guān)注
784文章
13904瀏覽量
166729
原文標(biāo)題:自動(dòng)駕駛的算力之爭(zhēng),誰(shuí)在孤獨(dú)求??? | GGAI視角
文章出處:【微信號(hào):ilove-ev,微信公眾號(hào):高工智能汽車】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
評(píng)論