0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

AI前沿技術(shù),Waymo為什么會(huì)突然對(duì)宣傳其AI實(shí)力感興趣?

mK5P_AItists ? 來(lái)源:未知 ? 作者:李倩 ? 2018-05-15 18:52 ? 次閱讀

翻譯 | 尚巖奇

此刻,一輛無(wú)人駕駛的小型貨車正行駛在亞利桑那州鳳凰城的郊外。你可能會(huì)擔(dān)憂它是否安全,但為這輛車打造了自動(dòng)駕駛大腦的 Waymo 希望能向你保證,這輛車是很安全的。

Alphabet 旗下的無(wú)人駕駛汽車部門 Waymo 是目前世界上唯一一家有全無(wú)人駕駛汽車(車內(nèi)無(wú)人)上路權(quán)限的公司。實(shí)現(xiàn)這一切的技術(shù)是由一系列由機(jī)器學(xué)習(xí)驅(qū)動(dòng)的復(fù)雜神經(jīng)網(wǎng)絡(luò),但直至現(xiàn)在,外界對(duì) Waymo 的技術(shù)仍知之甚少。

這是 Waymo 首次向外界披露其眾多技術(shù)中最重要(或最難理解)的技術(shù)。以多種標(biāo)準(zhǔn)衡量,Waymo 在這場(chǎng)無(wú)人駕駛汽車競(jìng)賽中都遙遙領(lǐng)先。Waymo 驕傲地宣傳著它所擁有的當(dāng)前最先進(jìn)的無(wú)人駕駛系統(tǒng)(大腦)。

它當(dāng)下的成功離不開以下幾個(gè)因素:其姊妹公司 Google 在 AI 投資上搶得先機(jī);Google 完成的幾項(xiàng)戰(zhàn)略性收購(gòu);Waymo 與 Google 內(nèi)部 AI 研究員團(tuán)隊(duì)的緊密合作關(guān)系。

▌AI前沿技術(shù)

任何人都可以買一大堆攝像機(jī)和 LIDAR 傳感器安裝在車上,然后將其稱為自動(dòng)駕駛汽車。但人工智能前沿技術(shù)的目標(biāo)是訓(xùn)練自動(dòng)駕駛系統(tǒng)像人類駕駛員那樣開車,或者比人類駕駛的更好(這更為重要)。Waymo 的工程師不僅對(duì)汽車如何識(shí)別道路上的物體進(jìn)行了建模,還對(duì)人類行為如何影響汽車的應(yīng)有反應(yīng)進(jìn)行建模。借助 600 萬(wàn)英里的公路行駛數(shù)據(jù)和 500 萬(wàn)英里的模擬行駛數(shù)據(jù),他們讓系統(tǒng)利用深度學(xué)習(xí)來(lái)學(xué)習(xí)理解、預(yù)測(cè)和做出反應(yīng)。

Waymo 最新加入的員工 Anca Dragan 在這個(gè)項(xiàng)目中負(fù)責(zé)著重要的工作。她在今年一月剛加入 Waymo,在這之前她是加州大學(xué)伯克利分校 InterACT 實(shí)驗(yàn)室主任,專注于研究人類與機(jī)器人的交互。Dragan 在 Waymo 的職責(zé)是確保人類(行為、乘客、其他汽車的駕駛員)與 Waymo 無(wú)人駕駛汽車的交互是完全積極的。換句話說(shuō), Dragan 的職責(zé)是防止機(jī)器人革命的發(fā)生。

一方面我們不希望機(jī)器人稱霸地球,另一方面我們也不想要畏手畏腳的機(jī)器人駕駛員,Dragan 必須在其中找到一種平衡。比如,如果你以 65 英里/每小時(shí)的速度在一條擁擠的高速公路上快速行駛,你想要擠到左邊的車道上去,這時(shí)你可能會(huì)慢慢地將車向左邊靠過(guò)去,直到其他駕駛者最終給你讓出空間。

無(wú)人駕駛汽車可能會(huì)很難完成這個(gè)任務(wù),因?yàn)樗?jīng)過(guò)訓(xùn)練后會(huì)遵守道路交通規(guī)則。推特上最近有一段視頻顯示,Waymo 的一輛無(wú)人駕駛休旅車試圖擠進(jìn)一條擁擠的高速車道,但失敗了。

Dragan 稱:“如何讓無(wú)人駕駛汽車適應(yīng)同道路上的其他司機(jī)?如何調(diào)整無(wú)人駕駛汽車才能使乘坐者更加舒適或者使行駛更加自然?這些都是細(xì)微的改進(jìn),如果想要實(shí)現(xiàn)這些改進(jìn),就必須打造一個(gè)好用的自動(dòng)駕駛系統(tǒng)”。

對(duì)無(wú)人駕駛汽車來(lái)說(shuō),要避免交通意外發(fā)生是它的使命,但最近這幾個(gè)月噩耗連連。三月,一位 49 歲的女性在亞利桑那州 Tempe 市過(guò)馬路時(shí)被 Uber 的一輛無(wú)人駕駛汽車撞死。幾周之后,一輛特斯拉 Model X 的車主在使用 Autopilot 半自動(dòng)駕駛輔助系統(tǒng)時(shí)遭遇車禍當(dāng)場(chǎng)身亡。上周,Waymo 的一輛自動(dòng)駕駛休旅車被一輛本田轎車從側(cè)面撞上,當(dāng)時(shí)本田轎車突然轉(zhuǎn)向駛?cè)胛餍熊嚨馈?/p>

▌噩耗連連

與此同時(shí),公眾對(duì)無(wú)人駕駛汽車越來(lái)越懷疑。監(jiān)管者開始重新思考是否應(yīng)該允許公司制造和測(cè)試全無(wú)人駕駛汽車。在外界的這些質(zhì)疑聲中,Waymo 邀請(qǐng)我拜訪 Waymo 在加州山景城的總部,對(duì)該公司人工智能部門的高層進(jìn)行深度訪談。

Waymo 總部在 X 實(shí)驗(yàn)室內(nèi),后者是 Google 的高風(fēng)險(xiǎn)研究和開發(fā)實(shí)驗(yàn)室,離Googleplex 主園區(qū)只有幾英里(2015 年,Google 改組為大型聯(lián)合企業(yè) Alphabet,X 實(shí)驗(yàn)室從 Google 當(dāng)中分離了出去)。一年后,Google 的無(wú)人駕駛汽車項(xiàng)目“成功畢業(yè)”,成為了現(xiàn)在的獨(dú)立公司 Waymo。無(wú)人駕駛汽車團(tuán)隊(duì)的工作地點(diǎn)仍然在母公司,但工作大樓與無(wú)人機(jī)送貨項(xiàng)目、互聯(lián)網(wǎng)熱氣球項(xiàng)目共享。

這座大樓之前是一個(gè)購(gòu)物中心,典型的舊金山灣區(qū)建筑。唯一能讓人看出這是 Waymo 總部的是兩輛在停車場(chǎng)自動(dòng)行駛的克萊斯勒 Pacifica 休旅車,員工們會(huì)趁著這兩輛車靠邊停車時(shí)在車前自拍。

Waymo 在自動(dòng)駕駛領(lǐng)域遙遙領(lǐng)先于其他競(jìng)爭(zhēng)者。它的行駛里程最多——600 萬(wàn)英里的公路里程和 500 萬(wàn)英里的模擬里程,收集了海量的大數(shù)據(jù)。Waymo 與菲亞特-克萊斯勒公司和捷豹、路虎公司這兩家汽車制造商是合作伙伴關(guān)系,并且還在與幾家汽車制造商洽談中。

目前,Waymo 正在德克薩斯州、加州、密歇根州、亞利桑那州和喬治亞州的道路上測(cè)試其汽車。Waymo 計(jì)劃在今年晚些時(shí)候在亞利桑那州推出全無(wú)人駕駛商業(yè)出租車服務(wù)。

▌Google園區(qū)的明星

現(xiàn)在,Waymo 希望讓人們都知道它在 AI 領(lǐng)域的優(yōu)勢(shì)。本周,Waymo CEO John Krafcik 在 Google 年度 I/O 開發(fā)者大會(huì)上做了演講,他傳達(dá)的訊息很明確:相比其他汽車,Waymo 汽車看的更遠(yuǎn)、感知更好、決策速度更快。

“全自動(dòng)駕駛汽車真的是一個(gè)難題,因?yàn)樗哪芰σ蠛蜏?zhǔn)確度要求非常高。而且乘客的體驗(yàn)非常重要?!盬aymo 首席技術(shù)官、工程部副總裁告訴我。

深度學(xué)習(xí)是機(jī)器學(xué)習(xí)的一種,它使用神經(jīng)網(wǎng)絡(luò)的多層結(jié)構(gòu)分析抽象程度不同的數(shù)據(jù),是改進(jìn)無(wú)人駕駛汽車感知能力和行為的最佳工具。Dolgov 稱:“我們很早就開始研究深度學(xué)習(xí),AI 革命就發(fā)生在這里,發(fā)生在我們隔壁?!?/p>

Google 大腦團(tuán)隊(duì)的 AI 專家定期會(huì)與 Dolgov 和他的工程師同事展開合作,共同探討改進(jìn) Waymo 無(wú)人駕駛汽車準(zhǔn)確度的方法。最近,他們?cè)谝黄鹛接懸恍衢T AI 研究課題,例如自動(dòng)化機(jī)器學(xué)習(xí)——使用神經(jīng)網(wǎng)絡(luò)訓(xùn)練其他神經(jīng)網(wǎng)絡(luò)。Waymo 雖然是一家獨(dú)立的公司,但是如果想要給人留下一種無(wú)人能敵的印象,資歷更深、實(shí)力更強(qiáng)的 Google 能為其提供很好的支持。

Waymo 為什么會(huì)突然對(duì)宣傳其 AI 實(shí)力感興趣?

這與它試圖部署不需要人類駕駛員干預(yù)的無(wú)人駕駛汽車不無(wú)關(guān)系,此舉風(fēng)險(xiǎn)非常高。目前,Waymo 是唯一一家勇于承擔(dān)此風(fēng)險(xiǎn)的公司。業(yè)內(nèi)其他公司正在奮起直追,試圖通過(guò)收購(gòu)小型初創(chuàng)企業(yè)快速啟動(dòng)自己的無(wú)人駕駛汽車項(xiàng)目。與此同時(shí),Google 無(wú)人駕駛汽車團(tuán)隊(duì)的一些重要成員受到巨大機(jī)會(huì)和財(cái)富的吸引,紛紛離開 Google 自立門戶。Google 正積極采取措施防止人才進(jìn)一步流失。

Google 無(wú)人駕駛汽車團(tuán)隊(duì)前成員和外界專家表示,Waymo 在無(wú)人駕駛領(lǐng)域的確搶得先機(jī),但競(jìng)爭(zhēng)者們最后很可能會(huì)追趕上它。因?yàn)?Waymo 并沒有完全稱霸無(wú)人駕駛汽車領(lǐng)域。

“盡管 Google 很強(qiáng)大,但是無(wú)人駕駛汽車領(lǐng)域需要更強(qiáng)的能力?!盙oogle 無(wú)人駕駛汽車團(tuán)隊(duì)前首席工程師 Dave Ferguson說(shuō),他在離開 Goolge 后成立了自己的公司 Nuro。

利用深度卷積神經(jīng)網(wǎng)絡(luò)對(duì)ImageNet圖像進(jìn)行分類

如今大火的無(wú)人駕駛領(lǐng)域在 21 世紀(jì)初期的時(shí)候是一番萎靡不振的景象。

程序員構(gòu)建可以篩選大量的數(shù)據(jù)尋找共同模式的模型,這種模型就是神經(jīng)網(wǎng)絡(luò)——機(jī)器學(xué)習(xí)的一種。當(dāng)時(shí)神經(jīng)網(wǎng)絡(luò)還沒火,正在完成從淺層網(wǎng)絡(luò)(2 層或 3 層)到深度神經(jīng)網(wǎng)絡(luò)(十幾層到幾十層)的巨大轉(zhuǎn)變。雖然神經(jīng)網(wǎng)絡(luò)這個(gè)概念是在 20 世紀(jì) 50 年代(AI 研究誕生的年代)提出的,但當(dāng)時(shí)大多數(shù)電腦的性能還不足以處理所有的必要數(shù)據(jù)。

2009 年的 ImageNet 競(jìng)賽徹底改變了這一切。

ImageNet 源于普林斯頓大學(xué)的幾名研究員在 2009 年于佛羅里達(dá)州召開的計(jì)算機(jī)視覺和模式識(shí)別大會(huì)上展示的一張海報(bào)(海報(bào)是在此類機(jī)器學(xué)習(xí)會(huì)議上分享信息的典型方式)。在此之后,ImageNet 成為一個(gè)圖像數(shù)據(jù)集,然后就出現(xiàn)了 ImageNet 競(jìng)賽——看參賽者創(chuàng)造的算法能以最低的錯(cuò)誤率識(shí)別出最多圖像。這個(gè)數(shù)據(jù)集有大約 1 萬(wàn)張圖像,這些圖像被分為 1000 個(gè)類別,包括植物、建筑以及 90 種犬種。2011 年左右,算法的失誤率約為 25%,這意味著算法每識(shí)別四張圖像就有一張圖像識(shí)別錯(cuò)誤。

人們找到了一種意想不到的解決方案:視頻游戲設(shè)備常用到的高性能圖形處理器GPU)。Google 前語(yǔ)音研究員、現(xiàn) AI 部門技術(shù)負(fù)責(zé)人 Vincent Vanhoucke 稱:“人們開始意識(shí)到這些 GPU 可以用于完成機(jī)器學(xué)習(xí)任務(wù),它們特別適合用來(lái)運(yùn)行神經(jīng)網(wǎng)絡(luò)。”

最大的突破發(fā)生在 2012 年,AI 研究員 Geoffrey Hinton 和他的兩名研究生 Ilya Sutskever 和 Alex Krizhevsky 發(fā)現(xiàn)了一種新的解決方案:深度卷積神經(jīng)網(wǎng)絡(luò),他們?cè)贗mageNet 挑戰(zhàn)賽上證明這種網(wǎng)絡(luò)可以識(shí)別日常物品的圖像。他們創(chuàng)造的神經(jīng)網(wǎng)絡(luò)網(wǎng)讓其他參賽者望塵莫及——其圖像識(shí)別錯(cuò)誤率只有 16%,而其他方法的圖像識(shí)別錯(cuò)誤率高達(dá) 25%。

▌“自此我們?cè)贈(zèng)]回頭過(guò)”

“我認(rèn)為這是基于深度神經(jīng)網(wǎng)絡(luò)的方法第一次打敗常規(guī)方法。自此我們?cè)僖矝]回頭過(guò)。”前 Google 工程師 Ferguson 稱。

Krizhevsky 在 2012 年 ImageNet 挑戰(zhàn)賽上擔(dān)任了較為重要的角色。他告訴我,“我認(rèn)為我們當(dāng)初是天時(shí)地利”。他將他們的成功歸因于他的愛好——對(duì) GPU 進(jìn)行編程使其可以運(yùn)行團(tuán)隊(duì)的神經(jīng)網(wǎng)絡(luò)代碼,這使得他們可以在幾天的時(shí)間內(nèi)完成原本需要幾月才能完成的實(shí)驗(yàn)。Krizhevsky 稱,他在 ImageNet 競(jìng)賽中使用了這項(xiàng)技術(shù)。

Vanhoucke 稱,Hinton 及其團(tuán)隊(duì)的成功“觸發(fā)了一場(chǎng)雪球效應(yīng),并且催生了很多創(chuàng)新”,而且還直接促成了 Google 以未知數(shù)額收購(gòu)了 Hinton 的公司 DNNresearch(包括Sutskever 和 Krizhevsky)。Hinton 留在了多倫多,Sutskever 和 Krizhevsky 去了Google 的山景城總部。Krizhevsky 加入了 Vanhoucke 的 Google Brain 團(tuán)隊(duì)。Vanhoucke 稱,“這時(shí)候我們開始思考如何將這些技術(shù)應(yīng)用到 Waymo 的項(xiàng)目中”。

Google 研究員 Anelia Angelova 是第一位找到 Krizhevsky 與其商討如何將他們的研究成果應(yīng)用到 Google 無(wú)人車項(xiàng)目上的人。他們兩個(gè)人沒有在無(wú)人車團(tuán)隊(duì)工作過(guò),但是當(dāng)時(shí)機(jī)會(huì)太好,錯(cuò)過(guò)就太可惜了。他們創(chuàng)造了一個(gè)可以讓計(jì)算機(jī)學(xué)習(xí)行人模樣的算法,學(xué)習(xí)方法是分析數(shù)千張街景圖像并檢測(cè)表示行人的視覺模式。這種方法非常有效,Google 開始將這種方法應(yīng)用到無(wú)人車項(xiàng)目的其他環(huán)節(jié)中,包括預(yù)測(cè)和計(jì)劃。

不過(guò)問(wèn)題很快就出現(xiàn)了。新的系統(tǒng)錯(cuò)誤率太高,往往會(huì)錯(cuò)誤標(biāo)注汽車、交通信號(hào)和行人,而且速度太慢,無(wú)法實(shí)時(shí)運(yùn)行。于是,Vanhoucke 和他的團(tuán)隊(duì)仔細(xì)檢查了這些圖像,他們發(fā)現(xiàn)大部分錯(cuò)誤是由人類標(biāo)注員造成的。Google 希望這些人類標(biāo)注員可以提供一個(gè)衡量算法成功率的基準(zhǔn)(或 ground truth),但是他們反而提升了錯(cuò)誤率。無(wú)人駕駛汽車的問(wèn)題還是歸咎于人類。

▌無(wú)人駕駛汽車的問(wèn)題歸咎于人類

在糾正人為錯(cuò)誤后,Google 還是很難修正系統(tǒng),使其能迅速地識(shí)別圖像。AI 研究員和Google 的無(wú)人車團(tuán)隊(duì)展開了緊密合作,他們決定引入更加傳統(tǒng)的機(jī)器學(xué)習(xí)方法,例如決策樹和級(jí)聯(lián)分類器(CascadeClassifier)。Vanhoucke 回憶道,用神經(jīng)網(wǎng)絡(luò)實(shí)現(xiàn)“虛擬和現(xiàn)實(shí)世界中的最好結(jié)果”。

“我們成功地證明了用這些方法可以識(shí)別貓的照片和網(wǎng)上一些有趣的東西,我們當(dāng)時(shí)非常激動(dòng)。現(xiàn)在我們正在用這些方法改善無(wú)人車的安全性。”他說(shuō)。

幾年后,Krizhevsky 離開了 Google,聲稱他對(duì)工作失去了興趣。他承認(rèn),“我當(dāng)時(shí)抑郁了一段時(shí)間”。Krizhevsky 的離職讓他在 Google 的同事感到困惑,在那之后他的身上蒙上了一種神秘色彩。現(xiàn)在,Krizhevsky 好奇Google 早期的成功能否讓它在自動(dòng)化領(lǐng)域中保持無(wú)法超越的優(yōu)勢(shì)。其他汽車制造商和科技公司已經(jīng)意識(shí)到機(jī)器學(xué)習(xí)的重要性,Waymo 的數(shù)據(jù)可能太過(guò)局限,無(wú)法在全球范圍的場(chǎng)景中應(yīng)用。

Krizhevsky 稱,“我認(rèn)為特斯拉在這方面有優(yōu)勢(shì),因?yàn)榇钶d自動(dòng)駕駛硬件的特斯拉汽車的車主遍布全球,特斯拉可以從各種各樣的環(huán)境中收集數(shù)據(jù)。這點(diǎn)在機(jī)器學(xué)習(xí)算法泛化(generalize)時(shí)非常重要。因此我認(rèn)為不考慮算法從數(shù)據(jù)的角度分析,特斯拉可能會(huì)領(lǐng)先“?!?/p>

AI 和機(jī)器學(xué)習(xí)對(duì)無(wú)人駕駛汽車非常重要。Waymo 的一些競(jìng)爭(zhēng)者(包括 Google 無(wú)人車團(tuán)隊(duì)前成員)想知道 Waymo 的優(yōu)勢(shì)會(huì)持續(xù)多久。

特斯拉 Autopilot 部門前主管、自動(dòng)駕駛研發(fā)公司 Aurora Innovation 聯(lián)合創(chuàng)始人(另一位為 Google 無(wú)人車項(xiàng)目前負(fù)責(zé)人Chris Urmson)Sterling Anderson 表示,AI 技術(shù)進(jìn)步的自然結(jié)果就是 Waymo 等大公司“不再像以前那樣舉足輕重”。

換句話說(shuō),2018 年無(wú)人車領(lǐng)域的每個(gè)參與者從一開始就使用深度學(xué)習(xí)和神經(jīng)網(wǎng)絡(luò)了。之前的領(lǐng)先者光環(huán)已經(jīng)退去。早期的很多數(shù)據(jù)就像是過(guò)期的水果,已經(jīng)無(wú)法食用。2010 年獲得的一英里駕駛數(shù)據(jù)肯定比不上 2018 年獲得的一英里駕駛數(shù)據(jù)。

Anderson 稱,“若干年之后數(shù)據(jù)的作用就沒那么大了。開始的時(shí)候,數(shù)據(jù)可以用于學(xué)習(xí),幫助改進(jìn)架構(gòu)和算法。但是到了某一階段,幾百萬(wàn)英里或幾十億英里的行駛數(shù)據(jù)就會(huì)變得沒那么重要?!?/p>

▌數(shù)據(jù)的作用沒那么大了

Waymo 的工程師也同意這一點(diǎn)。Waymo 機(jī)器學(xué)習(xí)和感知部門主管 Sacha Arnoud 表示,“就機(jī)器學(xué)習(xí)而言,有這樣一個(gè)增益遞減點(diǎn)。駕駛里程多 10 倍并不一定代表獲得的數(shù)據(jù)集更好,因?yàn)橹匾氖菢颖緮?shù)據(jù)的獨(dú)特性。”

換句話說(shuō),Waymo 累積的每英里駕駛數(shù)據(jù)都必須對(duì)其神經(jīng)網(wǎng)絡(luò)的訓(xùn)練過(guò)程有意義。當(dāng)汽車遇到極端情景或其他特殊情景時(shí)(例如亂闖馬路的行人或平行泊車),Waymo 的模擬器會(huì)過(guò)濾這些數(shù)據(jù),將其進(jìn)行數(shù)千次迭代,用于進(jìn)一步訓(xùn)練神經(jīng)網(wǎng)絡(luò)。

機(jī)器人也可能會(huì)被欺騙。對(duì)抗圖像或者用于欺騙機(jī)器視覺軟件的圖像可以被用來(lái)讓無(wú)人車受損或被撞毀。在停車路標(biāo)上貼上貼紙,就可以讓機(jī)器視覺系統(tǒng)認(rèn)為這是一個(gè) 45 英里/每小時(shí)的限速標(biāo)志。

Google 訓(xùn)練的一個(gè)識(shí)別日常物件的神經(jīng)網(wǎng)絡(luò)最近就被騙了,它將一個(gè) 3D 打印的烏龜看成了一把槍。Waymo 的工程師表示,他們正在其系統(tǒng)中構(gòu)建處理這些可能情景的相關(guān)組件。這引發(fā)了很多圍繞無(wú)人駕駛汽車的擔(dān)憂,包括黑客行為、勒索行為和隱私泄露。

路人橫穿馬路在中央隔離帶停下

路人橫穿馬路沒有中央隔離帶

建筑工人在檢查井工作

平行泊車

▌貓和狗的區(qū)別

Dolgov 坐在 Google X 實(shí)驗(yàn)室的一間會(huì)議室里,手里拿著馬克筆,面前擺著一臺(tái) MacBook Pro,讓我向他描述加菲貓和小狗歐迪(均為動(dòng)畫角色)的不同。

在我結(jié)巴地回答之前,Dolgov 繼續(xù)說(shuō)道:“如果我給你一張圖片,問(wèn)你這是狗還是貓,你肯定很快就知道,對(duì)不?但是如果我讓你描述怎么得出那個(gè)結(jié)論,這可不簡(jiǎn)單。你可能會(huì)認(rèn)為這與那個(gè)東西的體型大小有關(guān),貓和狗都有四條腿、一條尾巴和一只耳朵。但是這些特征都不明顯?!?/p>

Golgov 表示,這種問(wèn)題是特別適合深度學(xué)習(xí)解決的問(wèn)題。給出一大堆基本規(guī)則和參數(shù)很簡(jiǎn)單,例如紅燈停綠燈行,教計(jì)算機(jī)區(qū)別不同類型的交通標(biāo)志。教計(jì)算機(jī)從海量的傳感器數(shù)據(jù)中挑出某一位行人要比描述差異或用代碼表示差異更簡(jiǎn)單。

Waymo 利用一種自動(dòng)化程序和人類標(biāo)注員訓(xùn)練其神經(jīng)網(wǎng)絡(luò)。在神經(jīng)網(wǎng)絡(luò)經(jīng)過(guò)訓(xùn)練后,這些巨大的數(shù)據(jù)集還需要經(jīng)過(guò)精簡(jiǎn)和壓縮,這樣才能應(yīng)用在 Waymo 無(wú)人車所在的現(xiàn)實(shí)世界中。這個(gè)程序與壓縮數(shù)字圖像類似,對(duì)構(gòu)建基礎(chǔ)設(shè)施使系統(tǒng)擴(kuò)展為全球系統(tǒng)很重要。

如果你觀察汽車攝像機(jī)捕捉到的圖像,然后將這些圖像放在利用汽車激光傳感器數(shù)據(jù)構(gòu)建的相同場(chǎng)景匯總,你就會(huì)發(fā)現(xiàn) Waymo 要處理的問(wèn)題是如此繁雜。如果你從來(lái)沒見過(guò)LIDAR 效果圖,它就像是 Google 街景圖會(huì)變成讓人產(chǎn)生幻覺的黑光海報(bào)。

這些圖像可以提供無(wú)人車的鳥瞰視角,以及無(wú)人車“看到”的周圍畫面。行人在這些圖像上顯示為黃色矩形,其他車輛顯示為紫色正方形等等。Waymo 為動(dòng)物分配有類別,例如“貓狗”、“鳥類松鼠”等(原來(lái)貓和狗的區(qū)別對(duì)無(wú)人車是完全沒有意義的)。但除了這些,Waymo 還在訓(xùn)練其算法感知環(huán)境中不合常規(guī)的對(duì)象:下半身處在檢查井里的建筑工人;穿著馬道具服的人、站在角落旋轉(zhuǎn)箭頭標(biāo)志的人。

▌非常規(guī)場(chǎng)景很重要

沒有人類駕駛員的干預(yù),無(wú)人車必須適應(yīng)典型駕駛環(huán)境中出現(xiàn)的奇怪元素?!胺浅R?guī)場(chǎng)景真的非常重要,對(duì)于無(wú)人車而言尤其如此?!?/p>

對(duì)無(wú)人車進(jìn)行編程,使其對(duì)在白天橫穿馬路的行人作出反應(yīng)是一回事,讓汽車感知橫穿馬路的行人并作出反應(yīng)是另一回事。那行人在中央隔離帶停下怎么辦?Waymo 的無(wú)人車會(huì)謹(jǐn)慎做出反應(yīng),因?yàn)樾腥私?jīng)常會(huì)在中央隔離帶停下或等待。如果沒有中央隔離帶怎么辦?無(wú)人車會(huì)將其識(shí)別為異常行為,完全減慢車速讓行人穿過(guò)馬路。Waymo 使用機(jī)器學(xué)習(xí)構(gòu)建模型,讓其識(shí)別正常和異常行為并分別作出不同反應(yīng)。

訓(xùn)練神經(jīng)網(wǎng)絡(luò)需要海量的數(shù)據(jù)。這意味著 Waymo 要積累數(shù)億條汽車標(biāo)注數(shù)據(jù)。為了將這些標(biāo)注數(shù)據(jù)應(yīng)用到駕駛場(chǎng)景中,Waymo 的感知部門主管 Arnoud 預(yù)計(jì),人為標(biāo)注員每秒可以標(biāo)注一輛汽車,標(biāo)注 1 億輛汽車將需要 20 年的時(shí)間。如果沒日沒夜地標(biāo)注,每秒可以標(biāo)注 10 輛汽車,這就需要四個(gè)月的時(shí)間才能完成對(duì)整個(gè)數(shù)據(jù)集的標(biāo)注。

現(xiàn)在 Waymo 的無(wú)人車只在鳳凰城郊外的封閉測(cè)試場(chǎng)地里進(jìn)行測(cè)試,如果 Waymo 想讓它的無(wú)人車達(dá)到足夠的智能水平,則可以在任何環(huán)境和任何條件下行駛——Level 5 自動(dòng)駕駛,有好的算法還不行,它還需要足夠強(qiáng)大的基礎(chǔ)設(shè)施擴(kuò)展它的無(wú)人駕駛系統(tǒng)。Arnoud 將這稱為 AI 的“產(chǎn)業(yè)化”。

作為 Alphabet 旗下的一個(gè)子公司,Waymo 可以使用 Google 的數(shù)據(jù)中心訓(xùn)練它的神經(jīng)網(wǎng)絡(luò)。具體來(lái)說(shuō),Waymo 可以使用高性能的云計(jì)算硬件系統(tǒng)——張量處理器(TPU),這個(gè)系統(tǒng)由 Google 的一些最具野心和影響巨大的技術(shù)提供支持。

以前,Google 使用的是市場(chǎng)上能買到的 GPU(通常是英偉達(dá)產(chǎn)的GPU)。但是過(guò)去幾年間,Google 選擇自行開發(fā)和制造硬件,對(duì)軟件進(jìn)行優(yōu)化。Arnoud 表示,TPU 的速度要比 CPU 快好幾個(gè)數(shù)量級(jí)。

▌未來(lái)規(guī)劃

Waymo 對(duì) AI 的未來(lái)規(guī)劃不是生產(chǎn)出有意識(shí)的汽車。Waymo 將致力于自動(dòng)化機(jī)器學(xué)習(xí)(構(gòu)建機(jī)器模型的過(guò)程是自動(dòng)的)這樣的技術(shù)研究?!盎旧希珹I 機(jī)器學(xué)習(xí)就是創(chuàng)造替人類解決問(wèn)題的其他 AI 模型的技術(shù)”。

對(duì)于在道路標(biāo)志不清楚的區(qū)域行駛的無(wú)人車來(lái)說(shuō),這非常有用。如今最具挑戰(zhàn)的駕駛環(huán)境要求無(wú)人車必須能在沒有白線或明顯界線的情況下做出導(dǎo)航?jīng)Q策。如果 Waymo 能夠構(gòu)建機(jī)器學(xué)習(xí)模型,訓(xùn)練神經(jīng)網(wǎng)絡(luò)在路標(biāo)不清楚的道路上行駛,那么 Waymo 的無(wú)人車就可以駛出鳳凰城郊外,最終行駛在公路上。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴

原文標(biāo)題:進(jìn)擊的 Waymo,掘進(jìn)無(wú)人駕駛深水區(qū)

文章出處:【微信號(hào):AItists,微信公眾號(hào):人工智能學(xué)家】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏

    評(píng)論

    相關(guān)推薦

    2025電子設(shè)計(jì)與制造技術(shù)研討會(huì)

    本帖最后由 jf_32813774 于 2024-12-26 16:14 編輯 電子工程師不可錯(cuò)過(guò)的技術(shù)研討會(huì),終于火熱啟動(dòng)了! 為了讓廣大電子行業(yè)從業(yè)者共聚一堂,探索前沿科技,共話創(chuàng)新未來(lái)
    發(fā)表于 12-18 10:23

    DEKRA德凱探討AI安全技術(shù)前沿趨勢(shì)

    近日,DEKRA德凱在蘇州成功舉辦了一場(chǎng)聚焦智能化發(fā)展的研討會(huì),深入探討了汽車、高科技及工業(yè)領(lǐng)域人工智能(AI)應(yīng)用中的安全與管理。研討會(huì)吸引了眾多行業(yè)專家及產(chǎn)業(yè)鏈合作伙伴的參與,共同探討了A
    的頭像 發(fā)表于 11-14 13:48 ?283次閱讀

    AI學(xué)堂首播丨一節(jié)課詳解AI檢測(cè)系統(tǒng)開發(fā)全流程

    阿丘科技全新推出AI視覺培訓(xùn)直播課,助力工程師提升AI視覺實(shí)戰(zhàn)技能,緊跟前沿技術(shù)。本次課程特邀資深AI視覺工程師主講,結(jié)合實(shí)際案例深度解析AI
    的頭像 發(fā)表于 11-06 08:03 ?206次閱讀
    <b class='flag-5'>AI</b>學(xué)堂首播丨一節(jié)課詳解<b class='flag-5'>AI</b>檢測(cè)系統(tǒng)開發(fā)全流程

    AI for Science:人工智能驅(qū)動(dòng)科學(xué)創(chuàng)新》第4章-AI與生命科學(xué)讀后感

    很幸運(yùn)社區(qū)給我一個(gè)閱讀此書的機(jī)會(huì),感謝平臺(tái)。 《AI for Science:人工智能驅(qū)動(dòng)科學(xué)創(chuàng)新》第4章關(guān)于AI與生命科學(xué)的部分,為我們揭示了人工智能技術(shù)在生命科學(xué)領(lǐng)域中的廣泛應(yīng)用和深遠(yuǎn)影響。在
    發(fā)表于 10-14 09:21

    AI for Science:人工智能驅(qū)動(dòng)科學(xué)創(chuàng)新》第二章AI for Science的技術(shù)支撐學(xué)習(xí)心得

    for Science的技術(shù)支撐”的學(xué)習(xí)心得,可以從以下幾個(gè)方面進(jìn)行歸納和總結(jié): 1. 技術(shù)基礎(chǔ)的深入理解 在閱讀第二章的過(guò)程中,我對(duì)于AI for Science所需的技術(shù)基礎(chǔ)有了
    發(fā)表于 10-14 09:16

    AI人工智能簡(jiǎn)介

    AI人工智能作為一項(xiàng)前沿技術(shù),正以前所未有的速度改變著我們的世界。我們應(yīng)該積極擁抱這一變革,同時(shí)關(guān)注帶來(lái)的挑戰(zhàn)和問(wèn)題,努力推動(dòng)AI技術(shù)的健
    的頭像 發(fā)表于 07-21 14:58 ?2497次閱讀

    AI智能眼鏡都需要什么芯片

    國(guó)內(nèi)的廠家又該如何跟上這一潮流趨勢(shì)?那咱們國(guó)內(nèi)廠商的AI智能眼鏡究竟需要什么樣的芯片來(lái)支撐它的運(yùn)行呢?如果你對(duì)以上問(wèn)題感興趣的話就來(lái)聽我嘮嘮吧。接下來(lái)介紹設(shè)計(jì)AI
    的頭像 發(fā)表于 07-11 08:17 ?1370次閱讀
    <b class='flag-5'>AI</b>智能眼鏡都需要什么芯片

    愛立信致力攜手產(chǎn)業(yè)伙伴共同推動(dòng)5G-A×AI融合創(chuàng)新發(fā)展

    國(guó)際產(chǎn)業(yè)大會(huì)在上海召開。愛立信亞太區(qū)前沿技術(shù)總監(jiān)Bo Hagerman博士代表愛立信出席圓桌論壇,就AI數(shù)據(jù)、用例及應(yīng)用場(chǎng)景等相關(guān)問(wèn)題發(fā)表了見解。 AI助力優(yōu)化網(wǎng)絡(luò)性能、簡(jiǎn)化操作 論壇上,Hagerman博士首先強(qiáng)調(diào)了
    的頭像 發(fā)表于 06-29 11:18 ?9398次閱讀

    OPPO XR探索暫停,涉及人員轉(zhuǎn)崗至AI方向

    對(duì)于此事,OPPO回應(yīng)稱,他們堅(jiān)信AI是未來(lái)發(fā)展的關(guān)鍵技術(shù),因此OPPO研究院將加強(qiáng)對(duì)AI軟硬件創(chuàng)新等前沿技術(shù)的探索。同時(shí),研究院專注于前沿技術(shù)
    的頭像 發(fā)表于 04-26 17:25 ?1084次閱讀

    AI會(huì)取代誰(shuí)?

    AI行業(yè)芯事
    電子發(fā)燒友網(wǎng)官方
    發(fā)布于 :2024年03月13日 16:29:17

    NanoEdge AI技術(shù)原理、應(yīng)用場(chǎng)景及優(yōu)勢(shì)

    NanoEdge AI 是一種基于邊緣計(jì)算的人工智能技術(shù),旨在將人工智能算法應(yīng)用于物聯(lián)網(wǎng)(IoT)設(shè)備和傳感器。這種技術(shù)的核心思想是將數(shù)據(jù)處理和分析從云端轉(zhuǎn)移到設(shè)備本身,從而減少數(shù)據(jù)傳輸延遲、降低
    發(fā)表于 03-12 08:09

    高通在MWC 2024展示前沿技術(shù)和合作成果

    產(chǎn)品,還攜手全球和中國(guó)合作伙伴共同展示了在連接、AI、汽車、XR、手機(jī)、5G Advanced、6G等領(lǐng)域的前沿技術(shù)和合作成果。
    的頭像 發(fā)表于 02-29 09:49 ?668次閱讀

    高通在2024 MWC展示AI領(lǐng)域新突破

    在2024年巴塞羅那世界移動(dòng)通信大會(huì)(2024 MWC)上,高通技術(shù)公司展現(xiàn)了AI領(lǐng)域的最新成果,從全新的高通?AI Hub到前沿研究突
    的頭像 發(fā)表于 02-27 10:57 ?997次閱讀

    MWC2024:高通推出全新AI Hub及前沿多模態(tài)大模型

    2024年世界移動(dòng)通信大會(huì)(MWC)上,高通再次展現(xiàn)技術(shù)領(lǐng)導(dǎo)力,通過(guò)發(fā)布全新的高通AI Hub和展示前沿的多模態(tài)大模型技術(shù),推動(dòng)了5G和
    的頭像 發(fā)表于 02-26 16:59 ?1289次閱讀

    【youyeetoo X1 windows 開發(fā)板體驗(yàn)】少兒AI智能STEAM積木平臺(tái)

    : 經(jīng)過(guò)了解,更增添了我對(duì)youyeetoo X1的興趣。 詳細(xì)的WiKi網(wǎng)址:youyeetoo X1 | 風(fēng)火輪Wiki ,感興趣的同學(xué)可以前往了解。 一、開箱 玩板子最開心的事情,就是開箱了。 拆開
    發(fā)表于 02-01 00:20