Waymo十周年之際,發(fā)布了自動駕駛機器學(xué)習(xí)模型的構(gòu)建思路,原來很多內(nèi)部機器學(xué)習(xí)架構(gòu)是由 AutoML 完成的。這種自動機器學(xué)習(xí)算法在激光雷達分割任務(wù)中,比人工創(chuàng)建的網(wǎng)絡(luò)質(zhì)量更高。在代理端到端搜索中,甚至發(fā)現(xiàn)了卷積、池化和反卷積操作的創(chuàng)造性組合,不禁讓人感嘆算法工程師要失業(yè)?
AutoML 全稱是 Automated Machine Learning,是2014年以來,機器學(xué)習(xí)和深度學(xué)習(xí)領(lǐng)域最炙手可熱的領(lǐng)域之一。2017年5月,谷歌在I/O大會上推出基于TensorFlow 框架下的AutoML,它可以通過神經(jīng)網(wǎng)絡(luò)來設(shè)計神經(jīng)網(wǎng)絡(luò),節(jié)省人工設(shè)計的時間,其對專業(yè)知識的較低,讓非機器學(xué)習(xí)專家也能輕松上手。而在近日waymo十周年上曝光,其AutoML 已經(jīng)用來設(shè)計應(yīng)用于自動駕駛上的機器學(xué)習(xí)算法。
在Waymo,機器學(xué)習(xí)幾乎應(yīng)用在自動駕駛系統(tǒng)的每個角落。它可以幫助無人車感知周圍環(huán)境,了解世界,預(yù)測其他人的行為方式,并預(yù)測他們的下一步行動。
以感知為例,Waymo的系統(tǒng)采用了神經(jīng)網(wǎng)絡(luò)的組合,使無人車能夠解讀傳感器數(shù)據(jù)、識別物體,并隨著時間的推移跟蹤它們,從而對周圍的世界有一個深入的了解。這些神經(jīng)網(wǎng)絡(luò)的創(chuàng)建通常是一項耗時的任務(wù),優(yōu)化神經(jīng)網(wǎng)絡(luò)架構(gòu)以實現(xiàn)在自動駕駛汽車上運行所需的質(zhì)量和速度是一個復(fù)雜的微調(diào)過程,需要花費工程師數(shù)月時間完成任務(wù)。
通過與谷歌AI大腦團隊研究人員合作,應(yīng)用AutoML將前沿研究付諸實踐,以自動生成神經(jīng)網(wǎng)絡(luò)。更重要的是,這些最先進的神經(jīng)網(wǎng)絡(luò)比工程師手動微調(diào)質(zhì)量更高和速度更快。
Waymo 為了將自動駕駛技術(shù)應(yīng)用到不同的城市和環(huán)境中,需要以極快的速度優(yōu)化現(xiàn)有模型以適應(yīng)不同的場景。恰好 AutoML 能夠做到這一點,并高效,持續(xù)地提供大量的ML解決方案。
應(yīng)用現(xiàn)有的AutoML框架進行遷移學(xué)習(xí)
Auto ML能否為汽車生成高質(zhì)量、低延遲的神經(jīng)網(wǎng)絡(luò)?
質(zhì)量往往是衡量一個神經(jīng)網(wǎng)絡(luò)產(chǎn)生的答案的準確性的標準,延遲數(shù)據(jù)決定了神經(jīng)網(wǎng)絡(luò)提供答案的速度,也稱為推理時間。由于自動駕駛是一項需要無人車快速做出決定以保證安全的系統(tǒng),因此神經(jīng)網(wǎng)絡(luò)需要保證在低延遲下進行。運行在Waymo無人車上的大多數(shù)網(wǎng)絡(luò),延遲都少于10毫秒,這比部署在數(shù)千臺服務(wù)器上的數(shù)據(jù)中心中的許多網(wǎng)絡(luò)都要快。
Google AI團隊在2018年4月發(fā)表的論文(Learning Transferable Architectures for Scalable ImageRecognition)中,能夠自動探索超過12,000種架構(gòu)來完成 CIFAR-10 數(shù)據(jù)集的經(jīng)典圖像識別任務(wù),其中發(fā)現(xiàn)的自我創(chuàng)建的NAS單元比手工創(chuàng)建神經(jīng)網(wǎng)絡(luò)更好。將在CIFAR-10上學(xué)到的知識轉(zhuǎn)移到自動駕駛?cè)蝿?wù)中,它可以很好的完成語義分割的任務(wù),比如將LiDAR點云中的每個點標識為汽車,行人,樹等。
NAS單元處理神經(jīng)網(wǎng)絡(luò)中前兩個層的輸入
通過構(gòu)建一種自動搜索算法,在卷積網(wǎng)絡(luò)架構(gòu)(CNN)中探索數(shù)百種不同的NAS單元組合,進行 LiDAR 分割任務(wù)訓(xùn)練和評估模型。如果采用人工微調(diào),只能探索有限數(shù)量的架構(gòu),但通過這種方法,自動探索了數(shù)百個。
相比人工微調(diào)優(yōu)化神經(jīng)網(wǎng)絡(luò),AutoML輸出的神經(jīng)網(wǎng)絡(luò)做到了低延遲、高質(zhì)量效果。
初步成功后,Waymo將相同的搜索算法應(yīng)用于另外兩個與交通車道檢測和定位相關(guān)的任務(wù),遷移學(xué)習(xí)技術(shù)也適用于這些任務(wù),最后能夠在無人車上部署三個新訓(xùn)練和改進的神經(jīng)網(wǎng)絡(luò)。
端到端搜索:從頭開始搜索新的架構(gòu)
發(fā)現(xiàn)AutoML巨大潛力后,Waymo開始思考是否可以更進一步、更廣泛地尋找能夠提供更好結(jié)果的全新架構(gòu)。不局限于NAS單元,可以更直接地找到延遲在限定范圍內(nèi)的架構(gòu)。
進行端到端搜索往往需要手動探索數(shù)千個架構(gòu),需要大量的計算成本。找到單一架構(gòu)需要在多個GPU的計算機上訓(xùn)練好幾天,這意味著搜索單個任務(wù)需要數(shù)千天的計算時間。相反,通過設(shè)計一個代理任務(wù):一個縮小的激光雷達分割任務(wù),可以在幾個小時內(nèi)解決。
這就意味著需要找到一個與最初的細分任務(wù)足夠相似的代理任務(wù)。在確定代理任務(wù)上的架構(gòu)質(zhì)量與原始任務(wù)上的架構(gòu)質(zhì)量之間的良好相關(guān)性之前,對幾個代理任務(wù)設(shè)計進行試驗。然后,啟動一個類似于AutoML論文的搜索,完成一個端到端代理搜索。這是這個概念第一次應(yīng)用在激光雷達數(shù)據(jù)上。
代理端到端搜索:在按比例縮小的代理任務(wù)中探索數(shù)千個架構(gòu),將100個最佳應(yīng)用程序應(yīng)用于原始任務(wù),驗證并部署最佳的最佳體系結(jié)構(gòu)。
通過使用幾種搜索算法,優(yōu)化質(zhì)量和延遲。查看不同類型的CNN架構(gòu)并使用不同的搜索策略,如隨機搜索和強化學(xué)習(xí),能夠為代理任務(wù)探索10,000多種不同的架構(gòu)。通過使用代理任務(wù),在Google TPU集群上花費一年多的計算時間現(xiàn)在只需要兩周時間。在NAS單元之外,我們發(fā)現(xiàn)了比以前更好的神經(jīng)網(wǎng)路,它在相同的質(zhì)量下,神經(jīng)網(wǎng)絡(luò)的延遲降低20-30%;具有更高質(zhì)量的神經(jīng)網(wǎng)絡(luò),錯誤率降低8-10%,與以前的架構(gòu)具有相同的延遲。
左圖展示了在一組簡單的架構(gòu)上隨機搜索發(fā)現(xiàn)的大約4000個架構(gòu)。每個點都是一個經(jīng)過訓(xùn)練和評估的架構(gòu)。實線表示不同推理時間約束下的最佳架構(gòu),紅點表示用遷移學(xué)習(xí)構(gòu)建的網(wǎng)絡(luò)的延遲和性能。在這種隨機搜索中,網(wǎng)絡(luò)學(xué)習(xí)效果不如遷移學(xué)習(xí)。右圖中,黃色和藍色的點表示另外兩種搜索算法的結(jié)果。黃色的是對一組精致架構(gòu)的隨機搜索。藍色的那個使用了強化學(xué)習(xí),探索了6000多個架構(gòu)。它產(chǎn)生了最好的結(jié)果。這兩個額外的搜索發(fā)現(xiàn),該網(wǎng)絡(luò)明顯優(yōu)于遷移學(xué)習(xí)的網(wǎng)絡(luò)。
在搜索中發(fā)現(xiàn)的一些架構(gòu)采用了卷積、池化和反卷積操作的創(chuàng)造性組合,如下圖所示。這些架構(gòu)最終非常適合最初的激光雷達分割任務(wù),并將部署在Waymo的自動駕駛汽車上。
由代理端到端搜索發(fā)現(xiàn)的一種神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)。
Waymo與Google AI合作,應(yīng)用 AutoML 在無人駕駛上的實踐僅僅是個開始。對于激光雷達分割任務(wù),傳輸學(xué)習(xí)和代理端到端搜索都提供了比人工創(chuàng)建更好的網(wǎng)絡(luò),這些機制應(yīng)用到新的任務(wù)類型上,可以改善許多其他的神經(jīng)網(wǎng)絡(luò)。這一發(fā)展為未來的ML工作開辟了新的道路,并提高了Waymo的自動駕駛技術(shù)的性能和能力。
看到這里是不是覺得很興奮,自己費盡心思搭的神經(jīng)網(wǎng)路,AutoML 只需很短的時間就能得出高質(zhì)量的網(wǎng)絡(luò)結(jié)構(gòu)。當然,目前谷歌只開源了輕量級 AutoML 框架——AdaNet。
-
機器學(xué)習(xí)
+關(guān)注
關(guān)注
66文章
8497瀏覽量
134228 -
waymo
+關(guān)注
關(guān)注
2文章
313瀏覽量
25097
原文標題:算法工程師要失業(yè)?Waymo嘗試用AutoML自動生成機器學(xué)習(xí)模型
文章出處:【微信號:IV_Technology,微信公眾號:智車科技】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
機器學(xué)習(xí)模型市場前景如何
用DeepSeek-R1實現(xiàn)自動生成Manim動畫

評論