無人駕駛汽車可以使用機(jī)器學(xué)習(xí)算法進(jìn)行高速轉(zhuǎn)彎,該算法通過研究類似的視頻來學(xué)習(xí)。
這種類型的人工智能被稱為神經(jīng)網(wǎng)絡(luò),大體上是基于我們大腦的工作方式。
為了訓(xùn)練自動(dòng)駕駛系統(tǒng)不失控,研究人員在北極圈附近結(jié)冰的賽道上進(jìn)行了20多萬份運(yùn)動(dòng)樣本的測(cè)試。
它利用之前幾秒鐘的時(shí)間來觀察汽車的運(yùn)動(dòng),以調(diào)整方向盤,從而在不同路面上提供準(zhǔn)確的運(yùn)動(dòng)預(yù)測(cè)。
來自加州斯坦福大學(xué)的研究小組給一輛大眾GTI配備了這種算法,并在橢圓形賽道上進(jìn)行了測(cè)試。
他們讓其行駛速度盡可能快,并從以往的測(cè)試中學(xué)習(xí),汽車調(diào)整其轉(zhuǎn)向和加速度以成功轉(zhuǎn)彎。
為了讓自動(dòng)駕駛汽車安全運(yùn)行,它們需要能夠在危急情況下快速剎車、加速或轉(zhuǎn)向的控制系統(tǒng)。
這使得他們能夠在摩擦極限下安全駕駛——就在輪胎不受控制、汽車開始旋轉(zhuǎn)的前一秒。
該論文的資深作者、機(jī)械工程學(xué)教授克里斯蒂安?格迪斯(J. Christian Gerdes)說:“在現(xiàn)有技術(shù)條件下,你常常不得不在數(shù)據(jù)驅(qū)動(dòng)的方法和基于基礎(chǔ)物理的方法之間做出選擇?!?/p>
格迪斯教授說,他的系統(tǒng)可以在緊急情況下提供幫助,當(dāng)在緊急情況下需要突然轉(zhuǎn)向的時(shí)候。
研究結(jié)果令人鼓舞,但研究人員強(qiáng)調(diào),他們的神經(jīng)網(wǎng)絡(luò)系統(tǒng)在除訓(xùn)練場(chǎng)外的外部環(huán)境下表現(xiàn)不佳。
Gerdes教授說,神經(jīng)網(wǎng)絡(luò)的一個(gè)挑戰(zhàn)是缺乏對(duì)其工作原理的了解。
他說:“如果你給它一組它從未見過的條件,它可能會(huì)推斷出完全錯(cuò)誤的方式,從而導(dǎo)致潛在的危險(xiǎn)轉(zhuǎn)向?!?/p>
該團(tuán)隊(duì)正在繼續(xù)開發(fā)系統(tǒng)和車輛,這些車輛的互動(dòng)次數(shù)是記者所看到的數(shù)千倍,他們稱希望能讓它們更安全。
研究人員現(xiàn)在正在系統(tǒng)中構(gòu)建安全特性,以檢查其決策是否合理。
這項(xiàng)研究發(fā)表在《科學(xué)機(jī)器人》(Science Robotics.)雜志上。
無人駕駛與機(jī)器學(xué)習(xí)技術(shù)
機(jī)器學(xué)習(xí)是計(jì)算機(jī)科學(xué)的一個(gè)分支,它處理系統(tǒng)編程,以便通過經(jīng)驗(yàn)自動(dòng)學(xué)習(xí)和改進(jìn)。
例如:對(duì)機(jī)器人進(jìn)行編程,使它們能夠根據(jù)從傳感器收集的數(shù)據(jù)執(zhí)行任務(wù)。它自動(dòng)從數(shù)據(jù)中學(xué)習(xí)程序。
目前,機(jī)器學(xué)習(xí)算法被廣泛應(yīng)用于尋找制造自動(dòng)駕駛汽車的各種挑戰(zhàn)的解決方案。
隨著傳感器數(shù)據(jù)處理技術(shù)在汽車電子控制單元(ECU)中的應(yīng)用,提高對(duì)機(jī)器學(xué)習(xí)技術(shù)的利用來完成新任務(wù)是十分必要的。
潛在的應(yīng)用包括通過來自不同外部和內(nèi)部傳感器(如激光雷達(dá)、雷達(dá)、攝像機(jī)或物聯(lián)網(wǎng))的數(shù)據(jù)集合來評(píng)估駕駛員的狀況或進(jìn)行駕駛場(chǎng)景分類。
運(yùn)行汽車信息娛樂系統(tǒng)的應(yīng)用程序可以接收來自傳感器數(shù)據(jù)融合系統(tǒng)的信息,例如,如果汽車注意到司機(jī)有什么不對(duì)勁,它可以將汽車直接開往醫(yī)院。
這個(gè)基于機(jī)器學(xué)習(xí)的應(yīng)用還包括駕駛員的語音和手勢(shì)識(shí)別以及語言翻譯。
在自動(dòng)駕駛汽車中,機(jī)器學(xué)習(xí)算法的主要任務(wù)之一是對(duì)周圍環(huán)境進(jìn)行連續(xù)繪制,并預(yù)測(cè)這些環(huán)境可能發(fā)生的變化。
這些任務(wù)分為4個(gè)子任務(wù): 對(duì)物體的檢測(cè)、對(duì)象的識(shí)別或識(shí)別對(duì)象的分類、目標(biāo)定位和運(yùn)動(dòng)預(yù)測(cè)。
機(jī)器學(xué)習(xí)與AI、數(shù)據(jù)挖掘的區(qū)別
機(jī)器學(xué)習(xí)屬于人工智能技術(shù),根據(jù)基于經(jīng)驗(yàn)數(shù)據(jù)的行為設(shè)計(jì)和開發(fā)算法被稱為機(jī)器學(xué)習(xí)。
除了機(jī)器學(xué)習(xí),人工智能還包括知識(shí)表現(xiàn)、自然語言處理、規(guī)劃、機(jī)器人等方面。
機(jī)器學(xué)習(xí)涉及到算法的研究、設(shè)計(jì)和開發(fā),這些算法使計(jì)算機(jī)無需顯式編程就能學(xué)習(xí)。而數(shù)據(jù)挖掘可以定義為從非結(jié)構(gòu)化數(shù)據(jù)中試圖提取知識(shí)或未知的有趣模式的過程,在此過程中,使用了學(xué)習(xí)算法。
機(jī)器學(xué)習(xí)背后的算法與技術(shù)
機(jī)器學(xué)習(xí)算法大致分為四類:決策矩陣算法、聚類算法、模式識(shí)別算法和回歸算法。
其中一類機(jī)器學(xué)習(xí)算法可用于完成2個(gè)或多個(gè)子任務(wù)。
例如,回歸算法可以用于目標(biāo)定位以及目標(biāo)檢測(cè)或運(yùn)動(dòng)預(yù)測(cè)。
機(jī)器學(xué)習(xí)中涵蓋了不同的算法技術(shù),如監(jiān)督學(xué)習(xí)(Supervised Learning)、無監(jiān)督學(xué)習(xí)、半監(jiān)督學(xué)習(xí)、強(qiáng)化學(xué)習(xí)、遷移學(xué)習(xí)等。
監(jiān)督學(xué)習(xí)必須確定目標(biāo)變量的值,以便機(jī)器學(xué)習(xí)算法可以發(fā)現(xiàn)特征和目標(biāo)變量之間的關(guān)系。比如在給定數(shù)據(jù)時(shí),我們應(yīng)知道正確的輸出結(jié)果應(yīng)該是什么樣子,并且知道在輸入和輸出之間有著一個(gè)特定的關(guān)系。
非監(jiān)督學(xué)習(xí),即在未加標(biāo)簽的數(shù)據(jù)中,試圖找到隱藏的結(jié)構(gòu)。數(shù)據(jù)沒有類別信息,也沒有給定的目標(biāo)值。
遷移學(xué)習(xí)能夠?qū)⑦m用于大數(shù)據(jù)的模型遷移到小數(shù)據(jù)上,作為小數(shù)據(jù)模型的訓(xùn)練起點(diǎn),節(jié)約訓(xùn)練神經(jīng)網(wǎng)絡(luò)需要的大量計(jì)算和時(shí)間資源。
強(qiáng)化學(xué)習(xí)則是智能系統(tǒng)從環(huán)境到行為映射的學(xué)習(xí),以使獎(jiǎng)勵(lì)信號(hào)(強(qiáng)化信號(hào))函數(shù)值最大,由于外部給出的信息很少,強(qiáng)化學(xué)習(xí)系統(tǒng)必須依靠自身的經(jīng)歷進(jìn)行自我學(xué)習(xí)。通過這種學(xué)習(xí)獲取知識(shí),改進(jìn)行動(dòng)方案以適應(yīng)環(huán)境。
谷歌的AlphaZero就是使用強(qiáng)化學(xué)習(xí)的方式,通過自己和自己下棋的方式生成模型,最后擊敗了通過深度學(xué)習(xí)訓(xùn)練的AlphaGo。
-
機(jī)器學(xué)習(xí)
+關(guān)注
關(guān)注
66文章
8423瀏覽量
132744 -
無人駕駛
+關(guān)注
關(guān)注
98文章
4071瀏覽量
120600
原文標(biāo)題:無人駕駛汽車會(huì)“漂移”!你對(duì)它背后的機(jī)器學(xué)習(xí)技術(shù)了解多少?
文章出處:【微信號(hào):worldofai,微信公眾號(hào):worldofai】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
評(píng)論