0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內(nèi)不再提示

特斯拉的圖像識別原理是什么?

深圳市汽車電子行業(yè)協(xié)會 ? 來源:阿寶1990 ? 作者:阿寶1990 ? 2021-06-26 14:04 ? 次閱讀

特斯拉利用8個攝像頭來識別現(xiàn)實世界中的物體。攝像頭獲取的圖像包括行人、其他車輛、動物或障礙物,這不僅對特斯拉車輛駕駛員的安全很重要,對其他人也很重要。專利稱,重要的是,攝像頭能夠及時準確地識別這些物體。

785551ea-d5b5-11eb-9e57-12bb97331649.png

特斯拉專利框

特斯拉專利演示

算法的代碼層面來說,特斯拉把它們的深度學習網(wǎng)絡稱為HydraNet。其中,基礎算法代碼是共享的,整個HydraNet包含48個不同的神經(jīng)網(wǎng)絡,通過這48個神經(jīng)網(wǎng)絡,就能輸出1000個不同的預測張量。理論上來說,特斯拉的這個超級網(wǎng)絡,能同時檢測1000種物體。完成這些運算并不簡單,特斯拉已經(jīng)耗費了7萬個GPU小時進行深度學習模型訓練。

雖然工作量很大,但由于大部分工作由機器承擔,特斯拉的人工智能團隊僅由幾十人組成,與其他自動駕駛公司數(shù)百人甚至數(shù)千人的規(guī)模相比,確實規(guī)模不大。

完成2D的圖像還不算牛掰的,畢竟云端有超級計算機可以去訓練,本地的芯片也是自己開發(fā)的,可以很好的匹配算法,特斯拉真正牛掰的地方,通過視覺完成3D的深度信息,并可以通過視覺建立高精度地圖,完成一些底下停車場的附件駕駛場景。

特斯拉全車共配備了8個攝像頭,一個毫米波雷達和12個超聲波雷達,監(jiān)測外部環(huán)境,向自動駕駛電腦實時傳送信息。

特斯拉車外傳感器

簡單來看,特斯拉的攝像頭、毫米波雷達、超聲波雷達以及慣性測量單元記錄下當前車輛所處的環(huán)境數(shù)據(jù),并將數(shù)據(jù)發(fā)送給特斯拉的自動駕駛電腦。自動駕駛電腦在進行算法的計算之后,將速度和方向信息傳遞給轉(zhuǎn)向舵以及加速、制動踏板,實現(xiàn)對車輛的控制。

不過,在日常行駛過程中,攝像頭作為傳感器捕捉的內(nèi)容都是二維圖像,并沒有深度信息。

也就是說,雖然二維圖像已經(jīng)可以區(qū)分公路和路旁的人行道,但并不知道現(xiàn)在車輛距離“馬路牙子”還有多遠。由于缺失這樣一個重要信息,自動駕駛的運算可能并不準確,操作可能出錯。因此,捕捉或者建立一個三維的圖景很有必要。

特斯拉使用三目相機的,它可以通過比較兩個攝像頭圖像的差異判斷物體的遠近,獲得物體的深度信息。通過中央處理器對輸入圖像進行感知、分割、檢測、跟蹤等操作,輸出給導航網(wǎng)絡端進行語義建圖及匹配定位,同時通過目標識別形成相應的ADAS系統(tǒng)目標屬性。

特斯拉還有更厲害的地方,那就是算法可以預測流媒體視頻中每一個像素的深度信息。也就是說,只要算法足夠好,流媒體視頻更加清晰,特斯拉的視覺傳感器所捕捉的深度信息甚至可以超過激光雷達。

在實際的自動駕駛應用中,泊車入位和智能召喚兩個使用場景下就能充分利用這套算法。在停車場行駛時,車輛之間的距離很小,即使是駕駛員駕駛,稍不留神也很容易出現(xiàn)刮蹭事故。對于機器來說,停車場場景的行駛更加困難。在預測到深度信息之后,車輛可以在超聲波雷達的輔助之下,快速完成對周圍環(huán)境的識別,車輛泊車就會更加順利。

在完成深度信息的預測之后,這部分信息會顯示在車機上,同時也會直接參與控制轉(zhuǎn)向、加速、制動等駕駛動作。不過,轉(zhuǎn)向、加速、制動這些駕駛策略沒有固定的規(guī)則,有一定靈活性。因此,自動駕駛的駕駛策略沒有最佳,只有更好。

怎么提高神經(jīng)網(wǎng)絡的算法效率:

為什么這么多廠家只有百度敢挑戰(zhàn)視覺為主的輔助駕駛方案,不使用激光雷達,其中很大一個原因就是神經(jīng)網(wǎng)絡算法相當耗費芯片算力和內(nèi)存資源,本地端的芯片要算力足夠強大,對于神經(jīng)網(wǎng)絡的算法要有優(yōu)化。

對于神經(jīng)網(wǎng)絡來說,其實很多的連接并不是一定要存在的,也就是說我去掉一些連接,可能壓縮后的網(wǎng)絡精度相比壓縮之前并沒有太大的變化?;谶@樣的理念,很多剪枝的方案也被提了出來,也確實從壓縮的角度帶來了很大效果提升。

需要特別提出的是,大家從圖中可以看到,深度學習神經(jīng)網(wǎng)絡包括卷積層和全連接層兩大塊,剪枝對全連接層的壓縮效率是最大的。下面柱狀圖的藍色部分就是壓縮之后的系數(shù)占比,從中可以看到剪枝對全連接層的壓縮是最大的,而對卷積層的壓縮效果相比全連接層則差了很多。

所以這也是為什么,在語音的加速上很容易用到剪枝的一些方案,但是在機器視覺等需要大量卷積層的應用中剪枝效果并不理想。

對于整個Deep Learning網(wǎng)絡來說,每個權重系數(shù)是不是一定要浮點的,定點是否就能滿足?定點是不是一定要32位的?很多人提出8位甚至1位的定點系數(shù)也能達到很不錯的效果,這樣的話從系數(shù)壓縮來看就會有非常大的效果。從下面三張人臉識別的紅點和綠點的對比,就可以看到其實8位定點系數(shù)在很多情況下已經(jīng)非常適用了,和32位定點系數(shù)相比并沒有太大的變化。所以,從這個角度來說,權重系數(shù)的壓縮也會帶來網(wǎng)絡模型的壓縮,從而帶來計算的加速。

這些都需要非常資深的軟件算法團隊去優(yōu)化,同時需要懂得底層芯片的資源情況,而百度在人工算法這方面非常具有優(yōu)勢,所以有勇氣去挑戰(zhàn)視覺為主的自動駕駛 Apollo Lite方案。

百度表示,攝像頭是相對成熟的傳感器,除具備輕巧低成本和符合車規(guī)的優(yōu)勢外,高分辨率高幀率(成像頻率)的成像技術發(fā)展趨勢意味著圖像內(nèi)蘊含的環(huán)境信息更豐富,同時視頻數(shù)據(jù)也和人眼感知的真實世界最為相似,但和三維點云數(shù)據(jù)相比,二維圖像中的信息更難挖掘,需要設計更強大的算法、大量數(shù)據(jù)的積累和更長期的研發(fā)投入。

責任編輯:lq6

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 攝像頭
    +關注

    關注

    60

    文章

    4860

    瀏覽量

    96079
  • 特斯拉
    +關注

    關注

    66

    文章

    6322

    瀏覽量

    126704

原文標題:【行業(yè)資訊】自動駕駛傳感器之攝像頭(十二)特斯拉圖像識別原理闡述

文章出處:【微信號:qidianxiehui,微信公眾號:深圳市汽車電子行業(yè)協(xié)會】歡迎添加關注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏

    評論

    相關推薦

    AI圖像識別攝像機

    隨著科技的迅猛發(fā)展,人工智能(AI)在各個領域的應用越來越廣泛,其中圖像識別技術尤為引人注目。AI圖像識別攝像機作為這一技術的重要應用之一,正在逐步改變我們的生活和工作方式。什么是AI圖像識別攝像機
    的頭像 發(fā)表于 11-08 10:38 ?326次閱讀
    AI<b class='flag-5'>圖像識別</b>攝像機

    圖像識別算法有哪幾種

    圖像識別算法是計算機視覺領域的核心技術之一,它通過分析和處理圖像數(shù)據(jù),實現(xiàn)對圖像中的目標、場景和物體的識別和分類。 圖像識別算法的發(fā)展歷程
    的頭像 發(fā)表于 07-16 11:22 ?1253次閱讀

    圖像檢測和圖像識別的原理、方法及應用場景

    圖像檢測和圖像識別是計算機視覺領域的兩個重要概念,它們在許多應用場景中發(fā)揮著關鍵作用。 1. 定義 1.1 圖像檢測 圖像檢測(Object Detection)是指在
    的頭像 發(fā)表于 07-16 11:19 ?4779次閱讀

    圖像識別算法都有哪些方法

    圖像識別算法是計算機視覺領域的核心任務之一,它涉及到從圖像中提取特征并進行分類、識別和分析的過程。隨著深度學習技術的不斷發(fā)展,圖像識別算法已經(jīng)取得了顯著的進展。本文將介紹
    的頭像 發(fā)表于 07-16 11:14 ?5894次閱讀

    圖像識別算法的提升有哪些

    引言 圖像識別是計算機視覺領域的核心任務之一,旨在使計算機能夠自動地識別和理解圖像中的內(nèi)容。隨著計算機硬件的發(fā)展和深度學習技術的突破,圖像識別算法的性能得到了顯著提升。本文將介紹
    的頭像 發(fā)表于 07-16 11:12 ?717次閱讀

    圖像識別算法的優(yōu)缺點有哪些

    圖像識別算法是一種利用計算機視覺技術對圖像進行分析和理解的方法,它在許多領域都有廣泛的應用,如自動駕駛、醫(yī)療診斷、安全監(jiān)控等。然而,圖像識別算法也存在一些優(yōu)缺點。 一、圖像識別算法的優(yōu)
    的頭像 發(fā)表于 07-16 11:09 ?1841次閱讀

    圖像識別算法的核心技術是什么

    圖像識別算法是計算機視覺領域的一個重要研究方向,其目標是使計算機能夠像人類一樣理解和識別圖像中的內(nèi)容。圖像識別算法的核心技術包括以下幾個方面: 特征提取 特征提取是
    的頭像 發(fā)表于 07-16 11:02 ?711次閱讀

    圖像識別技術包括自然語言處理嗎

    圖像識別技術與自然語言處理是人工智能領域的兩個重要分支,它們在很多方面有著密切的聯(lián)系,但也存在一些區(qū)別。 一、圖像識別技術與自然語言處理的關系 1.1 圖像識別技術的定義 圖像識別技術
    的頭像 發(fā)表于 07-16 10:54 ?910次閱讀

    圖像識別技術在醫(yī)療領域的應用

    一、引言 圖像識別技術是一種利用計算機視覺技術對圖像進行分析和處理的技術。隨著計算機技術、人工智能技術、大數(shù)據(jù)技術等的發(fā)展,圖像識別技術在各個領域的應用越來越廣泛。在醫(yī)療領域,圖像識別
    的頭像 發(fā)表于 07-16 10:48 ?1059次閱讀

    圖像識別技術的原理是什么

    圖像識別技術是一種利用計算機視覺和機器學習技術對圖像進行分析和理解的技術。它可以幫助計算機識別和理解圖像中的對象、場景和活動。 圖像預處理
    的頭像 發(fā)表于 07-16 10:46 ?1292次閱讀

    圖像識別屬于人工智能嗎

    屬于。圖像識別是人工智能(Artificial Intelligence, AI)領域的一個重要分支。 一、圖像識別概述 1.1 定義 圖像識別是指利用計算機技術對圖像中的內(nèi)容進行分析
    的頭像 發(fā)表于 07-16 10:44 ?1237次閱讀

    opencv圖像識別有什么算法

    圖像識別算法: 邊緣檢測 :邊緣檢測是圖像識別中的基本步驟之一,用于識別圖像中的邊緣。常見的邊緣檢測算法有Canny邊緣檢測器、Sobel邊緣檢測器和Laplacian邊緣檢測器。 特
    的頭像 發(fā)表于 07-16 10:40 ?1158次閱讀

    如何利用CNN實現(xiàn)圖像識別

    卷積神經(jīng)網(wǎng)絡(CNN)是深度學習領域中一種特別適用于圖像識別任務的神經(jīng)網(wǎng)絡結(jié)構。它通過模擬人類視覺系統(tǒng)的處理方式,利用卷積、池化等操作,自動提取圖像中的特征,進而實現(xiàn)高效的圖像識別。本文將從CNN的基本原理、構建過程、訓練策略以
    的頭像 發(fā)表于 07-03 16:16 ?1489次閱讀

    神經(jīng)網(wǎng)絡在圖像識別中的應用

    隨著人工智能技術的飛速發(fā)展,神經(jīng)網(wǎng)絡在圖像識別領域的應用日益廣泛。神經(jīng)網(wǎng)絡以其強大的特征提取和分類能力,為圖像識別帶來了革命性的進步。本文將詳細介紹神經(jīng)網(wǎng)絡在圖像識別中的應用案例,包括卷積神經(jīng)網(wǎng)絡(CNN)在面部
    的頭像 發(fā)表于 07-01 14:19 ?765次閱讀

    圖像識別技術原理 圖像識別技術的應用領域

    圖像識別技術是一種通過計算機對圖像進行分析和理解的技術。它借助計算機視覺、模式識別、人工智能等相關技術,通過對圖像進行特征提取和匹配,找出圖像
    的頭像 發(fā)表于 02-02 11:01 ?2672次閱讀