0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

單目視覺識別的無限市場潛力

ml8z_IV_Technol ? 來源:cg ? 2018-12-01 11:13 ? 次閱讀

對單目來說物體越遠,測距的精度越低,硬件上的缺點可以通過算法去彌補,近日有兩篇關于單目視覺的研究論文曝光,一篇是單目視頻的深度估計,另一篇則是單目3d物體識別,在數據集下測試都取得了不錯的效果,我們熟悉的單目攝像頭可能一直被低估了。

攝像頭是自動駕駛汽車中重要的傳感器之一,在自動駕駛過程中的首要任務就是道路識別 ,主要是圖像特征法和模型匹配法來進行識別。行駛過程中需要進行障礙物檢測和路標路牌識別等,此時車輛上的信息采集便可以運用單目視覺或者多目視覺。

由于很多圖像算法的研究都是基于單目攝像機開發(fā)的,因此相對于其他類別的攝像機,單目攝像機的算法成熟度更高?;趩文繑z像頭可以用來定位、目標識別等。但是相比多目,單目有著先天的缺陷,視野信息不能夠豐富,單目測距的精度也較低。

不過單目攝像頭的作用還未發(fā)揮到極致,近日有兩篇關于單目視覺的研究,讓眾多研究者驚艷,原來單目一樣可以有不錯的表現。

Paper1:

Orthographic Feature Transform for Monocular 3D Object Detection

單目3d物體檢測是一件很有挑戰(zhàn)性的事情,目前最先進系統的成績也不及用激光雷達的1/10,劍橋大學的科學家利用單目視覺進行3d物體識別,通過引入正交特征變換,使基于圖像的特征映射到正交3D空間,來避免形成圖像域,可以全面地推斷出各個物體比例尺寸以及相隔的距離。通過在KITTI數據集里測試,發(fā)現與前人的Mono3D方法對比,這種方法在鳥瞰圖平均精確度、3D物體邊界識別上各項測試成績上均優(yōu)于對手。

尤其在探測遠處物體時要遠超Mono3D,遠處可識別出的汽車數量更多。甚至在嚴重遮擋、截斷的情況下仍能正確識別出物體。在某些場景下甚至達到了3DOP系統的水平。

在這項工作中,提出的一種新穎的單目三維物體檢測方法,基于在鳥瞰視野范圍內操作的,減輕了許多不良圖像的屬性,更易于推斷出世界的3D結構。用一種簡單的正交特征變換,將基于圖像的特征轉換為這種鳥瞰視圖表示, 并描述了如何使用圖像積分有效地實現它,以深二維卷積網絡的形式應用于提取的鳥瞰特征,取得了不錯的效果,說明單目還有很大可開發(fā)的空間。

Paper2:

A Structured Approach to Unsupervised Depth Learning from Monocular Videos

這是谷歌的工程師做的一個研究,他利用單目視頻深度估計,自從2014年NIPS上出現第一篇用CNN-based來做單目深度估計,近幾年也不斷涌現出一些做單目深度估計的文章,有直接依靠深度學習和網絡架構得到結果,還有依靠于深度信息本身的性質進行估計,基于CRF和基于相對深度方法的,本篇文章是基于無監(jiān)督學習單目視頻深度估計。文中的方法能夠模擬運動物體并產生高質量的深度估計結果,與以前的單目視頻無監(jiān)督學習方法相比,該方法能夠恢復移動物體的正確深度。也就說,能夠正確地恢復與自身運動車輛相同速度的移動汽車的深度。因為一臺相對靜止的車輛,往往會表現出與地面相同的無線深度特征,解決了高動態(tài)場景中的問題。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規(guī)問題,請聯系本站處理。 舉報投訴
  • 攝像頭
    +關注

    關注

    60

    文章

    4853

    瀏覽量

    95965
  • 視覺識別
    +關注

    關注

    3

    文章

    89

    瀏覽量

    16769
  • 自動駕駛
    +關注

    關注

    784

    文章

    13895

    瀏覽量

    166689

原文標題:被低估的單目視覺識別

文章出處:【微信號:IV_Technology,微信公眾號:智車科技】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦

    開源項目 ! 利用邊緣計算打造便攜式視覺識別系統

    擴展地構建這些系統。 邊緣計算平臺應運而生 —— 它是實現超快速、低延遲視覺識別的秘訣所在。通過在本地處理數據,邊緣計算大幅削減了傳輸延遲,實現了實時響應,并提高了計算效率。對于那些分秒必爭的應用場
    發(fā)表于 12-16 16:31

    一文了解AI網絡互聯的市場潛力

    AI網絡多層次的互聯彰顯市場潛力 NVIDIA作為全球領先的視覺計算和人工智能公司,其市值突破萬億元的背后,除了強大的GPU產品線,互聯技術扮演了不可或缺的支柱角色。NVIDIA于2019年收
    的頭像 發(fā)表于 11-27 10:08 ?490次閱讀
    一文了解AI網絡互聯的<b class='flag-5'>市場潛力</b>

    ASR與傳統語音識別的區(qū)別

    識別技術。 構建更深更復雜的神經網絡模型,利用大量數據進行訓練。 提高了語音識別的準確率和穩(wěn)定性。 傳統語音識別 : 通常依賴于聲學-語言模型的方法。 在處理復雜的語音輸入時,可能表現不如ASR技術出色。 二、功能多樣性 ASR
    的頭像 發(fā)表于 11-18 15:22 ?563次閱讀

    RISC-V擁有巨大市場潛力的原因

    敏感的市場尤其有吸引力。 5、行業(yè)支持:越來越多的行業(yè)巨頭和初創(chuàng)公司開始支持RISC-V,這不僅包括芯片制造商,還包括軟件開發(fā)商和系統設計公司。2023年,包括谷歌、英特爾、英偉達、高通、阿里等在內
    發(fā)表于 09-30 14:20

    氮化鎵(GaN)技術的迅猛發(fā)展與市場潛力

    ,市場潛力巨大。根據市場研究機構的預測,氮化鎵功率元件市場的營收將在2024年顯著增長,預計到2026年市場規(guī)模將達到13.3億美元,復合年增長率高達65%。這一增長趨
    的頭像 發(fā)表于 07-24 10:55 ?644次閱讀
    氮化鎵(GaN)技術的迅猛發(fā)展與<b class='flag-5'>市場潛力</b>

    如何設計人臉識別的神經網絡

    人臉識別技術是一種基于人臉特征信息進行身份識別的技術,廣泛應用于安全監(jiān)控、身份認證、智能門禁等領域。神經網絡是實現人臉識別的關鍵技術之一,本文將介紹如何設計人臉識別的神經網絡。 人臉
    的頭像 發(fā)表于 07-04 09:20 ?696次閱讀

    人臉檢測和人臉識別的區(qū)別是什么

    人臉檢測和人臉識別是計算機視覺領域的兩個重要技術,它們在許多應用場景中都有廣泛的應用,如安全監(jiān)控、身份驗證、社交媒體等。盡管它們在某些方面有相似之處,但它們之間存在一些關鍵的區(qū)別。本文將詳細介紹人
    的頭像 發(fā)表于 07-03 14:49 ?1322次閱讀

    人臉檢測與識別的方法有哪些

    人臉檢測與識別是計算機視覺領域中的一個重要研究方向,具有廣泛的應用前景,如安全監(jiān)控、身份認證、智能視頻分析等。本文將詳細介紹人臉檢測與識別的方法。 引言 人臉檢測與識別技術在現代社會中
    的頭像 發(fā)表于 07-03 14:45 ?768次閱讀

    圖像檢測和圖像識別的區(qū)別是什么

    詳細的比較和分析。 定義和概念 圖像檢測(Image Detection)是指利用計算機視覺技術對圖像中的特定目標進行定位和識別的過程。它通常包括目標的檢測、分類和定位三個步驟。圖像檢測的目標可以是人、車、動物等任何具有特定特征
    的頭像 發(fā)表于 07-03 14:41 ?1108次閱讀

    軍用光電耦合器產品的市場潛力與應用前景

    光電耦合器作為現代軍事技術中的關鍵組件,其在軍用領域的市場空間和應用前景備受關注。本文將深入分析光電耦合器產品在軍事領域中的市場潛力,探討其技術特點、應用場景及未來發(fā)展趨勢。
    的頭像 發(fā)表于 06-28 11:50 ?370次閱讀
    軍用光電耦合器產品的<b class='flag-5'>市場潛力</b>與應用前景

    芯啟源榮獲“最具市場潛力中小企業(yè)獎”

    2024年6月20日下午,浙江省半導體行業(yè)協會四屆三次會員大會在湖州南潯舉行。芯啟源與省內外專家學者、省半導體行業(yè)協會主要負責人、半導體行業(yè)相關企業(yè)等200余人共同參會,并憑借高速的市場增長、雄厚的科技實力和前瞻性的市場洞察榮獲“最具
    的頭像 發(fā)表于 06-22 11:09 ?1065次閱讀

    AI服務器脫離GPU依賴,AI PC市場潛力無限

    由于GPU供應短缺,AI服務器一度出現供給不足的情況。廖仁祥指出,考慮到AI服務器價格相對較高,企業(yè)采購預算中已有20%用于此項開支,涵蓋了制造業(yè)、電信業(yè)、醫(yī)療機構以及政府部門等多個領域,金融行業(yè)也逐漸引入生成式AI應用。
    的頭像 發(fā)表于 04-11 09:32 ?410次閱讀

    語音識別的技術歷程及工作原理

    語音識別的本質是一種基于語音特征參數的模式識別,即通過學習,系統能夠把輸入的語音按一定模式進行分類,進而依據判定準則找出最佳匹配結果。
    的頭像 發(fā)表于 03-22 16:58 ?3451次閱讀
    語音<b class='flag-5'>識別的</b>技術歷程及工作原理

    RFID標簽技術:智能識別的新紀元

    隨著物聯網、大數據和人工智能的飛速發(fā)展,RFID(無線射頻識別)技術作為智能識別的重要手段,正日益成為各行各業(yè)的關鍵技術之一
    的頭像 發(fā)表于 03-21 11:18 ?1061次閱讀
    RFID標簽技術:智能<b class='flag-5'>識別的</b>新紀元

    機器視覺的圖像目標識別方法綜述

    機器視覺代替?zhèn)鹘y的人工視覺,能夠更好的滿足危險作業(yè)基本需求。機器視覺的圖像目標識別的重要性圖像目標識別是機器
    的頭像 發(fā)表于 02-23 08:26 ?752次閱讀
    機器<b class='flag-5'>視覺</b>的圖像目標<b class='flag-5'>識別</b>方法綜述