0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內(nèi)不再提示

?綜述導讀:深度學習驅(qū)動下的相機標定技術

QQ475400555 ? 來源:機器視覺沙龍 ? 2023-05-11 16:33 ? 次閱讀

相機標定在計算機視覺機器人等領域中占據(jù)舉足輕重的地位,它為后續(xù)場景理解及決策推斷提供了標準化的成像空間和精準的幾何先驗。然而,傳統(tǒng)的相機標定技術常常依賴于繁瑣的人工干預和特定的場景假設,因此難以靈活拓展至不同的相機模型和標定場景。近年來,基于深度學習的解決方案展現(xiàn)出代替手動操作、擺脫場景假設的潛力,實現(xiàn)了全自動化的相機標定技術。在這些方案中,各種各樣的學習機制、網(wǎng)絡架構、先驗知識、優(yōu)化函數(shù)、數(shù)據(jù)集等方面均得到了廣泛的研究。

1a714cdc-efd5-11ed-90ce-dac502259ad0.png

論文鏈接: https://arxiv.org/pdf/2303.10559.pdf 本綜述總結的方法細節(jié)、數(shù)據(jù)集和構建的評測基準已在線公開并將定期更新,詳情請見: https://github.com/KangLiao929/Awesome-Deep-Camera-Calibration

本綜述首次系統(tǒng)性地概述了深度學習驅(qū)動下的相機標定技術,涵蓋了深度學習時代以來(8年時間跨度)各類相機模型標定及其應用的最新研究進展。主要探索的標定類別包括標準針孔相機模型、畸變相機模型、跨視角模型和跨傳感器模型等。該路線緊密契合了基于深度學習的相機標定的研究趨勢和實際市場需求。在每個類別中,相應技術發(fā)展的貢獻點、優(yōu)勢、局限性得到了充分論述,具體的未來研究技術點也進行了一定展望。此外,本文還整合、構建了一個公開且全面的評測基準數(shù)據(jù)集,可作為開放平臺用于不同研究方法的性能評測。該數(shù)據(jù)集包括了不同仿真環(huán)境下生成的合成數(shù)據(jù),以及不同場景下由各類真實相機采集到的圖像和視頻序列。每一個數(shù)據(jù)樣本均提供了準確的標定結果、相機參數(shù)、或視覺線索。最后,我們討論了整個基于深度學習的相機標定領域仍然存在的挑戰(zhàn)以及未來可能的研究方向。

一、相機模型及標定目標

相機模型描述了從三維世界坐標中的點到其在二維圖像平面上投影的成像過程。其中,不同的相機和傳感器系統(tǒng)對應不同類型的參數(shù)模型。在本綜述中,我們首先回顧了標準的針孔相機模型涉及的內(nèi)外相機參數(shù)以及幾何表征。隨后,我們根據(jù)基于深度學習的相機標定技術發(fā)展和市場需求回顧了更加復雜的模型,如廣角/魚眼相機模型、卷簾門模型、跨視角模型和相機-雷達聯(lián)合模型。特別地,考慮到傳統(tǒng)相機標定中部分標定目標的隱式性和異質(zhì)性,我們還歸納總結了該領域利于神經(jīng)網(wǎng)絡學習的新標定目標。這些新目標能夠加速訓練損失收斂并有助于提高標定性能。更多細節(jié)詳見本綜述補充材料的第二部分。

1aa09cc6-efd5-11ed-90ce-dac502259ad0.png

本綜述涵蓋了目前市場主流的相機模型、標定目標及其拓展應用

二、基于深度學習的相機標定范式及策略

在工業(yè)界和學術界中,有一些標準的相機標定技術可供選擇(如OpenCV、Kalibr),因此這個過程通常在計算機視覺的最新發(fā)展中被忽視。然而,使用傳統(tǒng)方法對單個或自然圖像和序列(in the wild)進行標定仍然極具挑戰(zhàn),特別是當待標定數(shù)據(jù)來自互聯(lián)網(wǎng)或未知的相機模型。近年來,深度學習為相機標定技術帶來了新的靈感,實現(xiàn)了無需人工干預的全自動標定過程。本綜述首先從學習范式和學習策略這兩個方面對基于深度學習的相機標定進行分類總結。

學習范式

受不同神經(jīng)網(wǎng)絡架構的啟發(fā),研究人員開發(fā)出了兩種主流的深度學習相機標定范式。

第一種稱為回歸范式,使用具有卷積和全連接層的神經(jīng)網(wǎng)絡從輸入中回歸標定目標。隨后,回歸得到的相機參數(shù)用于進行后續(xù)任務,如畸變矯正、相機定位、三維重建等。這種學習范式在該領域內(nèi)最早得到研究,各類標定模型的第一個深度學習工作均屬于回歸范式,如內(nèi)參標定(Deepfocal[21]),外參標定(PoseNet[22]),廣角相機標定(Rong[23]),卷簾門標定(URS-CNN[23]),相機-雷達聯(lián)合標定(RegNet[27])等。

第二種稱為重建范式,它拋棄了傳統(tǒng)的參數(shù)回歸思想,使用全卷積網(wǎng)絡直接從初始輸入學習像素級的映射函數(shù),將待標定域映射到標定域上。這種方式專注于像素級重建并與后續(xù)任務聯(lián)合學習,可以實現(xiàn)無參數(shù)、一階段標定。該范式下經(jīng)典的標定算法有:針孔相機(MisCaliDet[108]),廣角相機(DR-GAN[31]),卷簾門模型(DeepUnrollNet[46]),相機-雷達模型(CFNet[153])等。

學習策略

在基于深度學習的相機標定發(fā)展中,多種學習策略得以探索,其中有監(jiān)督學習占絕大多數(shù)(超過90%)??紤]到標記工作費時費力,越來越多的研究者探索使用半監(jiān)督學習、弱監(jiān)督學習、無監(jiān)督學習和自監(jiān)督學習來降低神經(jīng)網(wǎng)絡對參數(shù)標簽的訓練需求。這些學習策略的研究重心也從數(shù)據(jù)量、網(wǎng)絡層數(shù)的堆疊等逐漸轉變?yōu)閷?shù)據(jù)本身先驗知識的挖掘。

在相機標定技術中,幾何先驗具有高效利用數(shù)據(jù)的特點,因為它們消除了從數(shù)據(jù)中學習這些信息的必要性,這使得網(wǎng)絡框架易于解釋,并且更好地適用于相近的數(shù)據(jù)分布。此外,強化學習也被用于動態(tài)解決相機標定問題。我們注意到,該領域仍然有很多學習策略尚未被開發(fā)研究,如主動學習、少樣本學習、零樣本學習等。這些學習策略可以進一步提高標定算法的效率和魯棒性,從而擴展相機標定的應用場景,例如在醫(yī)療圖像處理、軍事偵察和自動駕駛等領域。

三、具體研究進展及討論

本綜述的結構和層次分類如下圖所示,其中每個部分對應標定不同的相機模型或拓展模型的研究進展。在第三章中,我們介紹了標準針孔相機標定,其中按標定目標分為內(nèi)參標定、外參標定、內(nèi)外參聯(lián)合標定。在第四章中,我們介紹了畸變相機模型標定,其中按畸變類型分為徑向畸變和卷簾門畸變。對于徑向畸變,我們按學習范式進行分類概述;對于卷簾門畸變,我們按數(shù)據(jù)類型進行逐一分析。在第五章中,我們介紹了跨視角模型應用,其中按算法流程分為直接方案、級聯(lián)方案和迭代方案。在第六章中,我們介紹了跨傳感器模型標定,特別是相機-雷達聯(lián)合標定,其中按標定目標分為像素級、語義級和物體/關鍵點級標定。在每一章節(jié)中,我們還歸納了對應標定模型下的深度學習研究趨勢,并展望了未來研究的技術路徑。

有趣的是,我們發(fā)現(xiàn)雖然不同模型標定算法之間的發(fā)展鮮有關聯(lián),但是它們的研究趨勢均呈現(xiàn)出從回歸范式到重建范式的拓展。新的標定目標的發(fā)展也不謀而合。此外,部分方案根據(jù)傳統(tǒng)標定的流程重新設定了每個學習模塊的結構和功能,在靈活整合幾何求解算法的同時大大提高了網(wǎng)絡的可解釋性。更多分析和討論詳見綜述的第三章至第六章。

1abaf2ec-efd5-11ed-90ce-dac502259ad0.png

本綜述的結構和層次分類,其中每個類別下列出了一些經(jīng)典的方法

四、評測基準

由于在基于深度學習的相機標定領域中還沒有公開且統(tǒng)一的評測基準,因此我們整合、構建了一個數(shù)據(jù)集,以用于評估不同方法的泛化性能。在這個數(shù)據(jù)集中,圖像和視頻是由不同的相機在各種場景下拍攝的,包括模擬環(huán)境和真實世界的場景。此外,我們基于不同的條件提供了標定的真實結果、參數(shù)標簽和視覺線索等,如下圖所示。特別地,對于畸變相機模型,我們使用大約40種廣角相機采集室內(nèi)的原始數(shù)據(jù)。其中每個數(shù)據(jù)均配有標定獲得的內(nèi)參、外參和畸變系數(shù)。為了豐富場景多樣性,我們還用一輛配備了不同標定相機的車載系統(tǒng)來采集街景環(huán)境下的視頻序列,涵蓋了白天、黑夜以及不同的天氣。

1ace1340-efd5-11ed-90ce-dac502259ad0.png

本綜述整合、構建的評測基準數(shù)據(jù)集

五、未來研究展望

相機標定是計算機視覺和機器人領域中一個基礎但具有挑戰(zhàn)性的研究課題。從以上的技術回顧和趨勢洞察,我們發(fā)現(xiàn)目前的深度學習方案仍有很大的提升空間。從第三章到第六章,本綜述討論了各類相機模型未來研究的技術路徑。在本節(jié)中,我們將提出整個研究社區(qū)可能關心的一些更為宏觀的未來研究方向。

· 序列標定的拓展

現(xiàn)有的深度學習研究側重于單個圖像的標定,而忽略了采集序列中的時空相關性。將現(xiàn)有方法應用于第一幀并傳播到后續(xù)幀是一種直接的解決方法,但是無法確保完美標定每個輸入,因此標定誤差將貫穿整個序列。學習時空相關性可以為網(wǎng)絡提供運動結構相關的知識,同時在一定程度契合了傳統(tǒng)相機標定的思想。

· 標定目標的革新

傳統(tǒng)的標定目標由于與圖像特征之間的隱式關系,很難通過神經(jīng)網(wǎng)絡準確學習。為此,一些研究開發(fā)了新穎的學習目標來替代傳統(tǒng)的標定目標,為神經(jīng)網(wǎng)絡提供了更加友好的學習表征。此外,一些中間的幾何表示方法也被提出,以彌合圖像特征和標定目標之間的差距,例如反射振幅系數(shù)圖、矯正流、表面幾何和法向流等。展望未來,我們認為仍有很大的潛力設計更明確和合理的標定目標學習方法。

· 預訓練策略的探索

在深度學習中,使用ImageNet數(shù)據(jù)集進行預訓練已成為一種廣泛使用的策略。然而,近期研究表明,這種方法對于特定的相機標定任務(如廣角相機標定)會起到負面作用。這主要由兩個原因造成:數(shù)據(jù)差距和任務差距。此外,據(jù)我們所知,對于超過單個圖像和單個模態(tài)的標定預訓練策略,相關領域尚未進行深入研究。因此,我們認為探索面向相機標定的深度學習預訓練策略是一個有趣且有價值的研究方向。

· 隱式、統(tǒng)一模型的構建

基于深度學習的相機標定方法大多使用傳統(tǒng)的參數(shù)化相機模型,這種模型缺乏適應復雜情況的靈活性。非參數(shù)化相機模型將每個像素與其對應的三維入射光線相關聯(lián),克服了參數(shù)化模型的限制。此外,它們允許隱式和統(tǒng)一的標定,通過像素級回歸適配所有相機類型,避免了顯式特征提取和幾何求解等過程。深度學習方法顯示出對重建式標定任務的潛力,使得非參數(shù)化模型值得重新審視,并有可能在未來代替參數(shù)化模型。

另一方面,研究人員將隱式、統(tǒng)一表示的優(yōu)勢與神經(jīng)輻射場(NeRF)相結合,用于重建三維結構和合成新視角。其中,自標定NeRF方法可用于具有任意非線性畸變的通用相機,探索了無需標定目標學習深度和自運動的端到端流程。

本綜述認為,隱式和統(tǒng)一相機模型在未來可以用于優(yōu)化基于學習的標定算法,也可集成到下游的三維視覺任務中。同時,該領域中精心設計的幾何先驗、標定策略、優(yōu)化方式、學習表征等也可用于啟發(fā)NeRF等領域的發(fā)展,以進一步擺脫對相機參數(shù)和相機模型的依賴。

更多的未來研究方向,特別是相機標定的實際應用研究點,詳見本綜述補充材料的第三章。

六、總結

我們提供了一份深度學習驅(qū)動的相機標定技術綜述,涵蓋了傳統(tǒng)相機模型、新的學習范式和學習策略、現(xiàn)有方法的詳細回顧、公開的基準測試以及未來研究方向。為了展示發(fā)展過程和現(xiàn)有工作之間的聯(lián)系,我們提供了一種新的精細分類法,通過同時考慮相機模型和拓展應用來對文獻進行分類。此外,在每個類別中,我們都對研究方法的貢獻點、優(yōu)勢和局限性進行了深入地討論。我們將維護一個開放的github倉庫并定期更新最新的工作和數(shù)據(jù)集。我們希望本綜述能夠為相關研究和從業(yè)者提供一個重要參考,并推動這個領域未來的研究發(fā)展。

審核編輯 :李倩

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 相機
    +關注

    關注

    4

    文章

    1424

    瀏覽量

    54433
  • 數(shù)據(jù)集

    關注

    4

    文章

    1222

    瀏覽量

    25236
  • 深度學習
    +關注

    關注

    73

    文章

    5550

    瀏覽量

    122379

原文標題:?綜述導讀:深度學習驅(qū)動下的相機標定技術

文章出處:【微信號:機器視覺沙龍,微信公眾號:機器視覺沙龍】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦
    熱點推薦

    基于深度學習的異常檢測的研究方法

    異常檢測的深度學習研究綜述原文:arXiv:1901.03407摘要異常檢測是一個重要的問題,在不同的研究領域和應用領域都得到了很好的研究。本文的研究目的有兩個:首先,我們對基于深度
    發(fā)表于 07-12 07:10

    相機標定介紹

    什么是攝相機標定?攝相機標定方法的分類?感興趣的小伙伴們可以瞧一瞧。
    發(fā)表于 09-22 12:04 ?0次下載

    opencv相機標定原理與步驟

    我們首先介紹計算機視覺領域中常見的三個坐標系:圖像坐標系,相機坐標系,世界坐標系。以及他們之間的關系。然后介紹如何使用張正友相機標定標定相機
    發(fā)表于 12-04 16:56 ?1.9w次閱讀
    opencv<b class='flag-5'>相機</b><b class='flag-5'>標定</b>原理與步驟

    相機標定的邏輯和學習資料詳細概述

    相機標定可以說是計算機視覺/機器視覺的基礎,但是初學者不易上手,本文將給讀者整理一遍相機標定的邏輯,并在文末回答評論區(qū)提出的問題。分為以下內(nèi)容:
    的頭像 發(fā)表于 06-01 09:54 ?4597次閱讀
    <b class='flag-5'>相機</b><b class='flag-5'>標定</b>的邏輯和<b class='flag-5'>學習</b>資料詳細概述

    基于深度學習的光學成像算法綜述

    成分信息。近年來,隨著深度學習算法在醫(yī)學圖像處理中的廣泛應用,基于深度學習的光聲成像算法也成為該領堿的硏究熱點。對深度
    發(fā)表于 06-16 14:58 ?10次下載

    基于深度學習的文本主題模型研究綜述

    基于深度學習的文本主題模型研究綜述
    發(fā)表于 06-24 11:49 ?68次下載

    基于深度學習的目標檢測研究綜述

    基于深度學習的目標檢測研究綜述 來源:《電子學報》?,作者羅會蘭等 摘 要:?目標檢測是計算機視覺領域內(nèi)的熱點課題,在機器人導航、智能視頻監(jiān)控及航天航空等領域都有廣泛的應用.本文首先綜述
    發(fā)表于 01-06 09:14 ?2367次閱讀
    基于<b class='flag-5'>深度</b><b class='flag-5'>學習</b>的目標檢測研究<b class='flag-5'>綜述</b>

    相機標定含義(解決什么是相機標定

    在大多數(shù)條件,這些參數(shù)必須通過實驗與計算才能得到。無論是在圖像測量或者機器視覺應用中,相機參數(shù)的標定都是非常關鍵的環(huán)節(jié),其標定結果的精度及算法的穩(wěn)定性直接影響
    的頭像 發(fā)表于 06-21 11:12 ?8610次閱讀

    基于深度學習相機標定技術挑戰(zhàn)

    該數(shù)據(jù)集包括了不同仿真環(huán)境下生成的合成數(shù)據(jù),以及不同場景由各類真實相機采集到的圖像和視頻序列。每一個數(shù)據(jù)樣本均提供了準確的標定結果、相機參數(shù)、或視覺線索。
    發(fā)表于 04-10 10:45 ?481次閱讀

    深度學習驅(qū)動相機標定技術研究

    相機模型描述了從三維世界坐標中的點到其在二維圖像平面上投影的成像過程。其中,不同的相機和傳感器系統(tǒng)對應不同類型的參數(shù)模型。
    發(fā)表于 05-12 10:22 ?427次閱讀
    <b class='flag-5'>深度</b><b class='flag-5'>學習</b><b class='flag-5'>驅(qū)動</b><b class='flag-5'>下</b>的<b class='flag-5'>相機</b><b class='flag-5'>標定</b><b class='flag-5'>技術</b>研究

    如何學習相機模型與標定?

    相機標定是通過輸入帶有標定patter的標定板來獲得相機參數(shù)的一個過程。實際的光學成像是一套非常復雜的過程,從三維世界投影到
    的頭像 發(fā)表于 06-01 14:36 ?943次閱讀
    如何<b class='flag-5'>學習</b><b class='flag-5'>相機</b>模型與<b class='flag-5'>標定</b>?

    深度學習聚類的綜述

    什么是深度聚類?經(jīng)典聚類即數(shù)據(jù)通過各種表示學習技術以矢量化形式表示為特征。隨著數(shù)據(jù)變得越來越復雜和復雜,淺層(傳統(tǒng))聚類方法已經(jīng)無法處理高維數(shù)據(jù)類型。為了解決該問題
    的頭像 發(fā)表于 01-13 11:11 ?1327次閱讀
    <b class='flag-5'>深度</b><b class='flag-5'>學習</b>聚類的<b class='flag-5'>綜述</b>

    相機標定究竟在標定什么?

    這個逼近的過程就是「相機標定」,我們用簡單的數(shù)學模型來表達復雜的成像過程,并且求出成像的反過程。標定之后的相機,可以進行三維場景的重建,即深度
    的頭像 發(fā)表于 10-18 17:00 ?1210次閱讀
    <b class='flag-5'>相機</b><b class='flag-5'>標定</b>究竟在<b class='flag-5'>標定</b>什么?

    深度學習中的無監(jiān)督學習方法綜述

    應用中往往難以實現(xiàn)。因此,無監(jiān)督學習深度學習中扮演著越來越重要的角色。本文旨在綜述深度學習中的
    的頭像 發(fā)表于 07-09 10:50 ?1412次閱讀

    肇觀電子首發(fā)自標定3D深度相機

    肇觀電子近日宣布,憑借自研VPU芯片的異構計算架構與實時動態(tài)優(yōu)化算法,成功實現(xiàn)了深度相機的全生命周期自標定技術,為全球首創(chuàng)。
    的頭像 發(fā)表于 02-10 17:54 ?525次閱讀

    電子發(fā)燒友

    中國電子工程師最喜歡的網(wǎng)站

    • 2931785位工程師會員交流學習
    • 獲取您個性化的科技前沿技術信息
    • 參加活動獲取豐厚的禮品