0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

機器視覺加速從2D走向3D

機器視覺 ? 來源:機器視覺 ? 作者:機器視覺 ? 2022-11-25 10:29 ? 次閱讀

機器視覺是指利用相機、攝像機等傳感器,配合機器視覺算法賦予智能設(shè)備人眼的功能,從而進行物體的識別、檢測、測量等功能。機器視覺是在上世紀 50 年代從統(tǒng)計模式識別開始的,當時的工作主要集中在二維圖像分析和識別。隨著 5G、AI 等技術(shù)的不斷發(fā)展,行業(yè)應用需求的不斷提升,機器視覺從二維向三維過渡不但成為可能,更是必須的方向。

機器視覺從2D進化到3D立體“視界”,常見常用的刷臉支付、Face ID、VR、無人便利店、智能機器人等產(chǎn)品技術(shù),背后關(guān)鍵的科技便是3D視覺技術(shù)。

在過去幾年里,3D視覺概念迭出,大量資本涌入這個賽道,新進企業(yè)眾多。業(yè)內(nèi)人士普遍認為,3D視覺在工業(yè)領(lǐng)域的產(chǎn)值和產(chǎn)出,可能要遠遠大于消費領(lǐng)域,但因為滲透率很低,推進速度不夠快,當前3D工業(yè)相機的規(guī)模在幾億美金區(qū)間,設(shè)備和軟件在20億美金水平,但行業(yè)市場有50倍以上的滲透率增長空間。

從2D到3D的賽道變化2D技術(shù)起步較早,技術(shù)也相對成熟,在過去的30年中已被證明在廣泛的自動化和產(chǎn)品質(zhì)量控制過程中非常有效。

2D技術(shù)根據(jù)灰度或彩色圖像中對比度的特征提供結(jié)果。2D適用于缺失/存在檢測、離散對象分析、圖案對齊、條形碼和光學字符識別(OCR)以及基于邊緣檢測的各種二維幾何分析,用于擬合線條、弧線、圓形及其關(guān)系(距離,角度,交叉點等)。

3D視覺利用近紅外線光來掃描周圍環(huán)境,再由CMOS圖像傳感器接收并轉(zhuǎn)換為數(shù)字信號,最后通過芯片計算出物體在三維空間中的遠近與相對位置,因此能了解物體的動作、與環(huán)境的互動,由此即能發(fā)展出由動作控制計算機的體感操控,檢測出前方的物體等。

由于2D視覺逐漸無法滿足對復雜對象識別和尺寸測量精度日益增加的要求,因此也催生了3D視覺的增長。從2D轉(zhuǎn)向3D,需要所獲取信息質(zhì)量和數(shù)量的飛躍。相對來說,2D視覺市場積淀深,3D視覺方案只有達到一定的成熟度,才可以全面實現(xiàn)2D向3D的轉(zhuǎn)變。

過去工業(yè)生產(chǎn)采用的機械臂都是盲取,閉著眼睛照著設(shè)定好的路徑加工,沒有更高階的智慧判斷。如果采用3D視覺后,就可以在更復雜的環(huán)境里更精準的夾取物件。業(yè)界認為,從2D到3D的過渡將成為繼黑白到彩色,低分辨率到高分辨率以及靜態(tài)圖像到電影之后的第四次革命。

但是3D機器視覺技術(shù)門檻高,涉及到光學、結(jié)構(gòu)、散熱等跨學科設(shè)計問題,再加上芯片、算法構(gòu)成的復雜系統(tǒng)設(shè)計,需要一定的技術(shù)實力,投入足夠的時間和人才,才可以研發(fā)相關(guān)方案。技術(shù)門檻高、投入大、研發(fā)企業(yè)少都是3D視覺發(fā)展路上的攔路虎。

在3D視覺興起之后,選擇2D視覺還是3D視覺,成為一個有爭議的問題。有業(yè)內(nèi)人士表示,3D視覺將全面替代2D視覺;但也有觀點認為,3D視覺價格高,在可以應用2D視覺的場合,沒有必要用3D視覺;當然還有第三方觀點認為,2D視覺和3D視覺可以融合應用。

就具體技術(shù)角度而言,2D顏色和3D幾何數(shù)據(jù)的采集是從兩個不同的物理通道進行的。

從落地來看,目前3D主要應用于大型工業(yè)制造業(yè)企業(yè)、物流、智慧城市監(jiān)控,以及少部分消費應用場景等,從探索到突破,在落地的路上逐顯繁榮。

3D視覺的不同技術(shù)形態(tài)目前市場上主流的有四種3D視覺技術(shù),雙目視覺、TOF、結(jié)構(gòu)光3D成像和激光三角測量。

1.雙目視覺雙目技術(shù)是目前較為廣泛的3D視覺系統(tǒng),它的原理就像我們?nèi)说膬芍谎劬?,用兩個視點觀察同一景物以獲取在不同視角下的感知圖像,然后通過三角測量原理計算圖像的視差,來獲取景物的三維信息 。

87634e92-6c10-11ed-8abf-dac502259ad0.png

由于雙目技術(shù)原理簡單,不需要使用特殊的發(fā)射器和接收器,只需要在自然光照下就能獲得三維信息,所以雙目技術(shù)具有系統(tǒng)結(jié)構(gòu)簡單、實現(xiàn)靈活和成本低的優(yōu)點。適合于制造現(xiàn)場的在線、產(chǎn)品檢測和質(zhì)量控制,不過雙目技術(shù)的劣勢是算法復雜,計算量大,而且光照較暗或者過度曝光的情況下效果差。

8790d128-6c10-11ed-8abf-dac502259ad0.png

2.3D結(jié)構(gòu)光技術(shù)

它通過一個光源投射出一束結(jié)構(gòu)光,這結(jié)構(gòu)光可不是普通的光,而是具備一定結(jié)構(gòu)(比如黑白相間)的光線打到想要測量的物體上表面,因為物體有不同的形狀,會對這樣的一些條紋或斑點發(fā)生不同的變形,有這樣的變形之后,通過算法可以計算出距離、形狀、尺寸等信息從而獲得物體的三維圖像。

3. 激光三角測量法它基于光學三角原理,根據(jù)光源、物體和檢測器三者之間的幾何成像關(guān)系,來確定空間物體各點的三維坐標 。

87c53cce-6c10-11ed-8abf-dac502259ad0.png

通常用激光作為光源,用CCD相機作為檢測器,具有結(jié)構(gòu)光3D視覺的優(yōu)點,精準、快速、成本低。

4. TOF飛行時間法成像技術(shù)

TOF是Time Of Flight的簡寫。它的原理通過給目標物連續(xù)發(fā)送光脈沖,然后用傳感器接收從物體返回的光,通過探測光脈沖的飛行時間來得到目標物距離。

87f23846-6c10-11ed-8abf-dac502259ad0.png

TOF的核心部件是光源和感光接收模塊,由于TOF是根據(jù)公式直接輸出深度信息,不需要用類似雙目視覺的算法來計算,所以具有響應快、軟件簡單、識別距離遠的特點,而且由于不需要進行灰度圖像的獲取與分析,因此不受外界光源物體表面性質(zhì)影響。典型的TOF 3D掃描系統(tǒng)每秒可測量物體上10,000至100,000個點的距離。不過TOF技術(shù)的缺點是:分辨率低、不能精密成像、而且成本高。

總的來說,無論是立體視覺、結(jié)構(gòu)光、激光三角測量還是TOF,沒有哪種技術(shù)是更好的,只有哪種技術(shù)是更適合的。

3D或?qū)⒊蔀橹髁?/p>

機器人、自動駕駛、金融支付已經(jīng)體現(xiàn)出對3D視覺的強需求,當然,還有虛實相融的元宇宙,AR、VR等XR設(shè)備和3D交互需求已經(jīng)率先凸顯。這些需求帶來了龐大的市場,但這也是極度碎片化的市場。

GGII數(shù)據(jù)顯示,預計到2023年我國機器視覺市場規(guī)模將達到208.6億元,其中3D視覺市場規(guī)模將達到34.28億元,預計到2025年我國3D視覺市場規(guī)模將超過100億元。在這個未來的百億級市場中,3D視覺將趨于智能化、集成化、實時性、高性能、多場景應用等方向。

2D視覺雖為當前主流,但隨著測量精度要求越來越高,被測物體條件越來越復雜,2D系統(tǒng)的缺陷也愈發(fā)突出,而3D視覺技術(shù)不斷獲得突破,在精度、靈活性和速度方面都是2D無可比擬的,所以3D機器視覺檢測有取代2D系統(tǒng)的趨勢,相信3D視覺未來將成為主流視覺系統(tǒng)。

881f3bf2-6c10-11ed-8abf-dac502259ad0.png

應用背景

OCR字符識別,是指對部件或產(chǎn)品上刻印的字符進行確認、辨別、判定的檢測識別。此項技術(shù)目前已廣泛應用于工業(yè)自動化生產(chǎn)的產(chǎn)品質(zhì)量管理環(huán)節(jié)當中,企業(yè)通過為機器視覺檢測設(shè)備安裝OCR系統(tǒng),快速完成對產(chǎn)品生產(chǎn)日期、保質(zhì)期、生產(chǎn)批號、條碼等字符信息的檢測,從而更好地進行產(chǎn)品管理和追溯。

應用現(xiàn)狀

作為機器視覺的典型應用方向,OCR的工作原理即為:通過工業(yè)相機、工業(yè)鏡頭拍攝字符圖像,運用機器視覺軟件進行相應處理分析,判定被檢產(chǎn)品是否合格,并輸出檢測結(jié)果和相應信號

這其中,軟件處理環(huán)節(jié)才是OCR技術(shù)真正的“用武之地”。常規(guī)的技術(shù)處理流程為:背景圖像處理——字符切割——字符注冊——字符識別與判斷——結(jié)果輸出。

實際的工業(yè)應用中,軟件的處理過程

審核編輯:郭婷

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 傳感器
    +關(guān)注

    關(guān)注

    2551

    文章

    51134

    瀏覽量

    753898
  • 機器視覺
    +關(guān)注

    關(guān)注

    162

    文章

    4375

    瀏覽量

    120366

原文標題:機器視覺加速從2D走向3D/讓計算機去理解獲取數(shù)字圖像與視頻中的信息

文章出處:【微信號:www_51qudong_com,微信公眾號:機器視覺】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏

    評論

    相關(guān)推薦

    2D走向3D視覺傳感器

    ,視覺傳感器開始向3D發(fā)展,帶給家用場景下更豐富和完善的功能。 ? 視覺傳感器的發(fā)展 ? 視覺傳感器的概念最早在20世紀50年代后期開始形成,并隨著計算機技術(shù)的進步和
    的頭像 發(fā)表于 12-27 00:22 ?1758次閱讀

    適用于3D機器視覺的高度可擴展的TI DLP技術(shù)

    電子發(fā)燒友網(wǎng)站提供《適用于3D機器視覺的高度可擴展的TI DLP技術(shù).pdf》資料免費下載
    發(fā)表于 08-23 09:57 ?0次下載
    適用于<b class='flag-5'>3D</b><b class='flag-5'>機器</b><b class='flag-5'>視覺</b>的高度可擴展的TI DLP技術(shù)

    微視傳感高性能3D視覺產(chǎn)品亮相2024上海機器視覺

    近日,2024上海機器視覺展在上海新國際博覽中心隆重舉行,微視傳感攜最新的高性能3D視覺產(chǎn)品亮相E2館2121展位,得到廣泛關(guān)注,這次展會不
    的頭像 發(fā)表于 08-06 15:15 ?668次閱讀
    微視傳感高性能<b class='flag-5'>3D</b><b class='flag-5'>視覺</b>產(chǎn)品亮相2024上海<b class='flag-5'>機器</b><b class='flag-5'>視覺</b>展

    3D封裝熱設(shè)計:挑戰(zhàn)與機遇并存

    隨著半導體技術(shù)的不斷發(fā)展,芯片封裝技術(shù)也在持續(xù)進步。目前,2D封裝和3D封裝是兩種主流的封裝技術(shù)。這兩種封裝技術(shù)在散熱路徑和熱設(shè)計方面有著各自的特點和挑戰(zhàn)。本文將深入探討2D封裝和3D
    的頭像 發(fā)表于 07-25 09:46 ?1442次閱讀
    <b class='flag-5'>3D</b>封裝熱設(shè)計:挑戰(zhàn)與機遇并存

    蘇州吳中區(qū)多色PCB板元器件3D視覺檢測技術(shù)

    3D視覺檢測相較于2D視覺檢測,有其獨特的優(yōu)勢,不受產(chǎn)品表面對比度影響,精確檢出產(chǎn)品形狀,可以測出高度(厚度)、體積、平整度等。在實際應用中可以與2
    的頭像 發(fā)表于 06-14 15:02 ?419次閱讀
    蘇州吳中區(qū)多色PCB板元器件<b class='flag-5'>3D</b><b class='flag-5'>視覺</b>檢測技術(shù)

    英倫科技的15.6寸2D-3D可切換光場裸眼3D顯示屏有哪些特點?

    隨著科技的快速發(fā)展,人類對于視覺體驗的追求也在不斷攀升。平面的2D圖像到立體的3D影像,我們一直在探索如何讓虛擬世界更加逼真。如今,英倫科技憑借其創(chuàng)新實力,推出了一款革命性的顯示設(shè)備
    的頭像 發(fā)表于 05-28 11:17 ?370次閱讀
    英倫科技的15.6寸<b class='flag-5'>2D-3D</b>可切換光場裸眼<b class='flag-5'>3D</b>顯示屏有哪些特點?

    英倫科技98寸3D顯示一體機可廣泛應用多個場景

    隨著科技的快速發(fā)展,人們對視覺體驗的追求也在不斷提升。2D3D,再到如今的裸眼3D技術(shù),顯示技術(shù)的進步正不斷突破我們的想象。今天,我們有
    的頭像 發(fā)表于 05-27 09:59 ?372次閱讀
    英倫科技98寸<b class='flag-5'>3D</b>顯示一體機可廣泛應用多個場景

    銀牛微電子引領(lǐng)3D空間計算芯片前沿技術(shù)

    在此次活動上,銀牛微電子有限責任公司的周凡博士指出,2D視覺已無法滿足日益復雜的系統(tǒng)需求,因此我們需要引入更多維度來輔助機器人和智能設(shè)備更好地理解并融入真實環(huán)境,即從2D
    的頭像 發(fā)表于 05-18 16:34 ?896次閱讀

    通過2D/3D異質(zhì)結(jié)構(gòu)精確控制鐵電材料弛豫時間

    受經(jīng)典德拜弛豫啟發(fā)的米勒模型提供了通過操縱弛豫時間來控制自發(fā)極化的理論框架。作者通過使用層轉(zhuǎn)移技術(shù)形成的2D/C-3D/2D異質(zhì)結(jié)構(gòu)克服了傳統(tǒng)異質(zhì)結(jié)存在的鐵電性惡化和能量損失的問題。
    的頭像 發(fā)表于 04-29 10:27 ?698次閱讀
    通過<b class='flag-5'>2D</b>/<b class='flag-5'>3D</b>異質(zhì)結(jié)構(gòu)精確控制鐵電材料弛豫時間

    有了2D NAND,為什么要升級到3D呢?

    2D NAND和3D NAND都是非易失性存儲技術(shù)(NVM Non-VolatileMemory),屬于Memory(存儲器)的一種。
    的頭像 發(fā)表于 03-17 15:31 ?1032次閱讀
    有了<b class='flag-5'>2D</b> NAND,為什么要升級到<b class='flag-5'>3D</b>呢?

    Nullmax提出多相機3D目標檢測新方法QAF2D

    今天上午,計算機視覺領(lǐng)域頂會CVPR公布了最終的論文接收結(jié)果,Nullmax感知部門的3D目標檢測研究《Enhancing 3D Object Detection with 2D De
    的頭像 發(fā)表于 02-27 16:38 ?1148次閱讀
    Nullmax提出多相機<b class='flag-5'>3D</b>目標檢測新方法QAF<b class='flag-5'>2D</b>

    高分工作!Uni3D3D基礎(chǔ)大模型,刷新多個SOTA!

    我們主要探索了3D視覺中scale up模型參數(shù)量和統(tǒng)一模型架構(gòu)的可能性。在NLP / 2D vision領(lǐng)域,scale up大模型(GPT-4,SAM,EVA等)已經(jīng)取得了很impressive
    的頭像 發(fā)表于 01-30 15:56 ?893次閱讀
    高分工作!Uni<b class='flag-5'>3D</b>:<b class='flag-5'>3D</b>基礎(chǔ)大模型,刷新多個SOTA!

    介紹一種使用2D材料進行3D集成的新方法

    美國賓夕法尼亞州立大學的研究人員展示了一種使用2D材料進行3D集成的新穎方法。
    的頭像 發(fā)表于 01-13 11:37 ?1075次閱讀

    一種用于2D/3D圖像處理算法的指令集架構(gòu)以及對應的算法部署方法

    二維(2D)和三維(3D)雙模視覺信息在自動駕駛、工業(yè)機器人、人機交互等前沿領(lǐng)域具有廣泛的應用前景。
    的頭像 發(fā)表于 01-05 10:35 ?465次閱讀
    一種用于<b class='flag-5'>2D</b>/<b class='flag-5'>3D</b>圖像處理算法的指令集架構(gòu)以及對應的算法部署方法