0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

OpenCV中支持的非分類與檢測(cè)視覺(jué)模型

OpenCV學(xué)堂 ? 來(lái)源:OpenCV學(xué)堂 ? 作者:OpenCV學(xué)堂 ? 2022-08-19 09:10 ? 次閱讀

引言 ·

前面給大家分別匯總了OpenCV中支持的圖像分類與對(duì)象檢測(cè)模型,視覺(jué)視覺(jué)任務(wù)除了分類與檢測(cè)還有很多其他任務(wù),這里我們就來(lái)OpenCV中支持的非分類與檢測(cè)的視覺(jué)模型匯總一下。注意一點(diǎn),匯總支持的模型都是OpenCV4.4 Github上已經(jīng)提供的,事實(shí)上除了官方的提供的模型,讀者還可以自己探索更多非官方模型支持。這里的匯總模型主要來(lái)自O(shè)penCV社區(qū)官方測(cè)試過(guò)的。

語(yǔ)義分割網(wǎng)絡(luò)

OpenCV4 DNN支持的語(yǔ)義分割網(wǎng)絡(luò)FCN與ENet、ResNet101_DUC_HDC等三個(gè)語(yǔ)義分割模型。

FCN

其中FCN主要是基于VGG16~VGG19作為基礎(chǔ)網(wǎng)絡(luò),速度很慢,該網(wǎng)絡(luò)是在2015年時(shí)候提出,是早期很典型的圖像語(yǔ)義分割網(wǎng)絡(luò),不是一個(gè)對(duì)稱的卷積反卷積分割網(wǎng)絡(luò),在編碼階段網(wǎng)絡(luò)過(guò)長(zhǎng),解碼網(wǎng)絡(luò)很少,結(jié)果堪憂!網(wǎng)絡(luò)結(jié)構(gòu)如下:

c95bf7f8-1f09-11ed-ba43-dac502259ad0.png

c97b257e-1f09-11ed-ba43-dac502259ad0.png

分別支持不同分辨率的上采樣。

ENet

ENet是一種實(shí)時(shí)語(yǔ)義分割網(wǎng)絡(luò),在2016年提出的,關(guān)于ENet語(yǔ)義分割網(wǎng)絡(luò),我其實(shí)之前寫過(guò)一篇文章,詳細(xì)介紹過(guò),這里就不再啰嗦了,直接看這個(gè)鏈接即可:

詳解ENet | CPU可以實(shí)時(shí)的道路分割網(wǎng)絡(luò)

論文下載地址:

https://arxiv.org/pdf/1606.02147.pdf

ResNet101_DUC_HDC

該模型在編碼網(wǎng)絡(luò)中基于殘差網(wǎng)絡(luò)與混合空洞卷積(HDC-Hybrid Dilated Convolution),在解碼階段采用密集上采樣卷積(DUC-Dense Upsampling Convolution),最終實(shí)現(xiàn)了像素級(jí)別的圖像語(yǔ)義分割網(wǎng)絡(luò)。網(wǎng)絡(luò)模型結(jié)構(gòu)如下:

c9bc0e90-1f09-11ed-ba43-dac502259ad0.png

該論文在2017發(fā)表,論文地址如下:

https://arxiv.org/pdf/1702.08502.pdf

姿態(tài)評(píng)估

OpenCV DNN支持的姿態(tài)評(píng)估是基于OpenPose網(wǎng)絡(luò)實(shí)現(xiàn)的身體與手部姿態(tài)評(píng)估,OpenPose是一個(gè)開源的姿態(tài)評(píng)估項(xiàng)目支持2D與3D模型的姿態(tài)評(píng)估,提供了C++/Python的API調(diào)用接口。模型可以從它github地址獲得

https://github.com/CMU-Perceptual-Computing-Lab/openpose

相關(guān)的模型主要來(lái)自它們的系列論文, 姿態(tài)評(píng)估的基本原理與流程如下:

c9cd63f2-1f09-11ed-ba43-dac502259ad0.png

c9dd5f82-1f09-11ed-ba43-dac502259ad0.png

完整的姿態(tài)評(píng)估流程入上圖,首先預(yù)測(cè)熱圖與PAF,然后進(jìn)行匹配與解析,最終得到輸出的姿態(tài)評(píng)估結(jié)果。相關(guān)的論文地址如下

https://arxiv.org/pdf/1812.08008v2.pdfhttps://arxiv.org/pdf/1611.08050.pdf

圖像處理

OpenCV中圖像處理網(wǎng)絡(luò)支持圖像色彩遷移、圖像風(fēng)格遷移、邊緣檢測(cè)。

色彩遷移:

其中灰度圖像轉(zhuǎn)換彩色圖像的模型結(jié)構(gòu)如下:

c9fa8ada-1f09-11ed-ba43-dac502259ad0.png

其中有個(gè)重要的輸入特征點(diǎn)是要把RGB彩色圖像轉(zhuǎn)換為L(zhǎng)AB通道圖像,然后對(duì)AB輸入,最后結(jié)果重新加上L分量。代碼在這里

http://richzhang.github.io/colorization/

風(fēng)格遷移

風(fēng)格遷移網(wǎng)絡(luò)主要是來(lái)自于2016李飛飛等提出感知損失的圖像風(fēng)格遷移與超分辨率論文實(shí)現(xiàn)的,網(wǎng)絡(luò)結(jié)構(gòu)如下:

ca265912-1f09-11ed-ba43-dac502259ad0.png

github地址如下:

https://github.com/jcjohnson/fast-neural-style

邊緣檢測(cè)

OpenCV中傳統(tǒng)的圖像邊緣檢測(cè)算法Canny,現(xiàn)在OpenCV支持基于深度學(xué)習(xí)的邊緣檢測(cè)算法HED,它與Canny算法的邊緣提取效果對(duì)比如下:

ca4e0f02-1f09-11ed-ba43-dac502259ad0.png

該論文是在2015年提出的,模型結(jié)構(gòu)如下:

ca6403b6-1f09-11ed-ba43-dac502259ad0.png

作者選擇了VGGNet作為特征提取與基礎(chǔ)網(wǎng)絡(luò)。

論文地址:

https://arxiv.org/pdf/1504.06375.pdf

人臉識(shí)別

人臉識(shí)別來(lái)自O(shè)penFace,OpenFace是一種典型的移動(dòng)端實(shí)時(shí)的人臉識(shí)別模型,跟它相似的還有LightCNN模型。OpenFace是基于facenet的Inception網(wǎng)絡(luò)作為backbone網(wǎng)絡(luò)訓(xùn)練生存的torch網(wǎng)絡(luò)模型,然后基于SVM實(shí)現(xiàn)了分類推理,完整的OpenFace項(xiàng)目結(jié)構(gòu)如下:

ca78d03e-1f09-11ed-ba43-dac502259ad0.png

其中預(yù)處理階段的人臉對(duì)齊示意圖如下:

caa247e8-1f09-11ed-ba43-dac502259ad0.png

關(guān)于FaceNet的人臉識(shí)別論文

https://arxiv.org/pdf/1503.03832.pdf

OpenCV DNN支持的8位的量化之后的人臉識(shí)別模型,最終輸出的向量是128維的,模型下載可以從Github地址:

https://github.com/cmusatyalab/openface

場(chǎng)景文字檢測(cè)

場(chǎng)景文字檢測(cè)來(lái)自2017年曠視科技提出的EAST場(chǎng)景文字檢測(cè)模型,相關(guān)的模型結(jié)構(gòu)如下:

cacdf406-1f09-11ed-ba43-dac502259ad0.png

最終輸出的文本區(qū)域解析后處理如下:

cadb25ea-1f09-11ed-ba43-dac502259ad0.png

最常見的是解析位RBOX,即帶角度的旋轉(zhuǎn)矩形(最小外接矩形)。

最后總結(jié)一下,上述網(wǎng)絡(luò)均支持在OpenCV4.4版本上直接推理運(yùn)行,或者自定義數(shù)據(jù)學(xué)習(xí)之后的在OpenCV4 DNN部署,推理調(diào)用。

審核編輯:彭靜
聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 編碼
    +關(guān)注

    關(guān)注

    6

    文章

    942

    瀏覽量

    54829
  • 視覺(jué)模型
    +關(guān)注

    關(guān)注

    0

    文章

    7

    瀏覽量

    6912
  • OpenCV
    +關(guān)注

    關(guān)注

    31

    文章

    635

    瀏覽量

    41350

原文標(biāo)題:匯總 | OpenCV4中的非典型深度學(xué)習(xí)模型

文章出處:【微信號(hào):CVSCHOOL,微信公眾號(hào):OpenCV學(xué)堂】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏

    評(píng)論

    相關(guān)推薦

    AI模型部署邊緣設(shè)備的奇妙之旅:目標(biāo)檢測(cè)模型

    ,目標(biāo)物體周圍復(fù)雜的背景信息可能會(huì)干擾分類結(jié)果,使得分類器難以專注于真正重要的區(qū)域。 在深入探討了圖像分類任務(wù)及其面臨的挑戰(zhàn)之后,我們現(xiàn)在將目光轉(zhuǎn)向一個(gè)更為復(fù)雜的計(jì)算機(jī)視覺(jué)問(wèn)題——目標(biāo)
    發(fā)表于 12-19 14:33

    AI模型部署邊緣設(shè)備的奇妙之旅:如何在邊緣端部署OpenCV

    識(shí)別、分類、跟蹤、場(chǎng)景重建等。這可能涉及到機(jī)器學(xué)習(xí)和深度學(xué)習(xí)模型的應(yīng)用。 簡(jiǎn)而言之,圖像處理是計(jì)算機(jī)視覺(jué)的基礎(chǔ),提供了必要的工具和技術(shù)來(lái)預(yù)處理和優(yōu)化圖像數(shù)據(jù);而計(jì)算機(jī)視覺(jué)則是在此基礎(chǔ)之
    發(fā)表于 12-14 09:31

    【AI實(shí)戰(zhàn)項(xiàng)目】基于OpenCV的“顏色識(shí)別項(xiàng)目”完整操作過(guò)程

    適用于哪些場(chǎng)景,然后通過(guò)Python編寫代碼來(lái)實(shí)現(xiàn)這些算法,并應(yīng)用于實(shí)際項(xiàng)目中,實(shí)現(xiàn)圖像的檢測(cè)、識(shí)別、分類、定位、測(cè)量等目標(biāo)。華清遠(yuǎn)見【python+OpenCV
    的頭像 發(fā)表于 12-09 16:42 ?314次閱讀
    【AI實(shí)戰(zhàn)項(xiàng)目】基于<b class='flag-5'>OpenCV</b>的“顏色識(shí)別項(xiàng)目”完整操作過(guò)程

    如何用OpenCV的相機(jī)捕捉視頻進(jìn)行人臉檢測(cè)--基于米爾NXP i.MX93開發(fā)板

    的是Haar特征人臉檢測(cè),此外OpenCV中還集成了深度學(xué)習(xí)方法來(lái)實(shí)現(xiàn)人臉檢測(cè)。 【參考資料】 使用OpenCV工具包成功實(shí)現(xiàn)人臉檢測(cè)與人
    發(fā)表于 11-15 17:58

    超聲應(yīng)用中支持多個(gè)AFE高輸出電流的精密求和電路

    電子發(fā)燒友網(wǎng)站提供《超聲應(yīng)用中支持多個(gè)AFE高輸出電流的精密求和電路.pdf》資料免費(fèi)下載
    發(fā)表于 10-25 09:21 ?0次下載
    超聲應(yīng)用<b class='flag-5'>中支持</b>多個(gè)AFE高輸出電流的精密求和電路

    視覺(jué)檢測(cè)是什么意思?機(jī)器視覺(jué)檢測(cè)的適用行業(yè)及場(chǎng)景有哪些?

    在快速迭代的工業(yè)世界中,機(jī)器視覺(jué)檢測(cè)以其精準(zhǔn)、高效的力量,已成為眾多產(chǎn)業(yè)不可或缺的技術(shù)支持。本文將深入探討機(jī)器視覺(jué)檢測(cè)的含義、應(yīng)用行業(yè)及具體
    的頭像 發(fā)表于 08-30 11:20 ?370次閱讀

    opencv圖像識(shí)別有什么算法

    OpenCV(Open Source Computer Vision Library)是一個(gè)開源的計(jì)算機(jī)視覺(jué)和機(jī)器學(xué)習(xí)軟件庫(kù),提供了大量的圖像處理和計(jì)算機(jī)視覺(jué)相關(guān)的算法。以下是一些常見的Ope
    的頭像 發(fā)表于 07-16 10:40 ?1045次閱讀

    opencv-python和opencv一樣嗎

    不一樣。OpenCV(Open Source Computer Vision Library)是一個(gè)開源的計(jì)算機(jī)視覺(jué)和機(jī)器學(xué)習(xí)軟件庫(kù),它提供了大量的圖像和視頻處理功能。OpenCV
    的頭像 發(fā)表于 07-16 10:38 ?1195次閱讀

    opencv的主要功能有哪些

    OpenCV提供了豐富的圖像處理功能,包括圖像的讀取、顯示、保存、轉(zhuǎn)換等。此外,OpenCV支持圖像的濾波、邊緣檢測(cè)、形態(tài)學(xué)操作、圖像金字塔等高級(jí)圖像處理技術(shù)。 特征
    的頭像 發(fā)表于 07-16 10:35 ?1547次閱讀

    什么是機(jī)器視覺(jué)opencv?它有哪些優(yōu)勢(shì)?

    機(jī)器視覺(jué)(Machine Vision)是一種利用計(jì)算機(jī)和圖像處理技術(shù)來(lái)模擬人類視覺(jué)系統(tǒng)的功能,實(shí)現(xiàn)對(duì)圖像的識(shí)別、分析和理解的技術(shù)。OpenCV(Open Source Computer
    的頭像 發(fā)表于 07-16 10:33 ?781次閱讀

    人臉檢測(cè)模型的精確度怎么算

    檢測(cè)是計(jì)算機(jī)視覺(jué)領(lǐng)域的一個(gè)重要研究方向,其目的是在圖像或視頻中快速準(zhǔn)確地定位人臉的位置。人臉檢測(cè)模型通常包括兩個(gè)主要步驟:人臉候選區(qū)域的生成和人臉的
    的頭像 發(fā)表于 07-04 09:14 ?524次閱讀

    人臉檢測(cè)模型有哪些

    人臉檢測(cè)是計(jì)算機(jī)視覺(jué)領(lǐng)域的一個(gè)重要研究方向,它涉及到從圖像或視頻中檢測(cè)出人臉的位置和大小。隨著深度學(xué)習(xí)技術(shù)的發(fā)展,人臉檢測(cè)模型的性能得到了顯
    的頭像 發(fā)表于 07-03 17:05 ?1038次閱讀

    AIDI工業(yè)AI視覺(jué)檢測(cè)軟件介紹

    AIDI是一款基于深度學(xué)習(xí)的智能工業(yè)視覺(jué)平臺(tái)應(yīng)用于多種工業(yè)應(yīng)用場(chǎng)景,有效解決復(fù)雜缺陷的定位識(shí)別、分類定級(jí)及字符識(shí)別等問(wèn)題,具有強(qiáng)大的兼容性。AIDI 內(nèi)置多種應(yīng)用模塊,無(wú)需編程,幫助用戶快速構(gòu)建和迭代模型,滿足不同業(yè)務(wù)場(chǎng)景下的差
    發(fā)表于 03-25 21:52

    視覺(jué)檢測(cè)設(shè)備的分類

    、質(zhì)量控制、醫(yī)療影像、安防監(jiān)控、無(wú)人駕駛等。視覺(jué)檢測(cè)設(shè)備的主要功能包括圖像采集、圖像處理、目標(biāo)檢測(cè)、特征提取、分類識(shí)別、缺陷檢測(cè)、測(cè)量計(jì)量等
    的頭像 發(fā)表于 02-21 09:41 ?1383次閱讀
    <b class='flag-5'>視覺(jué)</b><b class='flag-5'>檢測(cè)</b>設(shè)備的<b class='flag-5'>分類</b>

    itop-RK3588開發(fā)板機(jī)器視覺(jué)開發(fā)OpenCV-Python的安裝

    itop-RK3588開發(fā)板機(jī)器視覺(jué)開發(fā)OpenCV-Python的安裝
    的頭像 發(fā)表于 01-26 15:18 ?4188次閱讀
    itop-RK3588開發(fā)板機(jī)器<b class='flag-5'>視覺(jué)</b>開發(fā)<b class='flag-5'>OpenCV</b>-Python的安裝