0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
电子发烧友
开通电子发烧友VIP会员 尊享10大特权
海量资料免费下载
精品直播免费看
优质内容免费畅学
课程9折专享价
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

如何10分鐘學(xué)會使用YOLO及Opencv實現(xiàn)目標檢測?

新機器視覺 ? 來源:snnu驛站 ? 作者:snnu驛站 ? 2020-11-19 14:26 ? 次閱讀

計算機視覺領(lǐng)域中,目標檢測一直是工業(yè)應(yīng)用上比較熱門且成熟的應(yīng)用領(lǐng)域,比如人臉識別、行人檢測等,國內(nèi)的曠視科技、商湯科技等公司在該領(lǐng)域占據(jù)行業(yè)領(lǐng)先地位。相對于圖像分類任務(wù)而言,目標檢測會更加復(fù)雜一些,不僅需要知道這是哪一類圖像,而且要知道圖像中所包含的內(nèi)容有什么及其在圖像中的位置,因此,其工業(yè)應(yīng)用比較廣泛。那么,今天將向讀者介紹該領(lǐng)域中表現(xiàn)優(yōu)異的一種算算法——“你只需要看一次”(you only look once,yolo),提出該算法的作者風(fēng)趣幽默可愛,其個人主頁及論文風(fēng)格顯示了其性情,目前該算法已是第三個版本,簡稱YoLo V3。

在本教程中,將學(xué)習(xí)如何使用YOLO、OpenCV和Python檢測圖像和視頻流中的對象。主要內(nèi)容有:

簡要討論YOLO算法;

使用YOLO、OpenCV、Python進行圖像檢測;

使用YOLO、OpenCV、Python進行視頻流檢測;

討論YOLO算法的優(yōu)點和缺點;

當涉及基于深度學(xué)習(xí)的對象檢測時,常用的三類算法有:

R-CNN家族系列算法:R-CNN、fast R-CNN以及faster R-CNN;

單發(fā)檢測器(SSD);

YOLO算法;
R-CNN算法是最早的基于深度學(xué)習(xí)的目標檢測器之一,其結(jié)構(gòu)是兩級網(wǎng)絡(luò);

首先需要諸如選擇性搜索之類的算法來提出可能包含對象的候選邊界框;然后將這些區(qū)域傳遞到CNN算法進行分類;R-CNN算法存在的問題在于其仿真很慢,并且不是完整的端到端的目標檢測器。Fast R-CNN算法對原始R-CNN進行了相當大的改進,即提高準確度并減少執(zhí)行正向傳遞所花費的時間,但是,該模型仍然依賴于外部區(qū)域搜索算法。直到2015年,faster R-CNN才成為真正的端到端深度學(xué)習(xí)目標檢測器,刪除了選擇性搜索的要求,而是依賴于(1)完全卷積的區(qū)域提議網(wǎng)絡(luò)(RPN)和(2)可以預(yù)測對象邊界框和“對象”分數(shù)(量化它是一個區(qū)域的可能性的分數(shù))。然后將RPN的輸出傳遞到R-CNN組件以進行最終分類和標記。R-CNN系列算法的檢測結(jié)果一般都非常準確,但R-CNN系列算法最大的問題在仿真速度——非常慢,即使是在GPU上也僅獲得5 FPS。為了提高基于深度學(xué)習(xí)的目標檢測器的速度,單次檢測器(SSD)和YOLO都使用單級檢測器策略(one stage)。這類算法將對象檢測視為回歸問題,獲取給定的輸入圖像并同時學(xué)習(xí)邊界框坐標和相應(yīng)的類標簽概率。通常,單級檢測器往往不如兩級檢測器準確,但其速度明顯更快。YOLO是單級檢測器中一個很好的算法。YOLO算法于2015年提出,在GPU上獲得了 45 FPS性能,此外,同時也提出了一個較小的變體稱為“Fast YOLO”,在GPU上達到155 FPS的性能。YOLO經(jīng)歷了許多次的迭代,包括YOLOv2,能夠檢測超過9,000個目標。直到最近提出的YOLOv3算法,YOLOv3模型比之前的版本要復(fù)雜得多,但它是YOLO系列目標檢測器中最好的一款。本文使用YOLOv3,并在COCO數(shù)據(jù)集上進行訓(xùn)練。COCO數(shù)據(jù)集由80個標簽組成,可以使用此鏈接找到Y(jié)OLO在COCO數(shù)據(jù)集上訓(xùn)練的內(nèi)容的完整列表。

1

項目結(jié)構(gòu)

$ tree.
├── images
│ ├── baggage_claim.jpg
│ ├── dining_table.jpg
│ ├── living_room.jpg
│ └── soccer.jpg
├── output
│ ├── airport_output.avi
│ ├── car_chase_01_output.avi
│ ├── car_chase_02_output.avi
│ └── overpass_output.avi
├── videos
│ ├── airport.mp4
│ ├── car_chase_01.mp4
│ ├── car_chase_02.mp4
│ └── overpass.mp4
├── yolo-coco
│ ├── coco.names
│ ├── yolov3.cfg
│ └── yolov3.weights
├── yolo.py
└── yolo_video.py

從上面可以看出,項目包括4個文件夾和2個Python腳本。
目錄(按重要性順序)是:

yolo - coco/:YOLOv3對象檢測器預(yù)先(在COCO數(shù)據(jù)集上)訓(xùn)練得到最終的權(quán)重文件,可以在Darknet團隊主頁找到對應(yīng)的文件;

images/:此文件夾包含四個靜態(tài)圖像,之后將執(zhí)行對象檢測以進行測試和評估;

videos/:使用YOLO對圖像進行目標檢測器后,將實時處理視頻。該文件夾中包含四個示例視頻可供測試;

輸出/:輸出已由YOLO處理并帶有邊界框和類名稱注釋的視頻可以放在此文件夾中;

此外還有兩個Python腳本——yolo.py和 yolo_video.py ,第一個腳本用于圖像處理,第二個腳本用于視頻處理。下面進入實戰(zhàn)內(nèi)容,你準備好了嗎?

2

將YOLO應(yīng)用于圖像對象檢測

YOLO算法并沒有應(yīng)用非最大值抑制,這里需要說明一下。應(yīng)用非最大值抑制可以抑制明顯重疊的邊界框,只保留最自信的邊界框,NMS還確保我們沒有任何冗余或無關(guān)的邊界框。

利用OpenCV內(nèi)置的NMS DNN模塊實現(xiàn)即可實現(xiàn)非最大值抑制,所需要的參數(shù)是邊界框、置信度、以及置信度閾值和NMS閾值。

假設(shè)存在至少一個檢測結(jié)果,就循環(huán)用非最大值抑制確定idx 。然后,我們使用隨機類顏色在圖像上繪制邊界框和文本。最后,顯示結(jié)果圖像,直到用戶按下鍵盤上的任意鍵。
下面進入測試環(huán)節(jié),打開一個終端并執(zhí)行以下命令:

$python yolo.py --imageimages/baggage_claim.jpg --yolo yolo-coco

[INFO] loading YOLO from disk...
[INFO] YOLO took 0.347815 seconds

3

視頻檢測解決

那么在學(xué)會檢測單張圖像后,我們也可以利用YOLO算法實現(xiàn)視頻流中的目標檢測。

同樣,首先從導(dǎo)入相關(guān)數(shù)據(jù)包和命令行參數(shù)開始。與之前不同的是,此腳本沒有-- image參數(shù),取而代之的是量個視頻路徑:

-- input :輸入視頻文件的路徑;

-- output :輸出視頻文件的路徑;

視頻的輸入可以是手機拍攝的短視頻或者是網(wǎng)上搜索到的視頻。另外,也可以通過將多張照片合成為一個短視頻也可以。本博客使用的是在PyImageSearch上找到來自imutils的VideoStream類的示例。
代碼與處理圖形時候相同:

YOLO目標檢測器的最大限制和缺點是:

它并不總能很好地處理小物體;

它尤其不適合處理密集的對象;

限制的原因是由于YOLO算法其本身:

YOLO對象檢測器將輸入圖像劃分為SxS網(wǎng)格,其中網(wǎng)格中的每個單元格僅預(yù)測單個對象;

如果單個單元格中存在多個小對象,則YOLO將無法檢測到它們,最終導(dǎo)致錯過對象檢測;

因此,如果你的數(shù)據(jù)集是由許多靠近在一起的小對象組成時,那么就不應(yīng)該使用YOLO算法。就小物體而言,更快的R-CNN往往效果最好,但是其速度也最慢。在這里也可以使用SSD算法, SSD通常在速度和準確性方面也有很好的權(quán)衡。
值得注意的是,在本教程中,YOLO比SSD運行速度慢,大約慢一個數(shù)量級。因此,如果你正在使用預(yù)先訓(xùn)練的深度學(xué)習(xí)對象檢測器供OpenCV使用,可能需要考慮使用SSD算法而不是YOLO算法。
因此,在針對給定問題選擇對象檢測器時,我傾向于使用以下準則:

如果知道需要檢測的是小物體并且速度方面不作求,我傾向于使用faster R-CNN算法;

如果速度是最重要的,我傾向于使用YOLO算法;

如果需要一個平衡的表現(xiàn),我傾向于使用SSD算法;

原文標題:10分鐘學(xué)會使用YOLO及Opencv實現(xiàn)目標檢測

文章出處:【微信公眾號:新機器視覺】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

責任編輯:haq

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 機器視覺
    +關(guān)注

    關(guān)注

    162

    文章

    4405

    瀏覽量

    120624
  • 人臉識別
    +關(guān)注

    關(guān)注

    76

    文章

    4015

    瀏覽量

    82232

原文標題:10分鐘學(xué)會使用YOLO及Opencv實現(xiàn)目標檢測

文章出處:【微信號:vision263com,微信公眾號:新機器視覺】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 0人收藏

    評論

    相關(guān)推薦

    助力AIoT應(yīng)用:在米爾FPGA開發(fā)板上實現(xiàn)Tiny YOLO V4

    Only Look Once)是一種實時物體檢測模型,它通過一次性掃描整個圖像,實現(xiàn)高效的對象識別。而其簡化版 Tiny YOLO V4 更適合嵌入式設(shè)備,具有較少的層數(shù)和參數(shù)。其輕量化特性更適合在資源
    發(fā)表于 12-06 17:18

    YOLOv10自定義目標檢測之理論+實踐

    保持先進性能的同時,降低了計算需求。大量實驗表明,YOLOv10 在各種模型規(guī)模上提供了更優(yōu)的準確率-延遲權(quán)衡。 正如讀過我之前文章的朋友所知道的,我分享了使用 YOLO 模型的各種項目,因為在預(yù)訓(xùn)練模型中,YOLO 模型在性能
    的頭像 發(fā)表于 11-16 10:23 ?699次閱讀
    YOLOv<b class='flag-5'>10</b>自定義<b class='flag-5'>目標</b><b class='flag-5'>檢測</b>之理論+實踐

    如何用OpenCV的相機捕捉視頻進行人臉檢測--基于米爾NXP i.MX93開發(fā)板

    : breakvideo.release()cv2.destroyAllWindows() 保存后執(zhí)行”python3 opencv_test.py OpenCV裝好后,可以為后面的人臉檢測提供可行性。 要
    發(fā)表于 11-15 17:58

    《DNK210使用指南 -CanMV版 V1.0》第四十一章 YOLO2物體檢測實驗

    第四十一章 YOLO2物體檢測實驗 在上一章節(jié)中,介紹了利用maix.KPU模塊實現(xiàn)YOLO2的人手檢測,本章將繼續(xù)介紹利用maix.KPU
    發(fā)表于 11-14 09:22

    《DNK210使用指南 -CanMV版 V1.0》第四十章 YOLO2人手檢測實驗

    第四十章 YOLO2人手檢測實驗 在上一章節(jié)中,介紹了利用maix.KPU模塊實現(xiàn)YOLO2的人臉檢測,本章將繼續(xù)介紹利用maix.KPU模
    發(fā)表于 11-14 09:20

    YOLOv10:引領(lǐng)無NMS實時目標檢測的新紀元

    。 YOLO(You Only Look Once)系列一直是實時目標檢測的基準,成功平衡了計算成本和檢測性能。盡管在架構(gòu)設(shè)計和優(yōu)化策略方面取得了進展,但對非最大值抑制(NMS)
    的頭像 發(fā)表于 11-13 17:12 ?987次閱讀
    YOLOv<b class='flag-5'>10</b>:引領(lǐng)無NMS實時<b class='flag-5'>目標</b><b class='flag-5'>檢測</b>的新紀元

    《DNK210使用指南 -CanMV版 V1.0》第三十九章 YOLO2人臉檢測實驗

    第三十九章 YOLO2人臉檢測實驗 從本章開始,將通過幾個實例介紹Kendryte K210上的KPU,以及CanMV下KPU的使用方法,本章將先介紹YOLO2網(wǎng)絡(luò)的人臉檢測應(yīng)用在Ca
    發(fā)表于 11-13 09:37

    使用OpenVINO C# API部署YOLO-World實現(xiàn)實時開放詞匯對象檢測

    YOLO-World是一個融合了實時目標檢測與增強現(xiàn)實(AR)技術(shù)的創(chuàng)新平臺,旨在將現(xiàn)實世界與數(shù)字世界無縫對接。該平臺以YOLO(You Only Look Once)算法為核心,
    的頭像 發(fā)表于 08-30 16:27 ?832次閱讀
    使用OpenVINO C# API部署<b class='flag-5'>YOLO</b>-World<b class='flag-5'>實現(xiàn)</b>實時開放詞匯對象<b class='flag-5'>檢測</b>

    慧視小目標識別算法 解決目標檢測中的老大難問題

    隨著深度學(xué)習(xí)和人工智能技術(shù)的興起與技術(shù)成熟,一大批如FasterR-CNN、RetinaNet、YOLO等可以在工業(yè)界使用的目標檢測算法已逐步成熟并進入實際應(yīng)用,大多數(shù)場景下的目標
    的頭像 發(fā)表于 07-17 08:29 ?565次閱讀
    慧視小<b class='flag-5'>目標</b>識別算法   解決<b class='flag-5'>目標</b><b class='flag-5'>檢測</b>中的老大難問題

    opencv的主要功能有哪些

    OpenCV提供了豐富的圖像處理功能,包括圖像的讀取、顯示、保存、轉(zhuǎn)換等。此外,OpenCV還支持圖像的濾波、邊緣檢測、形態(tài)學(xué)操作、圖像金字塔等高級圖像處理技術(shù)。 特征檢測與描述:
    的頭像 發(fā)表于 07-16 10:35 ?1727次閱讀

    用OpenVINO C# API在intel平臺部署YOLOv10目標檢測模型

    的模型設(shè)計策略,從效率和精度兩個角度對YOLOs的各個組成部分進行了全面優(yōu)化,大大降低了計算開銷,增強了性能。在本文中,我們將結(jié)合OpenVINO C# API使用最新發(fā)布的OpenVINO 2024.1部署YOLOv10目標檢測
    的頭像 發(fā)表于 06-21 09:23 ?1125次閱讀
    用OpenVINO C# API在intel平臺部署YOLOv<b class='flag-5'>10</b><b class='flag-5'>目標</b><b class='flag-5'>檢測</b>模型

    嵐圖發(fā)布“琥珀電池”,續(xù)航達900km,10分鐘充電即可滿足450km續(xù)航?

    琥珀電池基于800V平臺研發(fā),具備5C超快速充電性能,能實現(xiàn)10分鐘內(nèi)為車輛補充450公里續(xù)航里程。此外,該電池在-10℃至40℃的寬泛溫度范圍內(nèi)均能正常工作。
    的頭像 發(fā)表于 04-24 17:38 ?1445次閱讀

    OpenVINO? C# API部署YOLOv9目標檢測和實例分割模型

    YOLOv9模型是YOLO系列實時目標檢測算法中的最新版本,代表著該系列在準確性、速度和效率方面的又一次重大飛躍。
    的頭像 發(fā)表于 04-03 17:35 ?967次閱讀
    OpenVINO? C# API部署YOLOv9<b class='flag-5'>目標</b><b class='flag-5'>檢測</b>和實例分割模型

    縱觀全局:YOLO助力實時物體檢測原理及代碼

    YOLO 流程的最后一步是將邊界框預(yù)測與類別概率相結(jié)合,以提供完整的檢測輸出。每個邊界框的置信度分數(shù)由類別概率調(diào)整,確保檢測既反映邊界框的準確性,又反映模型對對象類別的置信度。
    的頭像 發(fā)表于 03-30 14:43 ?2583次閱讀

    基于OpenCV DNN實現(xiàn)YOLOv8的模型部署與推理演示

    基于OpenCV DNN實現(xiàn)YOLOv8推理的好處就是一套代碼就可以部署在Windows10系統(tǒng)、烏班圖系統(tǒng)、Jetson的Jetpack系統(tǒng)
    的頭像 發(fā)表于 03-01 15:52 ?1851次閱讀
    基于<b class='flag-5'>OpenCV</b> DNN<b class='flag-5'>實現(xiàn)</b>YOLOv8的模型部署與推理演示

    電子發(fā)燒友

    中國電子工程師最喜歡的網(wǎng)站

    • 2931785位工程師會員交流學(xué)習(xí)
    • 獲取您個性化的科技前沿技術(shù)信息
    • 參加活動獲取豐厚的禮品