0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

如何實(shí)現(xiàn)遙感圖像等超大尺寸圖像快速識(shí)別

OpenCV學(xué)堂 ? 來源:OpenCV學(xué)堂 ? 作者:OpenCV學(xué)堂 ? 2022-07-14 09:47 ? 次閱讀

一般情況下,遙感目標(biāo)檢測(cè)中,遙感圖像的圖片尺寸都會(huì)很大,且圖像中元素極為復(fù)雜,近期開賽的亞馬遜科技AI For Good - 2022 遙感光學(xué)影像目標(biāo)檢測(cè)挑戰(zhàn)賽】也不例外,動(dòng)輒超過10000 x 10000的衛(wèi)星遙感圖像讓許多選手感到頭疼。同時(shí)遙感影像中目標(biāo)尺寸差別大、小而密集、角度各異也導(dǎo)致常見的CV框架難以實(shí)現(xiàn)快速精準(zhǔn)的目標(biāo)識(shí)別。所以,如何實(shí)現(xiàn)遙感圖像等超大尺寸圖像快速識(shí)別?

目前比較成熟的衛(wèi)星圖像識(shí)別算法并不少,但大多依托于強(qiáng)大的計(jì)算資源,為了用有限的計(jì)算資源實(shí)現(xiàn)大尺寸圖像識(shí)別,我們找到了一個(gè)可行的開源框架,給大尺寸圖像識(shí)別提供了不錯(cuò)的思路。

YOLT 是一個(gè)基于YOLO v2的衛(wèi)星圖像識(shí)別開源算法,核心思路是:

1. 通過圖片裁切和圖像網(wǎng)絡(luò)重構(gòu)解決圖像尺寸問題;

2. 通過“上采樣”提升小而聚集的目標(biāo)的檢測(cè)精度;

3. 通過將不同尺寸模型融合,提升整體檢測(cè)精度。

YOLT項(xiàng)目地址:GitHub - avanetten/yolt: You Only Look Twice: Rapid Multi-Scale Object Detection In Satellite Imagery

YOLO是經(jīng)典的圖像識(shí)別算法,YOLT在YOLO的基礎(chǔ)上針對(duì)衛(wèi)星圖像特有的問題提出了特定的解決思路。詳細(xì)思路參見論文「You Only Look Twice: Rapid Multi-Scale Object Detection In Satellite Imagery」(GitHub項(xiàng)目中附有論文鏈接)。

e58432fc-0310-11ed-ba43-dac502259ad0.png

▲左側(cè)為常見問題,右側(cè)為解決辦法

1. 針對(duì)物體尺寸不規(guī)則、方向多樣的問題,YOLT對(duì)衛(wèi)星圖像數(shù)據(jù)進(jìn)行尺寸變換與旋轉(zhuǎn)等數(shù)據(jù)增強(qiáng)的處理。

2. 針對(duì)目標(biāo)尺寸過小并聚集的問題,YOLT框架主要采用3種方式進(jìn)行處理:

(1) 修改圖像網(wǎng)絡(luò)結(jié)構(gòu),將YOLO v2框架中的stride由32改為16,有利于檢測(cè)出大小在32 x 32以下的目標(biāo)

(2) 對(duì)圖像進(jìn)行上采樣,完成圖片的“解壓縮”操作,即把原先的圖片放大,以便檢測(cè)小而密集的物體

(3) 將不同尺寸的檢測(cè)模型進(jìn)行融合,即Ensemble操作,由于不同目標(biāo)的尺寸差異可能較大,如海港與船只、機(jī)場(chǎng)與飛機(jī),Ensemble操作能夠提升大尺寸差異下的識(shí)別精度。

針對(duì)衛(wèi)星圖像尺寸過大的問題,YOLT采用切塊的方式,將原始圖像切割成小塊后輸入模型進(jìn)行訓(xùn)練,并結(jié)合2-(3)進(jìn)行模型融合。

e5b76f8c-0310-11ed-ba43-dac502259ad0.png

▲ YOLT的網(wǎng)絡(luò)結(jié)構(gòu),輸出特征尺寸多為26 x 26,可以提升檢測(cè)精度

應(yīng)用實(shí)例

從下面的檢測(cè)實(shí)例中,我們可以看到Y(jié)OLT是如何工作的:

首先,開發(fā)團(tuán)隊(duì)將一張衛(wèi)星圖片調(diào)整至416 x 416大?。ㄈ缟献螅?,發(fā)現(xiàn)無法檢測(cè)出車輛目標(biāo);而從原圖中切割出416 x 416的區(qū)域(稱其為Chips)則可以實(shí)現(xiàn)部分車輛目標(biāo)的檢測(cè)。

順著這個(gè)思路,開發(fā)團(tuán)隊(duì)采用劃窗方式將原始圖像切割為許多chips,并使相鄰chips之間有一定重合(如上圖),以確保圖像檢測(cè)的完整性。再利用NMS算法將重復(fù)檢測(cè)過濾,最后將各塊的檢測(cè)結(jié)果進(jìn)行融合,即可得出最后的結(jié)果。

▲ 檢測(cè)實(shí)例:采用YOLT v4識(shí)別機(jī)場(chǎng)中的飛機(jī)

YOLT的思路不止可以應(yīng)用于衛(wèi)星圖像識(shí)別,同樣可以在目標(biāo)尺寸小且密集的其他類圖像識(shí)別問題中發(fā)揮作用。

對(duì)本次亞馬遜【AI For Good - 2022 遙感光學(xué)影像目標(biāo)檢測(cè)挑戰(zhàn)賽】的選手而言,YOLT的解決思路能夠幫助大家越過圖片尺寸過大的第一道坎。

原文標(biāo)題:如何實(shí)現(xiàn)超大尺寸圖像快速識(shí)別

文章出處:【微信公眾號(hào):OpenCV學(xué)堂】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

審核編輯:彭靜
聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 衛(wèi)星
    +關(guān)注

    關(guān)注

    18

    文章

    1714

    瀏覽量

    67052
  • 模型
    +關(guān)注

    關(guān)注

    1

    文章

    3243

    瀏覽量

    48842
  • 遙感圖像
    +關(guān)注

    關(guān)注

    0

    文章

    40

    瀏覽量

    10128

原文標(biāo)題:如何實(shí)現(xiàn)超大尺寸圖像快速識(shí)別

文章出處:【微信號(hào):CVSCHOOL,微信公眾號(hào):OpenCV學(xué)堂】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏

    評(píng)論

    相關(guān)推薦

    基于FPGA+GPU異構(gòu)平臺(tái)的遙感圖像切片解決方案

    大型遙感圖像分割成圖像切片信息,以便更有效地處理和分析圖像數(shù)據(jù)。中科億海微自主研制的AI目標(biāo)識(shí)別加速卡,基于FPGA+GPU異構(gòu)并行計(jì)算處理
    的頭像 發(fā)表于 09-20 08:05 ?432次閱讀
    基于FPGA+GPU異構(gòu)平臺(tái)的<b class='flag-5'>遙感</b><b class='flag-5'>圖像</b>切片解決方案

    圖像識(shí)別算法有哪幾種

    圖像識(shí)別算法是計(jì)算機(jī)視覺領(lǐng)域的核心技術(shù)之一,它通過分析和處理圖像數(shù)據(jù),實(shí)現(xiàn)對(duì)圖像中的目標(biāo)、場(chǎng)景和物體的識(shí)別和分類。
    的頭像 發(fā)表于 07-16 11:22 ?1084次閱讀

    圖像檢測(cè)和圖像識(shí)別的原理、方法及應(yīng)用場(chǎng)景

    圖像檢測(cè)和圖像識(shí)別是計(jì)算機(jī)視覺領(lǐng)域的兩個(gè)重要概念,它們?cè)谠S多應(yīng)用場(chǎng)景中發(fā)揮著關(guān)鍵作用。 1. 定義 1.1 圖像檢測(cè) 圖像檢測(cè)(Object Detection)是指在
    的頭像 發(fā)表于 07-16 11:19 ?4194次閱讀

    圖像識(shí)別算法都有哪些方法

    圖像識(shí)別算法是計(jì)算機(jī)視覺領(lǐng)域的核心任務(wù)之一,它涉及到從圖像中提取特征并進(jìn)行分類、識(shí)別和分析的過程。隨著深度學(xué)習(xí)技術(shù)的不斷發(fā)展,圖像識(shí)別算法已經(jīng)取得了顯著的進(jìn)展。本文將介紹
    的頭像 發(fā)表于 07-16 11:14 ?5583次閱讀

    圖像識(shí)別算法的優(yōu)缺點(diǎn)有哪些

    圖像識(shí)別算法是一種利用計(jì)算機(jī)視覺技術(shù)對(duì)圖像進(jìn)行分析和理解的方法,它在許多領(lǐng)域都有廣泛的應(yīng)用,如自動(dòng)駕駛、醫(yī)療診斷、安全監(jiān)控。然而,圖像識(shí)別算法也存在一些優(yōu)缺點(diǎn)。 一、
    的頭像 發(fā)表于 07-16 11:09 ?1638次閱讀

    圖像識(shí)別算法的核心技術(shù)是什么

    中提取出有用的信息,為后續(xù)的分類和識(shí)別提供依據(jù)。特征提取的方法有很多,常見的有: 1.1 顏色特征:顏色是圖像最基本的屬性之一,常見的顏色特征有顏色直方圖、顏色矩。 1.2 紋理特征:紋理是
    的頭像 發(fā)表于 07-16 11:02 ?643次閱讀

    圖像識(shí)別技術(shù)包括自然語言處理嗎

    計(jì)算機(jī)視覺技術(shù)對(duì)圖像進(jìn)行處理、分析和理解,從而實(shí)現(xiàn)對(duì)圖像中的目標(biāo)、場(chǎng)景、行為信息的識(shí)別和理解。圖像識(shí)別
    的頭像 發(fā)表于 07-16 10:54 ?838次閱讀

    圖像識(shí)別技術(shù)的原理是什么

    圖像識(shí)別技術(shù)是一種利用計(jì)算機(jī)視覺和機(jī)器學(xué)習(xí)技術(shù)對(duì)圖像進(jìn)行分析和理解的技術(shù)。它可以幫助計(jì)算機(jī)識(shí)別和理解圖像中的對(duì)象、場(chǎng)景和活動(dòng)。 圖像預(yù)處理
    的頭像 發(fā)表于 07-16 10:46 ?1018次閱讀

    圖像識(shí)別屬于人工智能嗎

    的過程。它涉及到圖像的獲取、預(yù)處理、特征提取、分類和識(shí)別多個(gè)環(huán)節(jié)。 1.2 重要性 圖像識(shí)別技術(shù)在人工智能領(lǐng)域具有重要的地位,它使計(jì)算機(jī)能夠“看”和“理解”
    的頭像 發(fā)表于 07-16 10:44 ?1130次閱讀

    opencv圖像識(shí)別有什么算法

    圖像識(shí)別算法: 邊緣檢測(cè) :邊緣檢測(cè)是圖像識(shí)別中的基本步驟之一,用于識(shí)別圖像中的邊緣。常見的邊緣檢測(cè)算法有Canny邊緣檢測(cè)器、Sobel邊緣檢測(cè)器和Laplacian邊緣檢測(cè)器。 特
    的頭像 發(fā)表于 07-16 10:40 ?1048次閱讀

    如何利用CNN實(shí)現(xiàn)圖像識(shí)別

    卷積神經(jīng)網(wǎng)絡(luò)(CNN)是深度學(xué)習(xí)領(lǐng)域中一種特別適用于圖像識(shí)別任務(wù)的神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)。它通過模擬人類視覺系統(tǒng)的處理方式,利用卷積、池化操作,自動(dòng)提取圖像中的特征,進(jìn)而實(shí)現(xiàn)高效的
    的頭像 發(fā)表于 07-03 16:16 ?1385次閱讀

    圖像檢測(cè)與識(shí)別技術(shù)的關(guān)系

    檢測(cè)技術(shù)是指利用計(jì)算機(jī)視覺技術(shù),對(duì)圖像中的特定目標(biāo)進(jìn)行定位和識(shí)別的過程。它通常包括圖像預(yù)處理、特征提取、目標(biāo)檢測(cè)和后處理步驟。圖像檢測(cè)技術(shù)
    的頭像 發(fā)表于 07-03 14:43 ?650次閱讀

    圖像檢測(cè)和圖像識(shí)別的區(qū)別是什么

    詳細(xì)的比較和分析。 定義和概念 圖像檢測(cè)(Image Detection)是指利用計(jì)算機(jī)視覺技術(shù)對(duì)圖像中的特定目標(biāo)進(jìn)行定位和識(shí)別的過程。它通常包括目標(biāo)的檢測(cè)、分類和定位三個(gè)步驟。圖像
    的頭像 發(fā)表于 07-03 14:41 ?1009次閱讀

    圖像識(shí)別技術(shù)原理 圖像識(shí)別技術(shù)的應(yīng)用領(lǐng)域

    圖像識(shí)別技術(shù)是一種通過計(jì)算機(jī)對(duì)圖像進(jìn)行分析和理解的技術(shù)。它借助計(jì)算機(jī)視覺、模式識(shí)別、人工智能相關(guān)技術(shù),通過對(duì)圖像進(jìn)行特征提取和匹配,找出
    的頭像 發(fā)表于 02-02 11:01 ?2460次閱讀

    如何使用Python進(jìn)行圖像識(shí)別的自動(dòng)學(xué)習(xí)自動(dòng)訓(xùn)練?

    如何使用Python進(jìn)行圖像識(shí)別的自動(dòng)學(xué)習(xí)自動(dòng)訓(xùn)練? 使用Python進(jìn)行圖像識(shí)別的自動(dòng)學(xué)習(xí)和自動(dòng)訓(xùn)練需要掌握一些重要的概念和技術(shù)。在本文中,我們將介紹如何使用Python中的一些常用庫(kù)和算法來實(shí)現(xiàn)
    的頭像 發(fā)表于 01-12 16:06 ?593次閱讀