0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

深度學(xué)習(xí)下的分類,目標(biāo)檢測、語義分割這三個方向具體的概念及其應(yīng)用場景是什么?

電子工程師 ? 來源:lq ? 2019-05-08 11:44 ? 次閱讀

隨著Halcon新版本的更新,截止2019年5月1號。Halcon的最新版本為halcon18.11.這次新版本最大的更新在于完整的加入了深度學(xué)習(xí)在視覺應(yīng)用的三個重要部分,即目標(biāo)分類分類、目標(biāo)檢測、語義分割這三個內(nèi)容。與此同時超人視覺即將向大家簡介Halcon軟件這三個方向的應(yīng)用示例,幫助大家進(jìn)一步認(rèn)識到機(jī)器視覺的魅力與當(dāng)前的機(jī)器視覺技術(shù)的應(yīng)用前沿。

在開始內(nèi)容前我們先明確一下前面提到的三個重要概念即深度學(xué)習(xí)下的分類,目標(biāo)檢測、語義分割這三個方向具體的概念及其應(yīng)用場景是什么?幫助大家理解其技術(shù)的產(chǎn)生背景以及形成自己的理解。

1圖像分類

圖像分類這一類問題常用與區(qū)分不同的物品,圖像分類,顧名思義,是一個輸入圖像,輸出對該圖像內(nèi)容分類的描述的問題。它是視覺方向的其中一個核心,實(shí)際應(yīng)用廣泛。許多同學(xué)在學(xué)習(xí)計算機(jī)視覺中有一個練習(xí)題是練習(xí)如何區(qū)分貓狗如圖1所示:

我們觀察一下這些圖片的特點(diǎn),這些圖片各種各樣,分辨率也各不相同。圖片中的貓和狗形狀、所處位置、體表顏色各不一樣。它們的姿態(tài)不同,有的在坐著而有的則不是,它們的情緒可能是開心的也可能是傷心的,貓可能在睡覺,而狗可能在汪汪地叫著。照片可能以任一焦距從任意角度拍下。

總而言之這些圖片有著無限種可能,對于我們?nèi)祟悂碚f在一系列不同種類的照片中識別出一個場景中的寵物自然是毫不費(fèi)力的事情,然而這對于一臺機(jī)器來說可不是一件小事。實(shí)際上,如果要機(jī)器實(shí)現(xiàn)自動分類,那么我們需要知道如何強(qiáng)有力地描繪出貓和狗的特征,也就是說為什么我們認(rèn)為這張圖片中的是貓,而那張圖片中的卻是狗。這個需要描繪每個動物的內(nèi)在特征。

1.在傳統(tǒng)的分類方法下圖像分類是特征描述及檢測,這類傳統(tǒng)方法可能對于一些簡單的圖像分類是有效的,但由于實(shí)際情況非常復(fù)雜,傳統(tǒng)的分類方法不堪重負(fù)。深度學(xué)習(xí)下的神經(jīng)網(wǎng)絡(luò)在圖像分類任務(wù)上效果很好的原因是,它們有著能夠自動學(xué)習(xí)多重抽象層的能力,神經(jīng)網(wǎng)絡(luò)可以識別極端變化的模式,在扭曲的圖像和經(jīng)過簡單的幾何變換的圖像上也有著很好的魯棒性。

2目標(biāo)檢測

圖像分類是將圖像劃分為單個類別,通常對應(yīng)于圖像中最突出的物體。但是現(xiàn)實(shí)世界的很多圖片通常包含不只一個物體,此時如果使用圖像分類模型為圖像分配一個單一標(biāo)簽其實(shí)是非常粗糙的,并不準(zhǔn)確。對于這樣的情況,就需要目標(biāo)檢測模型,目標(biāo)檢測模型可以識別一張圖片的多個物體,并可以定位出不同物體并且給出邊界框。目標(biāo)檢測在很多場景有用,如無人駕駛和安防系統(tǒng)。

傳統(tǒng)的目標(biāo)檢測的算法多用模板匹配完成,但是模板匹配針對復(fù)雜場景下下的識別并不良好,特別是在光照情況不穩(wěn)定物體有遮擋的情況下算法的魯棒性如何確保一直是傳統(tǒng)視覺算法的一個難題。

由上圖所示,我們可以總結(jié)出來目標(biāo)檢測要解決的核心問題是:1)目標(biāo)可能出現(xiàn)在圖像的任何位置,2)目標(biāo)有各種不同的大小,3)目標(biāo)可能有各種不同的形狀。深度學(xué)習(xí)在這方面的處理已經(jīng)部分超越了傳統(tǒng)算法的上限,目前較為先進(jìn)的深度卷積神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu),通過其具有局部連接權(quán),值共享及池化操作等功能,有效降低了網(wǎng)絡(luò)的復(fù)雜度,減少了訓(xùn)練參數(shù)的數(shù)目。使模型對于平移、扭曲、縮放具有一定程度不變性并具有較強(qiáng)的魯棒性和容錯能力,且易于訓(xùn)練與優(yōu)化的網(wǎng)絡(luò)結(jié)構(gòu)。

3.語義分割

語義分割方法在處理圖像時,具體到像素級別,也就是說,該方法會將圖像中每個像素分配到某個對象類別。語義分割是一種典型的計算機(jī)視覺問題,其涉及將一些原始數(shù)據(jù)(例如,平面圖像)作為輸入并將它們轉(zhuǎn)換為具有突出顯示的感興趣區(qū)域的掩模。

許多人使用術(shù)語全像素語義分割,其中圖像中的每個像素根據(jù)其所屬的感興趣對象被分配類別ID。 早期的計算機(jī)視覺問題只發(fā)現(xiàn)邊緣(線條和曲線)或漸變等元素,但它們從未完全按照人類感知的方式提供像素級別的圖像理解。語義分割將屬于同一目標(biāo)的圖像部分聚集在一起來解決這個問題,從而擴(kuò)展了其應(yīng)用領(lǐng)域。如圖所示。

語義分割問題也可以被認(rèn)為是分類問題,其中每個像素被分類為來自一系列對象類中的某一個。因此一個使用案例是利用土地的衛(wèi)星影像制圖。土地覆蓋信息是重要的各種應(yīng)用,如監(jiān)測地區(qū)的森林砍伐和城市化等。為了識別衛(wèi)星圖像上每個像素的土地覆蓋類型(例如,城市、農(nóng)業(yè)、水等區(qū)域),土地覆蓋分類可以被視為多級語義分割任務(wù)。道路和建筑物檢測也是交通管理,城市規(guī)劃和道路監(jiān)測的重要研究課題。

以上介紹的三個方向是目前深度學(xué)習(xí)在計算機(jī)視覺領(lǐng)域非常火熱的三個研究方。市面上許多網(wǎng)絡(luò)教程通過使用開源的視覺開發(fā)軟件OpenCV結(jié)合Caffe/Tensorflow進(jìn)行發(fā)開,但是對于初學(xué)者,這一套開發(fā)與部署流程對于剛剛接觸深度學(xué)習(xí)的同學(xué)非常不友好,學(xué)習(xí)周期漫長并且部署流程繁瑣。德國著名視覺算法軟件開發(fā)公司MVtec開發(fā)的Halcon算法工具包集成了開發(fā)環(huán)境。后期將會帶大家了解如何通過Halcon軟件開發(fā)包快速上手玩轉(zhuǎn)當(dāng)前最火的深度學(xué)習(xí)三大方向應(yīng)用。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴

原文標(biāo)題:深度學(xué)習(xí)在視覺中的應(yīng)用(1)

文章出處:【微信號:chaorenshijue,微信公眾號:超人Halcon機(jī)器視覺】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏

    評論

    相關(guān)推薦

    目標(biāo)檢測和圖像語義分割領(lǐng)域性能評價指標(biāo)

    目標(biāo)檢測和圖像語義分割領(lǐng)域的性能評價指標(biāo)
    發(fā)表于 05-13 09:57

    目標(biāo)檢測 | 已開源!全新水下目標(biāo)檢測算法SWIPENet+IMA框架

    ,基于深度學(xué)習(xí)的方法在標(biāo)準(zhǔn)的目標(biāo)檢測中取得了可喜的性能。水下目標(biāo)檢測仍具有以下幾點(diǎn)挑戰(zhàn):(1)水
    發(fā)表于 07-24 11:05

    van-自然和醫(yī)學(xué)圖像的深度語義分割:網(wǎng)絡(luò)結(jié)構(gòu)

    feature每個點(diǎn)做softmax prediction,就可以獲得32*upsampled prediction(分割圖)。FCN這三個創(chuàng)新點(diǎn)有哪些?全卷積:用于解決逐像素的預(yù)測問題。通過將基礎(chǔ)網(wǎng)絡(luò)
    發(fā)表于 12-28 11:03

    van-自然和醫(yī)學(xué)圖像的深度語義分割:網(wǎng)絡(luò)結(jié)構(gòu)

    feature每個點(diǎn)做softmax prediction,就可以獲得32*upsampled prediction(分割圖)。FCN這三個創(chuàng)新點(diǎn)有哪些?全卷積:用于解決逐像素的預(yù)測問題。通過將基礎(chǔ)網(wǎng)絡(luò)
    發(fā)表于 12-28 11:06

    遷移學(xué)習(xí)

    Zurich)。語義分割工具箱MMSegmentaion的認(rèn)識和使用。設(shè)計一分割模型能夠從仿真環(huán)境中得到的數(shù)據(jù)遷移到真實(shí)場景
    發(fā)表于 04-21 15:15

    機(jī)器學(xué)習(xí)簡介與經(jīng)典機(jī)器學(xué)習(xí)算法人才培養(yǎng)

    )。語義分割工具箱MMSegmentaion的認(rèn)識和使用。設(shè)計一分割模型能夠從仿真環(huán)境中得到的數(shù)據(jù)遷移到真實(shí)場景
    發(fā)表于 04-28 18:56

    如何使用深度學(xué)習(xí)進(jìn)行視頻行人目標(biāo)檢測

    近年來,隨著深度學(xué)習(xí)在計算機(jī)視覺領(lǐng)域的廣泛應(yīng)用,基于深度學(xué)習(xí)的視頻運(yùn)動目標(biāo)檢測受到廣大學(xué)者的青睞
    發(fā)表于 11-19 16:01 ?22次下載
    如何使用<b class='flag-5'>深度</b><b class='flag-5'>學(xué)習(xí)</b>進(jìn)行視頻行人<b class='flag-5'>目標(biāo)</b><b class='flag-5'>檢測</b>

    分析總結(jié)基于深度神經(jīng)網(wǎng)絡(luò)的圖像語義分割方法

    隨著深度學(xué)習(xí)技術(shù)的快速發(fā)展及其語義分割領(lǐng)域的廣泛應(yīng)用,語義
    發(fā)表于 03-19 14:14 ?21次下載
    分析總結(jié)基于<b class='flag-5'>深度</b>神經(jīng)網(wǎng)絡(luò)的圖像<b class='flag-5'>語義</b><b class='flag-5'>分割</b>方法

    基于深度學(xué)習(xí)維點(diǎn)云語義分割研究分析

    近年來,深度傳感器和維激光掃描儀的普及推動了維點(diǎn)云處理方法的快速發(fā)展。點(diǎn)云語義分割作為理解
    發(fā)表于 04-01 14:48 ?16次下載
    基于<b class='flag-5'>深度</b><b class='flag-5'>學(xué)習(xí)</b>的<b class='flag-5'>三</b>維點(diǎn)云<b class='flag-5'>語義</b><b class='flag-5'>分割</b>研究分析

    基于深度神經(jīng)網(wǎng)絡(luò)的圖像語義分割方法

    圖像語義分割是計算機(jī)視覺領(lǐng)堿近年來的熱點(diǎn)硏究課題,隨著深度學(xué)習(xí)技術(shù)的興起,圖像語義分割
    發(fā)表于 04-02 13:59 ?11次下載
    基于<b class='flag-5'>深度</b>神經(jīng)網(wǎng)絡(luò)的圖像<b class='flag-5'>語義</b><b class='flag-5'>分割</b>方法

    基于深度學(xué)習(xí)場景分割算法研究

    大部分基于深度學(xué)習(xí)場景分割算法采用的“卷積-反卷積”結(jié)構(gòu);在此基礎(chǔ)上,對近年來出現(xiàn)的基于深度學(xué)習(xí)
    發(fā)表于 02-12 11:28 ?593次閱讀

    語義分割數(shù)據(jù)集:從理論到實(shí)踐

    語義分割是計算機(jī)視覺領(lǐng)域中的一重要問題,它的目標(biāo)是將圖像或視頻中的語義信息(如人、物、場景等)
    的頭像 發(fā)表于 04-23 16:45 ?958次閱讀

    自動駕駛深度多模態(tài)目標(biāo)檢測語義分割:數(shù)據(jù)集、方法和挑戰(zhàn)

    了許多解決深度多模態(tài)感知問題的方法。 然而,對于網(wǎng)絡(luò)架構(gòu)的設(shè)計,并沒有通用的指導(dǎo)方針,關(guān)于“融合什么”、“何時融合”和“如何融合”的問題仍然沒有定論。本文系統(tǒng)地總結(jié)了自動駕駛 中深度多模態(tài)目標(biāo)
    發(fā)表于 06-06 10:37 ?0次下載
    自動駕駛<b class='flag-5'>深度</b>多模態(tài)<b class='flag-5'>目標(biāo)</b><b class='flag-5'>檢測</b>和<b class='flag-5'>語義</b><b class='flag-5'>分割</b>:數(shù)據(jù)集、方法和挑戰(zhàn)

    深度學(xué)習(xí)圖像語義分割指標(biāo)介紹

    深度學(xué)習(xí)在圖像語義分割上已經(jīng)取得了重大進(jìn)展與明顯的效果,產(chǎn)生了很多專注于圖像語義分割的模型與基準(zhǔn)
    發(fā)表于 10-09 15:26 ?425次閱讀
    <b class='flag-5'>深度</b><b class='flag-5'>學(xué)習(xí)</b>圖像<b class='flag-5'>語義</b><b class='flag-5'>分割</b>指標(biāo)介紹

    圖像語義分割的實(shí)用性是什么

    什么是圖像語義分割 圖像語義分割是一種將圖像中的所有像素點(diǎn)按照其語義類別進(jìn)行分類的任務(wù)。與傳統(tǒng)
    的頭像 發(fā)表于 07-17 09:56 ?473次閱讀