0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

深度學(xué)習(xí)下的分類,目標(biāo)檢測(cè)、語(yǔ)義分割這三個(gè)方向具體的概念及其應(yīng)用場(chǎng)景是什么?

電子工程師 ? 來(lái)源:lq ? 2019-05-08 11:44 ? 次閱讀

隨著Halcon新版本的更新,截止2019年5月1號(hào)。Halcon的最新版本為halcon18.11.這次新版本最大的更新在于完整的加入了深度學(xué)習(xí)在視覺(jué)應(yīng)用的三個(gè)重要部分,即目標(biāo)分類分類、目標(biāo)檢測(cè)、語(yǔ)義分割這三個(gè)內(nèi)容。與此同時(shí)超人視覺(jué)即將向大家簡(jiǎn)介Halcon軟件這三個(gè)方向的應(yīng)用示例,幫助大家進(jìn)一步認(rèn)識(shí)到機(jī)器視覺(jué)的魅力與當(dāng)前的機(jī)器視覺(jué)技術(shù)的應(yīng)用前沿。

在開始內(nèi)容前我們先明確一下前面提到的三個(gè)重要概念即深度學(xué)習(xí)下的分類,目標(biāo)檢測(cè)、語(yǔ)義分割這三個(gè)方向具體的概念及其應(yīng)用場(chǎng)景是什么?幫助大家理解其技術(shù)的產(chǎn)生背景以及形成自己的理解。

1圖像分類

圖像分類這一類問(wèn)題常用與區(qū)分不同的物品,圖像分類,顧名思義,是一個(gè)輸入圖像,輸出對(duì)該圖像內(nèi)容分類的描述的問(wèn)題。它是視覺(jué)方向的其中一個(gè)核心,實(shí)際應(yīng)用廣泛。許多同學(xué)在學(xué)習(xí)計(jì)算機(jī)視覺(jué)中有一個(gè)練習(xí)題是練習(xí)如何區(qū)分貓狗如圖1所示:

我們觀察一下這些圖片的特點(diǎn),這些圖片各種各樣,分辨率也各不相同。圖片中的貓和狗形狀、所處位置、體表顏色各不一樣。它們的姿態(tài)不同,有的在坐著而有的則不是,它們的情緒可能是開心的也可能是傷心的,貓可能在睡覺(jué),而狗可能在汪汪地叫著。照片可能以任一焦距從任意角度拍下。

總而言之這些圖片有著無(wú)限種可能,對(duì)于我們?nèi)祟悂?lái)說(shuō)在一系列不同種類的照片中識(shí)別出一個(gè)場(chǎng)景中的寵物自然是毫不費(fèi)力的事情,然而這對(duì)于一臺(tái)機(jī)器來(lái)說(shuō)可不是一件小事。實(shí)際上,如果要機(jī)器實(shí)現(xiàn)自動(dòng)分類,那么我們需要知道如何強(qiáng)有力地描繪出貓和狗的特征,也就是說(shuō)為什么我們認(rèn)為這張圖片中的是貓,而那張圖片中的卻是狗。這個(gè)需要描繪每個(gè)動(dòng)物的內(nèi)在特征。

1.在傳統(tǒng)的分類方法下圖像分類是特征描述及檢測(cè),這類傳統(tǒng)方法可能對(duì)于一些簡(jiǎn)單的圖像分類是有效的,但由于實(shí)際情況非常復(fù)雜,傳統(tǒng)的分類方法不堪重負(fù)。深度學(xué)習(xí)下的神經(jīng)網(wǎng)絡(luò)在圖像分類任務(wù)上效果很好的原因是,它們有著能夠自動(dòng)學(xué)習(xí)多重抽象層的能力,神經(jīng)網(wǎng)絡(luò)可以識(shí)別極端變化的模式,在扭曲的圖像和經(jīng)過(guò)簡(jiǎn)單的幾何變換的圖像上也有著很好的魯棒性。

2目標(biāo)檢測(cè)

圖像分類是將圖像劃分為單個(gè)類別,通常對(duì)應(yīng)于圖像中最突出的物體。但是現(xiàn)實(shí)世界的很多圖片通常包含不只一個(gè)物體,此時(shí)如果使用圖像分類模型為圖像分配一個(gè)單一標(biāo)簽其實(shí)是非常粗糙的,并不準(zhǔn)確。對(duì)于這樣的情況,就需要目標(biāo)檢測(cè)模型,目標(biāo)檢測(cè)模型可以識(shí)別一張圖片的多個(gè)物體,并可以定位出不同物體并且給出邊界框。目標(biāo)檢測(cè)在很多場(chǎng)景有用,如無(wú)人駕駛和安防系統(tǒng)。

傳統(tǒng)的目標(biāo)檢測(cè)的算法多用模板匹配完成,但是模板匹配針對(duì)復(fù)雜場(chǎng)景下下的識(shí)別并不良好,特別是在光照情況不穩(wěn)定物體有遮擋的情況下算法的魯棒性如何確保一直是傳統(tǒng)視覺(jué)算法的一個(gè)難題。

由上圖所示,我們可以總結(jié)出來(lái)目標(biāo)檢測(cè)要解決的核心問(wèn)題是:1)目標(biāo)可能出現(xiàn)在圖像的任何位置,2)目標(biāo)有各種不同的大小,3)目標(biāo)可能有各種不同的形狀。深度學(xué)習(xí)在這方面的處理已經(jīng)部分超越了傳統(tǒng)算法的上限,目前較為先進(jìn)的深度卷積神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu),通過(guò)其具有局部連接權(quán),值共享及池化操作等功能,有效降低了網(wǎng)絡(luò)的復(fù)雜度,減少了訓(xùn)練參數(shù)的數(shù)目。使模型對(duì)于平移、扭曲、縮放具有一定程度不變性并具有較強(qiáng)的魯棒性和容錯(cuò)能力,且易于訓(xùn)練與優(yōu)化的網(wǎng)絡(luò)結(jié)構(gòu)。

3.語(yǔ)義分割

語(yǔ)義分割方法在處理圖像時(shí),具體到像素級(jí)別,也就是說(shuō),該方法會(huì)將圖像中每個(gè)像素分配到某個(gè)對(duì)象類別。語(yǔ)義分割是一種典型的計(jì)算機(jī)視覺(jué)問(wèn)題,其涉及將一些原始數(shù)據(jù)(例如,平面圖像)作為輸入并將它們轉(zhuǎn)換為具有突出顯示的感興趣區(qū)域的掩模。

許多人使用術(shù)語(yǔ)全像素語(yǔ)義分割,其中圖像中的每個(gè)像素根據(jù)其所屬的感興趣對(duì)象被分配類別ID。 早期的計(jì)算機(jī)視覺(jué)問(wèn)題只發(fā)現(xiàn)邊緣(線條和曲線)或漸變等元素,但它們從未完全按照人類感知的方式提供像素級(jí)別的圖像理解。語(yǔ)義分割將屬于同一目標(biāo)的圖像部分聚集在一起來(lái)解決這個(gè)問(wèn)題,從而擴(kuò)展了其應(yīng)用領(lǐng)域。如圖所示。

語(yǔ)義分割問(wèn)題也可以被認(rèn)為是分類問(wèn)題,其中每個(gè)像素被分類為來(lái)自一系列對(duì)象類中的某一個(gè)。因此一個(gè)使用案例是利用土地的衛(wèi)星影像制圖。土地覆蓋信息是重要的各種應(yīng)用,如監(jiān)測(cè)地區(qū)的森林砍伐和城市化等。為了識(shí)別衛(wèi)星圖像上每個(gè)像素的土地覆蓋類型(例如,城市、農(nóng)業(yè)、水等區(qū)域),土地覆蓋分類可以被視為多級(jí)語(yǔ)義分割任務(wù)。道路和建筑物檢測(cè)也是交通管理,城市規(guī)劃和道路監(jiān)測(cè)的重要研究課題。

以上介紹的三個(gè)方向是目前深度學(xué)習(xí)在計(jì)算機(jī)視覺(jué)領(lǐng)域非?;馃岬娜齻€(gè)研究方。市面上許多網(wǎng)絡(luò)教程通過(guò)使用開源的視覺(jué)開發(fā)軟件OpenCV結(jié)合Caffe/Tensorflow進(jìn)行發(fā)開,但是對(duì)于初學(xué)者,這一套開發(fā)與部署流程對(duì)于剛剛接觸深度學(xué)習(xí)的同學(xué)非常不友好,學(xué)習(xí)周期漫長(zhǎng)并且部署流程繁瑣。德國(guó)著名視覺(jué)算法軟件開發(fā)公司MVtec開發(fā)的Halcon算法工具包集成了開發(fā)環(huán)境。后期將會(huì)帶大家了解如何通過(guò)Halcon軟件開發(fā)包快速上手玩轉(zhuǎn)當(dāng)前最火的深度學(xué)習(xí)三大方向應(yīng)用。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴

原文標(biāo)題:深度學(xué)習(xí)在視覺(jué)中的應(yīng)用(1)

文章出處:【微信號(hào):chaorenshijue,微信公眾號(hào):超人Halcon機(jī)器視覺(jué)】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏

    評(píng)論

    相關(guān)推薦

    labview調(diào)用yolo目標(biāo)檢測(cè)、分割分類、obb

    labview調(diào)用yolo目標(biāo)檢測(cè)分割、分類、obb、pose深度學(xué)習(xí),支持CPU和GPU
    發(fā)表于 03-31 16:28

    目標(biāo)檢測(cè)和圖像語(yǔ)義分割領(lǐng)域性能評(píng)價(jià)指標(biāo)

    目標(biāo)檢測(cè)和圖像語(yǔ)義分割領(lǐng)域的性能評(píng)價(jià)指標(biāo)
    發(fā)表于 05-13 09:57

    van-自然和醫(yī)學(xué)圖像的深度語(yǔ)義分割:網(wǎng)絡(luò)結(jié)構(gòu)

    feature每個(gè)點(diǎn)做softmax prediction,就可以獲得32*upsampled prediction(分割圖)。FCN這三個(gè)創(chuàng)新點(diǎn)有哪些?全卷積:用于解決逐像素的預(yù)測(cè)問(wèn)題。通過(guò)將基礎(chǔ)網(wǎng)絡(luò)
    發(fā)表于 12-28 11:03

    van-自然和醫(yī)學(xué)圖像的深度語(yǔ)義分割:網(wǎng)絡(luò)結(jié)構(gòu)

    feature每個(gè)點(diǎn)做softmax prediction,就可以獲得32*upsampled prediction(分割圖)。FCN這三個(gè)創(chuàng)新點(diǎn)有哪些?全卷積:用于解決逐像素的預(yù)測(cè)問(wèn)題。通過(guò)將基礎(chǔ)網(wǎng)絡(luò)
    發(fā)表于 12-28 11:06

    遷移學(xué)習(xí)

    Zurich)。語(yǔ)義分割工具箱MMSegmentaion的認(rèn)識(shí)和使用。設(shè)計(jì)一個(gè)分割模型能夠從仿真環(huán)境中得到的數(shù)據(jù)遷移到真實(shí)場(chǎng)景
    發(fā)表于 04-21 15:15

    機(jī)器學(xué)習(xí)簡(jiǎn)介與經(jīng)典機(jī)器學(xué)習(xí)算法人才培養(yǎng)

    )。語(yǔ)義分割工具箱MMSegmentaion的認(rèn)識(shí)和使用。設(shè)計(jì)一個(gè)分割模型能夠從仿真環(huán)境中得到的數(shù)據(jù)遷移到真實(shí)場(chǎng)景
    發(fā)表于 04-28 18:56

    如何使用深度學(xué)習(xí)進(jìn)行視頻行人目標(biāo)檢測(cè)

    近年來(lái),隨著深度學(xué)習(xí)在計(jì)算機(jī)視覺(jué)領(lǐng)域的廣泛應(yīng)用,基于深度學(xué)習(xí)的視頻運(yùn)動(dòng)目標(biāo)檢測(cè)受到廣大學(xué)者的青睞
    發(fā)表于 11-19 16:01 ?22次下載
    如何使用<b class='flag-5'>深度</b><b class='flag-5'>學(xué)習(xí)</b>進(jìn)行視頻行人<b class='flag-5'>目標(biāo)</b><b class='flag-5'>檢測(cè)</b>

    分析總結(jié)基于深度神經(jīng)網(wǎng)絡(luò)的圖像語(yǔ)義分割方法

    隨著深度學(xué)習(xí)技術(shù)的快速發(fā)展及其語(yǔ)義分割領(lǐng)域的廣泛應(yīng)用,語(yǔ)義
    發(fā)表于 03-19 14:14 ?21次下載
    分析總結(jié)基于<b class='flag-5'>深度</b>神經(jīng)網(wǎng)絡(luò)的圖像<b class='flag-5'>語(yǔ)義</b><b class='flag-5'>分割</b>方法

    基于深度學(xué)習(xí)維點(diǎn)云語(yǔ)義分割研究分析

    近年來(lái),深度傳感器和維激光掃描儀的普及推動(dòng)了維點(diǎn)云處理方法的快速發(fā)展。點(diǎn)云語(yǔ)義分割作為理解
    發(fā)表于 04-01 14:48 ?16次下載
    基于<b class='flag-5'>深度</b><b class='flag-5'>學(xué)習(xí)</b>的<b class='flag-5'>三</b>維點(diǎn)云<b class='flag-5'>語(yǔ)義</b><b class='flag-5'>分割</b>研究分析

    基于深度神經(jīng)網(wǎng)絡(luò)的圖像語(yǔ)義分割方法

    圖像語(yǔ)義分割是計(jì)算機(jī)視覺(jué)領(lǐng)堿近年來(lái)的熱點(diǎn)硏究課題,隨著深度學(xué)習(xí)技術(shù)的興起,圖像語(yǔ)義分割
    發(fā)表于 04-02 13:59 ?11次下載
    基于<b class='flag-5'>深度</b>神經(jīng)網(wǎng)絡(luò)的圖像<b class='flag-5'>語(yǔ)義</b><b class='flag-5'>分割</b>方法

    基于深度學(xué)習(xí)場(chǎng)景分割算法研究

    大部分基于深度學(xué)習(xí)場(chǎng)景分割算法采用的“卷積-反卷積”結(jié)構(gòu);在此基礎(chǔ)上,對(duì)近年來(lái)出現(xiàn)的基于深度學(xué)習(xí)
    發(fā)表于 02-12 11:28 ?649次閱讀

    語(yǔ)義分割數(shù)據(jù)集:從理論到實(shí)踐

    語(yǔ)義分割是計(jì)算機(jī)視覺(jué)領(lǐng)域中的一個(gè)重要問(wèn)題,它的目標(biāo)是將圖像或視頻中的語(yǔ)義信息(如人、物、場(chǎng)景等)
    的頭像 發(fā)表于 04-23 16:45 ?1139次閱讀

    自動(dòng)駕駛深度多模態(tài)目標(biāo)檢測(cè)語(yǔ)義分割:數(shù)據(jù)集、方法和挑戰(zhàn)

    了許多解決深度多模態(tài)感知問(wèn)題的方法。 然而,對(duì)于網(wǎng)絡(luò)架構(gòu)的設(shè)計(jì),并沒(méi)有通用的指導(dǎo)方針,關(guān)于“融合什么”、“何時(shí)融合”和“如何融合”的問(wèn)題仍然沒(méi)有定論。本文系統(tǒng)地總結(jié)了自動(dòng)駕駛 中深度多模態(tài)目標(biāo)
    發(fā)表于 06-06 10:37 ?0次下載
    自動(dòng)駕駛<b class='flag-5'>深度</b>多模態(tài)<b class='flag-5'>目標(biāo)</b><b class='flag-5'>檢測(cè)</b>和<b class='flag-5'>語(yǔ)義</b><b class='flag-5'>分割</b>:數(shù)據(jù)集、方法和挑戰(zhàn)

    深度學(xué)習(xí)圖像語(yǔ)義分割指標(biāo)介紹

    深度學(xué)習(xí)在圖像語(yǔ)義分割上已經(jīng)取得了重大進(jìn)展與明顯的效果,產(chǎn)生了很多專注于圖像語(yǔ)義分割的模型與基準(zhǔn)
    發(fā)表于 10-09 15:26 ?536次閱讀
    <b class='flag-5'>深度</b><b class='flag-5'>學(xué)習(xí)</b>圖像<b class='flag-5'>語(yǔ)義</b><b class='flag-5'>分割</b>指標(biāo)介紹

    圖像語(yǔ)義分割的實(shí)用性是什么

    什么是圖像語(yǔ)義分割 圖像語(yǔ)義分割是一種將圖像中的所有像素點(diǎn)按照其語(yǔ)義類別進(jìn)行分類的任務(wù)。與傳統(tǒng)
    的頭像 發(fā)表于 07-17 09:56 ?698次閱讀

    電子發(fā)燒友

    中國(guó)電子工程師最喜歡的網(wǎng)站

    • 2931785位工程師會(huì)員交流學(xué)習(xí)
    • 獲取您個(gè)性化的科技前沿技術(shù)信息
    • 參加活動(dòng)獲取豐厚的禮品