隨著Halcon新版本的更新,截止2019年5月1號。Halcon的最新版本為halcon18.11.這次新版本最大的更新在于完整的加入了深度學(xué)習(xí)在視覺應(yīng)用的三個重要部分,即目標(biāo)分類分類、目標(biāo)檢測、語義分割這三個內(nèi)容。與此同時超人視覺即將向大家簡介Halcon軟件這三個方向的應(yīng)用示例,幫助大家進(jìn)一步認(rèn)識到機(jī)器視覺的魅力與當(dāng)前的機(jī)器視覺技術(shù)的應(yīng)用前沿。
在開始內(nèi)容前我們先明確一下前面提到的三個重要概念即深度學(xué)習(xí)下的分類,目標(biāo)檢測、語義分割這三個方向具體的概念及其應(yīng)用場景是什么?幫助大家理解其技術(shù)的產(chǎn)生背景以及形成自己的理解。
1圖像分類
圖像分類這一類問題常用與區(qū)分不同的物品,圖像分類,顧名思義,是一個輸入圖像,輸出對該圖像內(nèi)容分類的描述的問題。它是視覺方向的其中一個核心,實(shí)際應(yīng)用廣泛。許多同學(xué)在學(xué)習(xí)計算機(jī)視覺中有一個練習(xí)題是練習(xí)如何區(qū)分貓狗如圖1所示:
我們觀察一下這些圖片的特點(diǎn),這些圖片各種各樣,分辨率也各不相同。圖片中的貓和狗形狀、所處位置、體表顏色各不一樣。它們的姿態(tài)不同,有的在坐著而有的則不是,它們的情緒可能是開心的也可能是傷心的,貓可能在睡覺,而狗可能在汪汪地叫著。照片可能以任一焦距從任意角度拍下。
總而言之這些圖片有著無限種可能,對于我們?nèi)祟悂碚f在一系列不同種類的照片中識別出一個場景中的寵物自然是毫不費(fèi)力的事情,然而這對于一臺機(jī)器來說可不是一件小事。實(shí)際上,如果要機(jī)器實(shí)現(xiàn)自動分類,那么我們需要知道如何強(qiáng)有力地描繪出貓和狗的特征,也就是說為什么我們認(rèn)為這張圖片中的是貓,而那張圖片中的卻是狗。這個需要描繪每個動物的內(nèi)在特征。
1.在傳統(tǒng)的分類方法下圖像分類是特征描述及檢測,這類傳統(tǒng)方法可能對于一些簡單的圖像分類是有效的,但由于實(shí)際情況非常復(fù)雜,傳統(tǒng)的分類方法不堪重負(fù)。深度學(xué)習(xí)下的神經(jīng)網(wǎng)絡(luò)在圖像分類任務(wù)上效果很好的原因是,它們有著能夠自動學(xué)習(xí)多重抽象層的能力,神經(jīng)網(wǎng)絡(luò)可以識別極端變化的模式,在扭曲的圖像和經(jīng)過簡單的幾何變換的圖像上也有著很好的魯棒性。
2目標(biāo)檢測
圖像分類是將圖像劃分為單個類別,通常對應(yīng)于圖像中最突出的物體。但是現(xiàn)實(shí)世界的很多圖片通常包含不只一個物體,此時如果使用圖像分類模型為圖像分配一個單一標(biāo)簽其實(shí)是非常粗糙的,并不準(zhǔn)確。對于這樣的情況,就需要目標(biāo)檢測模型,目標(biāo)檢測模型可以識別一張圖片的多個物體,并可以定位出不同物體并且給出邊界框。目標(biāo)檢測在很多場景有用,如無人駕駛和安防系統(tǒng)。
傳統(tǒng)的目標(biāo)檢測的算法多用模板匹配完成,但是模板匹配針對復(fù)雜場景下下的識別并不良好,特別是在光照情況不穩(wěn)定物體有遮擋的情況下算法的魯棒性如何確保一直是傳統(tǒng)視覺算法的一個難題。
由上圖所示,我們可以總結(jié)出來目標(biāo)檢測要解決的核心問題是:1)目標(biāo)可能出現(xiàn)在圖像的任何位置,2)目標(biāo)有各種不同的大小,3)目標(biāo)可能有各種不同的形狀。深度學(xué)習(xí)在這方面的處理已經(jīng)部分超越了傳統(tǒng)算法的上限,目前較為先進(jìn)的深度卷積神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu),通過其具有局部連接權(quán),值共享及池化操作等功能,有效降低了網(wǎng)絡(luò)的復(fù)雜度,減少了訓(xùn)練參數(shù)的數(shù)目。使模型對于平移、扭曲、縮放具有一定程度不變性并具有較強(qiáng)的魯棒性和容錯能力,且易于訓(xùn)練與優(yōu)化的網(wǎng)絡(luò)結(jié)構(gòu)。
3.語義分割
語義分割方法在處理圖像時,具體到像素級別,也就是說,該方法會將圖像中每個像素分配到某個對象類別。語義分割是一種典型的計算機(jī)視覺問題,其涉及將一些原始數(shù)據(jù)(例如,平面圖像)作為輸入并將它們轉(zhuǎn)換為具有突出顯示的感興趣區(qū)域的掩模。
許多人使用術(shù)語全像素語義分割,其中圖像中的每個像素根據(jù)其所屬的感興趣對象被分配類別ID。 早期的計算機(jī)視覺問題只發(fā)現(xiàn)邊緣(線條和曲線)或漸變等元素,但它們從未完全按照人類感知的方式提供像素級別的圖像理解。語義分割將屬于同一目標(biāo)的圖像部分聚集在一起來解決這個問題,從而擴(kuò)展了其應(yīng)用領(lǐng)域。如圖所示。
語義分割問題也可以被認(rèn)為是分類問題,其中每個像素被分類為來自一系列對象類中的某一個。因此一個使用案例是利用土地的衛(wèi)星影像制圖。土地覆蓋信息是重要的各種應(yīng)用,如監(jiān)測地區(qū)的森林砍伐和城市化等。為了識別衛(wèi)星圖像上每個像素的土地覆蓋類型(例如,城市、農(nóng)業(yè)、水等區(qū)域),土地覆蓋分類可以被視為多級語義分割任務(wù)。道路和建筑物檢測也是交通管理,城市規(guī)劃和道路監(jiān)測的重要研究課題。
以上介紹的三個方向是目前深度學(xué)習(xí)在計算機(jī)視覺領(lǐng)域非常火熱的三個研究方。市面上許多網(wǎng)絡(luò)教程通過使用開源的視覺開發(fā)軟件OpenCV結(jié)合Caffe/Tensorflow進(jìn)行發(fā)開,但是對于初學(xué)者,這一套開發(fā)與部署流程對于剛剛接觸深度學(xué)習(xí)的同學(xué)非常不友好,學(xué)習(xí)周期漫長并且部署流程繁瑣。德國著名視覺算法軟件開發(fā)公司MVtec開發(fā)的Halcon算法工具包集成了開發(fā)環(huán)境。后期將會帶大家了解如何通過Halcon軟件開發(fā)包快速上手玩轉(zhuǎn)當(dāng)前最火的深度學(xué)習(xí)三大方向應(yīng)用。
-
神經(jīng)網(wǎng)絡(luò)
+關(guān)注
關(guān)注
42文章
4776瀏覽量
100938 -
圖像分類
+關(guān)注
關(guān)注
0文章
90瀏覽量
11942 -
深度學(xué)習(xí)
+關(guān)注
關(guān)注
73文章
5510瀏覽量
121329
原文標(biāo)題:深度學(xué)習(xí)在視覺中的應(yīng)用(1)
文章出處:【微信號:chaorenshijue,微信公眾號:超人Halcon機(jī)器視覺】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
相關(guān)推薦
評論