智能視覺是一門研究如何使機器“看”的科學(xué),更進一步的說,就是研究如何用攝影機和電腦代替人眼對目標進行識別、跟蹤和測量。
智能視覺通常用于通過對采集的圖片或視頻進行處理以獲得相應(yīng)場景的信息,更詳細的說智能視覺主要有以下五種類型的任務(wù):
物 體 檢 測
物體檢測是視覺感知的第一步,也是智能視覺的一個重要分支。物體檢測的目標,就是用框去標出物體的位置,并給出物體的類別。
物體檢測和圖像分類不一樣,檢測側(cè)重于物體的搜索,而且物體檢測的目標必須要有固定的形狀和輪廓。圖像分類可以是任意的目標,這個目標可能是物體,也可能是一些屬性或者場景。
物 體 識 別
智能視覺的經(jīng)典問題便是判定一組圖像數(shù)據(jù)中是否包含某個特定的物體、圖像特征或運動狀態(tài)。這一問題通常可以通過機器自動解決,但是到目前為止,還沒有某個單一的方法能夠廣泛的對各種情況進行判定,達到在任意環(huán)境中識別任意物體的水平。
但是,現(xiàn)有的技術(shù)能夠很好地解決特定目標的識別,比如簡單幾何圖形識別、人臉識別、印刷或手寫文件識別,或者車輛識別,只是這些目標需要在特定的環(huán)境中,具有指定的光照、背景和姿態(tài)要求。
物 體 分 類
一張圖像中是否包含某種物體,對圖像進行特征描述是物體分類的主要研究內(nèi)容。一般說來,物體分類算法通過手工特征或者特征學(xué)習(xí)方法對整個圖像進行全局描述,然后使用分類器判斷是否存在某類物體。
圖像分類問題就是給輸入圖像分配標簽的任務(wù),這是智能視覺的核心問題之一。這個過程往往與機器學(xué)習(xí)和深度學(xué)習(xí)不可分割。
物 體 定 位
如果說圖像識別解決的是what,那么物體定位解決的則是where的問題。利用智能視覺技術(shù)找到圖像中某一目標物體在圖像中的位置,即定位。
目標物體的定位對于計算機視覺在安防、自動駕駛等領(lǐng)域的應(yīng)用有著至關(guān)重要的意義。
圖 像 分 割
在圖像處理過程中,有時會需要對圖像進行分割來提取有價值的用于后續(xù)處理的部分,例如篩選特征點,或者分割一或多幅圖片中含有特定目標的部分等。
圖像分割指的是將數(shù)字圖像細分為多個圖像子區(qū)域(像素的集合,也被稱作超像素)的過程。圖像分割的目的是簡化或改變圖像的表示形式,使得圖像更容易理解和分析。更精確地說,圖像分割是對圖像中的每個像素加標簽的一個過程,這一過程使得具有相同標簽的像素具有某種共同視覺特性。
“圖像分割”是一個像素級別的物體識別,即每個像素點都要判斷它的類別。它和物體檢測的區(qū)別是:檢測是一個物體級別的,只需要一個框去框住物體的位置,而分割是比檢測要更難的問題。
智能視覺是通過創(chuàng)建人工模型來模擬本由人類執(zhí)行的視覺任務(wù)。其本質(zhì)是模擬人類的感知與觀察的一個過程。這個過程不止識別,而是包含了一系列的過程,并且最終是可以在人工系統(tǒng)中被理解和實現(xiàn)的。
-
機器視覺
+關(guān)注
關(guān)注
162文章
4388瀏覽量
120441 -
人工智能
+關(guān)注
關(guān)注
1792文章
47425瀏覽量
238963
原文標題:AI|智能視覺的五大關(guān)鍵任務(wù)
文章出處:【微信號:THundersoft,微信公眾號:ThunderSoft中科創(chuàng)達】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
相關(guān)推薦
評論