機(jī)器視覺是工業(yè)4.0,即工業(yè)物聯(lián)網(wǎng)背景下高度自動化和無縫聯(lián)網(wǎng)過程的關(guān)鍵技術(shù)。使用諸如深度學(xué)習(xí)之類的新的人工智能過程變得越來越重要。許多好處使這項(xiàng)技術(shù)具有吸引力,但同時它也有局限性。
工業(yè)生產(chǎn)的自動化正在迅速發(fā)展。完全網(wǎng)絡(luò)化和數(shù)字化的流程鏈在生產(chǎn)車間早已司空見慣。在工業(yè)4.0和智能工廠中,所有涉及的組件——包括機(jī)器、機(jī)器人、傳輸和處理系統(tǒng)、傳感器和圖像采集設(shè)備——一起工作,彼此無縫通信。機(jī)器人領(lǐng)域也出現(xiàn)了一種新趨勢:小型、緊湊的移動機(jī)器人,即協(xié)作機(jī)器人(collaborative robots, cobots)正在加入生產(chǎn)流程,并經(jīng)常與人類同事密切合作。cobots的最大好處是,它們可以快速地重新裝備,并且只需很少的工作,這使得靈活地使用它們來完成不同的生產(chǎn)任務(wù)成為可能。
伴隨并支持整個價值創(chuàng)建過程的互補(bǔ)技術(shù)在這些高度自動化的場景中扮演著重要的角色。這些包括,例如,可編程邏輯控制器(plc)和機(jī)器視覺。后者作為“生產(chǎn)之眼”實(shí)時觀察和監(jiān)控生產(chǎn)過程。圖像采集設(shè)備,如相機(jī)、掃描儀和3D傳感器,被放置在多個位置,并從不同的角度記錄過程。生成的數(shù)字圖像數(shù)據(jù)通過集成的機(jī)器視覺軟件進(jìn)行處理,可用于處理鏈中的各種任務(wù)。例如,可以根據(jù)光學(xué)特性可靠地檢測目標(biāo)并精確定位。該技術(shù)還可以檢測產(chǎn)品的制造故障,從而自動排除故障,從而優(yōu)化質(zhì)量保證流程。
基于卷積神經(jīng)網(wǎng)絡(luò)(CNNs)架構(gòu)的深度學(xué)習(xí)
越來越多的先進(jìn)人工智能(AI)技術(shù)被納入機(jī)器視覺系統(tǒng)。其中一項(xiàng)技術(shù)是基于卷積神經(jīng)網(wǎng)絡(luò)(CNN)體系結(jié)構(gòu)的深度學(xué)習(xí)。大量的數(shù)字圖像信息用于廣泛的培訓(xùn)過程?;谶@些數(shù)據(jù),軟件可以獨(dú)立地對新對象進(jìn)行分類。在訓(xùn)練過程中,自動學(xué)習(xí)特定對象類的特征。因此,新的圖像數(shù)據(jù)可以精確地分配給它們的特定類別,從而產(chǎn)生非常高和強(qiáng)大的識別率。這些深度學(xué)習(xí)算法也適用于精確目標(biāo) 定位 和缺陷識別。
機(jī)器視覺是“生產(chǎn)之眼”
深度學(xué)習(xí)技術(shù)注定要在機(jī)器視覺應(yīng)用程序的某些領(lǐng)域使用。這些主要包括分類、對象檢測和語義分割。這就是智能算法的優(yōu)勢所在。然而,在其他機(jī)器視覺應(yīng)用中,深度學(xué)習(xí)的適用性有一定的局限性。由于需要分析大量的數(shù)據(jù),訓(xùn)練過程通常需要非常大的計(jì)算能力和適當(dāng)尺寸的硬件。特別是在時間非常關(guān)鍵的應(yīng)用程序中,標(biāo)準(zhǔn)CPU通常是不夠的。不適用于高速應(yīng)用程序,例如高精度測量任務(wù)和具有毫米或微米精度的目標(biāo)定位。在這種情況下,深度學(xué)習(xí)算法在一個標(biāo)準(zhǔn)CPU上需要50到100毫秒。然而,這種精確定位只需要幾毫秒。這里需要的是一個功能強(qiáng)大的GPU, 通常 GPU是不適用于工業(yè)用途的硬件。
深度學(xué)習(xí)并非適用于所有應(yīng)用
在工業(yè)應(yīng)用中,深度學(xué)習(xí)也不是最佳選擇,例如在電子和半導(dǎo)體工業(yè)中,要檢測或識別的對象與實(shí)際情況非常相似。由于這些組件通常具有非常相似的外觀,因此使用傳統(tǒng)機(jī)器視覺方法進(jìn)行培訓(xùn)只需要幾個示例圖像。在許多情況下,即使是單個圖像也足以可靠地檢測到對象并精確定位它們。然而,只有當(dāng)每個對象至少有100個訓(xùn)練圖像可用時,使用深度學(xué)習(xí)算法才有意義。因此,使用常規(guī)方法(如基于規(guī)則的軟件技術(shù))可以更好地解決機(jī)器視覺任務(wù),其中要識別的對象非常相似。特別是對于讀取數(shù)據(jù)代碼和條形碼,采用啟發(fā)式算法而不是深度學(xué)習(xí)算法。對目標(biāo)的度量,如亞像素精確輪廓提取,也依賴于啟發(fā)式算法。
深度學(xué)習(xí)可以提高識別率
然而,在深度學(xué)習(xí)能夠帶來全部好處的應(yīng)用中,必須考慮某些挑戰(zhàn)。深度學(xué)習(xí)是一種相對較新的技術(shù),市場對其提供的通用標(biāo)準(zhǔn)很少。此外,深度學(xué)習(xí)的整體處理非常復(fù)雜,需要深入的知識以及在人工智能、編程和機(jī)器視覺領(lǐng)域的多年經(jīng)驗(yàn)。這通常超出了一般公司的能力,因?yàn)樗麄內(nèi)狈Ρ匾膶I(yè)人才。
通過預(yù)先培訓(xùn)的深度學(xué)習(xí)網(wǎng)絡(luò)減少工作量
然而,有些公司可以通過合理的努力從深度學(xué)習(xí)中獲益。例如,他們可以利用預(yù)先培訓(xùn)的深度學(xué)習(xí)網(wǎng)絡(luò)。為此,市場上提供了許多免費(fèi)的開源解決方案。不過,使用它們還是有一些陷阱。例如,可能會出現(xiàn)許可證問題。通常需要幾十萬個樣本圖像來精確識別物體。之所以需要如此多的特征,是因?yàn)樵S多不同的特征,如顏色、形狀、紋理和表面結(jié)構(gòu),對識別過程至關(guān)重要。在選擇如此大量的圖像時,確保它們不受開源產(chǎn)品很少保證的第三方權(quán)利的約束是很重要的。
使用開源工具的另一個挑戰(zhàn)是,它們通常只單獨(dú)執(zhí)行某些機(jī)器視覺任務(wù),很難集成到其他應(yīng)用程序或現(xiàn)有框架中。典型的機(jī)器視覺問題通常涉及幾個步驟。首先,必須將來自圖像采集設(shè)備的數(shù)字圖像數(shù)據(jù)提供給特定應(yīng)用程序。然后在第二個步驟中對數(shù)據(jù)進(jìn)行預(yù)處理,在該步驟中,圖像被優(yōu)化定向以將對象放置在所需的位置。最后,處理后的數(shù)據(jù)被集成到其他解決方案中,例如PLC,這樣就可以無縫地將結(jié)果用于其他流程步驟。這就是開源系統(tǒng)達(dá)到其極限的地方。
標(biāo)準(zhǔn)專有軟件有很多優(yōu)點(diǎn)
已經(jīng)擁有預(yù)先培訓(xùn)的網(wǎng)絡(luò)的專有標(biāo)準(zhǔn)軟件解決方案是機(jī)器視覺的更實(shí)用的選擇。這些解決方案包括配備培訓(xùn)深度學(xué)習(xí)網(wǎng)絡(luò)的所有重要功能的軟件?;谄鋸V泛的功能和專門配置的工具,它可以最佳地集成到其他應(yīng)用程序中。該解決方案包括多個網(wǎng)絡(luò),這些網(wǎng)絡(luò)已根據(jù)工業(yè)環(huán)境中大約一百萬個精心挑選的免許可證圖像進(jìn)行了預(yù)先培訓(xùn)。公司只需要一些額外的圖像就可以根據(jù)自己的特定應(yīng)用定制網(wǎng)絡(luò)培訓(xùn)流程。這大大減少了培訓(xùn)工作,節(jié)省了資金,并避免了與圖像權(quán)利相關(guān)的風(fēng)險。
通過深度學(xué)習(xí),可以精確地檢測物體。圖像來源:MVTec Software GmbH
使用開源工具是另一個挑戰(zhàn)。深度學(xué)習(xí)應(yīng)用程序通常包含數(shù)十萬行編程代碼。要正確操作,此代碼必須滿足某些質(zhì)量標(biāo)準(zhǔn)。使用一個未知社區(qū)開發(fā)的開源代碼會在這方面產(chǎn)生一定的風(fēng)險。為了安全起見,公司需要在內(nèi)部檢查代碼以確定其質(zhì)量。由于大量的代碼,這項(xiàng)任務(wù)非常勞動密集,并且產(chǎn)生了幾乎無法計(jì)算的成本。然而,使用專有的商業(yè)解決方案,公司可以從高質(zhì)量、經(jīng)過測試和安全的代碼中獲益。如果需要支持的話,專業(yè)顧問和專家是可以利用的,這在開放的社區(qū)中是不可指望的。
結(jié)論
在數(shù)字化時代和工業(yè)物聯(lián)網(wǎng)時代,機(jī)器視覺是高度自動化和網(wǎng)絡(luò)化生產(chǎn)過程中不可或缺的伴隨技術(shù)?;贏I的技術(shù),如深度學(xué)習(xí)和CNN,是這些機(jī)器視覺解決方案的重要組成部分。但是,請務(wù)必記住它們僅適用于某些應(yīng)用程序。公司還應(yīng)該仔細(xì)考慮開源系統(tǒng)是否足以滿足他們的要求,或者是否值得花時間投資商業(yè)的專有軟件解決方案。
-
機(jī)器視覺
+關(guān)注
關(guān)注
162文章
4399瀏覽量
120494 -
人工智能
+關(guān)注
關(guān)注
1792文章
47514瀏覽量
239245 -
深度學(xué)習(xí)
+關(guān)注
關(guān)注
73文章
5510瀏覽量
121345
原文標(biāo)題:用于目標(biāo)識別的自學(xué)習(xí)機(jī)器視覺系統(tǒng)
文章出處:【微信號:vision263com,微信公眾號:新機(jī)器視覺】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
相關(guān)推薦
評論