人們通過感官從自然界獲取各種信息,其中以人的視覺獲取的信息量最多,約占信息總量的80%。隨著信息技術(shù)的發(fā)展,為計(jì)算機(jī)、機(jī)器人或其他智能機(jī)器賦予人類視覺功能,成為科學(xué)家們的奮斗目標(biāo)。目前,機(jī)器視覺技術(shù)已經(jīng)實(shí)現(xiàn)了產(chǎn)品化、實(shí)用化,鏡頭、高速相機(jī)、光源、圖像軟件、圖像采集卡、視覺處理器等相關(guān)產(chǎn)品功能日益完善。機(jī)器視覺領(lǐng)域新技術(shù)爆出,通用式三維即時(shí)視覺傳感技術(shù)將為機(jī)器視覺再添濃墨重彩的一筆。
什么是機(jī)器視覺?
美國機(jī)器人工業(yè)協(xié)會(huì)(RIA Robotic Industries Association)?對(duì)機(jī)器視覺下的定義為:“機(jī)器視覺是通過光學(xué)的裝置和非接觸的傳感器自動(dòng)地接收和處理一個(gè)真實(shí)物體的圖像,以獲得所需信息或用于控制機(jī)器人運(yùn)動(dòng)的裝置”。
機(jī)器視覺就是用機(jī)器代替人眼來做測(cè)量和判斷。機(jī)器視覺系統(tǒng)是指通過機(jī)器視覺產(chǎn)品(即圖像攝取裝置,分CMOS?和CCD兩種)將被攝取目標(biāo)轉(zhuǎn)換成圖像信號(hào),傳送給專用的圖像處理系統(tǒng),根據(jù)像素分布和亮度、顏色等信息,轉(zhuǎn)變成數(shù)字化信號(hào);圖像系統(tǒng)對(duì)這些信號(hào)進(jìn)行各種運(yùn)算來抽取目標(biāo)的特征,進(jìn)而根據(jù)判別的結(jié)果來控制現(xiàn)場(chǎng)的設(shè)備動(dòng)作。
機(jī)器視覺系統(tǒng)的組成
相機(jī)與鏡頭
這部分屬于成像器件,通常的視覺系統(tǒng)都是由一套或者多套這樣的成像系統(tǒng)組成,如果有多路相機(jī),可能由圖像卡切換來獲取圖像數(shù)據(jù),也可能由同步控制同時(shí)獲取多相機(jī)通道的數(shù)據(jù)。根據(jù)應(yīng)用的需要相機(jī)可能是輸出標(biāo)準(zhǔn)的單色視頻(RS-170/CCIR)、復(fù)合信號(hào)(Y/C)、RGB信號(hào),也可能是非標(biāo)準(zhǔn)的逐行掃描信號(hào)、線掃描信號(hào)、高分辨率信號(hào)等。
光源
作為輔助成像器件,對(duì)成像質(zhì)量的好壞往往能起到至關(guān)重要的作用,各種形狀的LED燈、高頻熒光燈、光纖鹵素?zé)舻榷既菀椎玫健?/p>
傳感器
通常以光纖開關(guān)、接近開關(guān)等的形式出現(xiàn),用以判斷被測(cè)對(duì)象的位置和狀態(tài),告知圖像傳感器進(jìn)行正確的采集。
圖像采集卡
通常以插入卡的形式安裝在PC中,圖像采集卡的主要工作是把相機(jī)輸出的圖像輸送給電腦主機(jī)。它將來自相機(jī)的模擬或數(shù)字信號(hào)轉(zhuǎn)換成一定格式的圖像數(shù)據(jù)流,同時(shí)它可以控制相機(jī)的一些參數(shù),比如觸發(fā)信號(hào),曝光/積分時(shí)間,快門速度等。圖像采集卡通常有不同的硬件結(jié)構(gòu)以針對(duì)不同類型的相機(jī),同時(shí)也有不同的總線形式,比如PCI、PCI64、Compact PCI,PC104,ISA等。
PC平臺(tái)
電腦是一個(gè)PC式視覺系統(tǒng)的核心,在這里完成圖像數(shù)據(jù)的處理和絕大部分的控制邏輯,對(duì)于檢測(cè)類型的應(yīng)用,通常都需要較高頻率的CPU,這樣可以減少處理的時(shí)間。同時(shí),為了減少工業(yè)現(xiàn)場(chǎng)電磁、振動(dòng)、灰塵、溫度等的干擾,必須選擇工業(yè)級(jí)的電腦。
視覺處理軟件
機(jī)器視覺軟件用來完成輸入的圖像數(shù)據(jù)的處理,然后通過一定的運(yùn)算得出結(jié)果,這個(gè)輸出的結(jié)果可能是PASS/FAIL信號(hào)、坐標(biāo)位置、字符串等。常見的機(jī)器視覺軟件以C/C++圖像庫,ActiveX控件,圖形式編程環(huán)境等形式出現(xiàn),可以是專用功能的(比如僅僅用于LCD檢測(cè),BGA檢測(cè),模版對(duì)準(zhǔn)等),也可以是通用目的的(包括定位、測(cè)量、條碼/字符識(shí)別、斑點(diǎn)檢測(cè)等)。
控制單元(包含I/O、運(yùn)動(dòng)控制、電平轉(zhuǎn)化單元等)
一旦視覺軟件完成圖像分析(除非僅用于監(jiān)控),緊接著需要和外部單元進(jìn)行通信以完成對(duì)生產(chǎn)過程的控制。簡單的控制可以直接利用部分圖像采集卡自帶的I/O,相對(duì)復(fù)雜的邏輯/運(yùn)動(dòng)控制則必須依靠附加可編程邏輯控制單元/運(yùn)動(dòng)控制卡來實(shí)現(xiàn)必要的動(dòng)作。
機(jī)器視覺的特點(diǎn)
精確性
由于人眼有物理?xiàng)l件的限制,在精確性上機(jī)器有明顯的優(yōu)點(diǎn)。即使人眼依靠放大鏡或顯微鏡來檢測(cè)產(chǎn)品,機(jī)器仍然會(huì)更加精確,因?yàn)樗木饶軌蜻_(dá)到千分之一英寸。
重復(fù)性
機(jī)器可以以相同的方法一次一次的完成檢測(cè)工作而不會(huì)感到疲倦。與此相反,人眼每次檢測(cè)產(chǎn)品時(shí)都會(huì)有細(xì)微的不同,即使產(chǎn)品時(shí)完全相同的。
速度
機(jī)器能夠更快的檢測(cè)產(chǎn)品。特別是當(dāng)檢測(cè)高速運(yùn)動(dòng)的物體時(shí),比如說生產(chǎn)線上,機(jī)器能夠提高生產(chǎn)效率。
客觀性
人眼檢測(cè)還有一個(gè)致命的缺陷,就是情緒帶來的主觀性,檢測(cè)結(jié)果會(huì)隨工人心情的好壞產(chǎn)生變化,而機(jī)器沒有喜怒哀樂,檢測(cè)的結(jié)果自然非??捎^可靠。
成本
由于機(jī)器比人快,一臺(tái)自動(dòng)檢測(cè)機(jī)器能夠承擔(dān)好幾個(gè)人的任務(wù)。而且機(jī)器不需要停頓、不會(huì)生病、能夠連續(xù)工作,所以能夠極大的提高生產(chǎn)效率。
視覺傳感器的工作原理
視覺傳感器是指通過對(duì)攝像機(jī)拍攝到的圖像進(jìn)行圖像處理,來計(jì)算對(duì)象物的特征量(面積、重心、長度、位置等),并輸出數(shù)據(jù)和判斷結(jié)果的傳感器。
視覺傳感器具有從一整幅圖像捕獲光線的數(shù)以千計(jì)的像素。圖像的清晰和細(xì)膩程度通常用分辨率來衡量,以像素?cái)?shù)量表示。因此,無論距離目標(biāo)數(shù)米或數(shù)厘米遠(yuǎn),傳感器都能“看到”十分細(xì)膩的目標(biāo)圖像。
在捕獲圖像之后,鼎納視覺傳感器將其與內(nèi)存中存儲(chǔ)的基準(zhǔn)圖像進(jìn)行比較,以做出分析。
視覺傳感器是機(jī)器視覺系統(tǒng)的核心,是提取環(huán)境特征最多的信息源。它既要容納進(jìn)行輪廓測(cè)量的各種光學(xué)、機(jī)械、電子、敏感器等各方面的元器件,又要體積小、重量輕。
視覺傳感器包括激光器、掃描電動(dòng)機(jī)及掃描機(jī)構(gòu)、角度傳感器、線性CCD敏感器及其驅(qū)動(dòng)板和各種光學(xué)組件。
視覺傳感器的發(fā)展歷程
視覺傳感器是50年代后期出現(xiàn),發(fā)展十分迅速,是機(jī)器人中最重要的傳感器之一。機(jī)器人視覺從60年代開始首先處理積木世界,后來發(fā)展到處理桌子、椅子、臺(tái)燈等室內(nèi)景物,進(jìn)而處理室外的現(xiàn)實(shí)世界。70年代后,有些實(shí)用性的視覺系統(tǒng)出現(xiàn)了,如應(yīng)用于集成電路生產(chǎn)、精密電子產(chǎn)品裝配、飲料罐裝箱場(chǎng)合的檢驗(yàn)、定位等。另外,隨著這門學(xué)科的發(fā)展,一些先進(jìn)的思想在人工智能、心理學(xué)、計(jì)算機(jī)圖形學(xué)、圖形處理等領(lǐng)域產(chǎn)生出來。
機(jī)器視覺的作用是從三維環(huán)境圖像中獲得所需的信息并構(gòu)造出觀察對(duì)象的明確而有意義的描述,視覺包括三個(gè)過程:圖像獲取、圖像處理和圖像理解。圖像獲取通過視覺傳感器將三維環(huán)境圖像轉(zhuǎn)換為電信號(hào);圖像處理是指圖像到圖像的一種變換,如特征提?。粓D像理解則在處理的基礎(chǔ)上給出環(huán)境描述。視覺傳感器的核心器件是攝像管或CCD,攝像管是早期產(chǎn)品。OzD是后發(fā)展起來的。目前的CCD已能做到自動(dòng)聚焦。
視覺傳感器的實(shí)現(xiàn)方式
視覺傳感器是非接觸型的。它是電視攝像機(jī)等技術(shù)的綜合,是機(jī)器人眾多傳感器中最穩(wěn)定的傳感器。
機(jī)器人的視覺傳感器有下述三種測(cè)量方式
一、直接處理電視攝像機(jī)所攝取的深淺圖像亮度6分圖像的深淺圖像處理方式。把亮度信息數(shù)字化,通常為4-10比特左右,作為64×64-1024×1024個(gè)象素輸出處理部分。然后,利用種種已知算法,為線條進(jìn)行解釋,識(shí)別被加工物。這種圖像處理法的困難是需要處理龐大的輸出數(shù)據(jù),費(fèi)時(shí)太多。作為機(jī)器人的視覺,往往簡化成雙值,再利用專用處理裝置快速處理。
二、把深淺圖像雙值化再處理方式。
三、根據(jù)距離信息測(cè)量物體的開關(guān)和位置的方式。該方法采用的方案有采用三角測(cè)量法和利用兩臺(tái)電視攝像機(jī)的立體視覺法等多種方案。
1、三角測(cè)量法測(cè)量原理及方法 ?
激光束投射到物體上,跟蹤源敏感器件檢測(cè)其漫反射光,如圖一所示。。
如果線陣敏感器件(如線陣CCD)放置的位置合適,物體上的激光點(diǎn)能清晰地在敏感器件上成像,那么橫向的分辨率就只取決于激光束的寬度(亦即粗細(xì)),而激光束的寬度可通過適當(dāng)?shù)墓鈱W(xué)方法調(diào)整得較細(xì)。為了獲取深度及橫向的信息,可采用兩種方法。
其一是將光束擴(kuò)展成一個(gè)光面投射到物體上,用一面陣數(shù)字敏感器件進(jìn)行接收。為了快速測(cè)量距?離,使通過垂直狹縫得到的條形光束投到被加工物體上,再利用電視攝像機(jī)檢測(cè)狹縫的像,圖二表示其結(jié)構(gòu)。如果知道狹縫光的投影方向和狹縫隙象,那么根據(jù)三角測(cè)量原理就可以知道到物體表面的距離。利用掃描線為256條的電視攝像機(jī),每1/60s內(nèi)可得到256個(gè)點(diǎn)的距離,能測(cè)量電視攝像機(jī)畫面內(nèi)多數(shù)點(diǎn)的距離。
其二是發(fā)射光束和接收光繞虛線所示的轉(zhuǎn)軸同步轉(zhuǎn)動(dòng),線陣敏感器測(cè)出徑向深度信息,而和掃描機(jī)構(gòu)一起的角度傳感器測(cè)出角度信息。這種方法的優(yōu)點(diǎn)是能得到很高的信噪比,因?yàn)樵诿舾衅骷泄鈺r(shí)間內(nèi),光強(qiáng)集中于一點(diǎn)而不是散成一條線,能使所有的光電在敏感器上清晰成像,同時(shí)信號(hào)處理速度較快。
其三是利用激光跟蹤器,向任意方向投射激光,把物體表面的激光點(diǎn)作為畫面的最亮點(diǎn),然后利用攝像機(jī)檢測(cè),再根據(jù)三角測(cè)量原理,可快速進(jìn)行距離測(cè)量。對(duì)基于激光同步掃描測(cè)量原理的機(jī)械機(jī)構(gòu)和光學(xué)結(jié)構(gòu)進(jìn)行了優(yōu)化設(shè)計(jì),并采用了一些微型元件,構(gòu)成機(jī)器人設(shè)計(jì)傳感器,其結(jié)構(gòu)原理如圖三所示。??
2、立體視覺法
眼睛就像一臺(tái)機(jī)能完善、結(jié)構(gòu)精巧的信息處理機(jī),處理外界進(jìn)入大腦的90%以上的信息。盡管人們已經(jīng)制造出照相機(jī)、望遠(yuǎn)鏡、光電管等這些非凡的“人造眼”.圖三傳感器結(jié)構(gòu)原理圖但科學(xué)還得向生物界的原始構(gòu)造物——眼睛求教,進(jìn)一步探索它的奧秘,取其優(yōu)點(diǎn)為人類所用。
1)、眼立體視覺機(jī)理
在大腦視覺區(qū)域的細(xì)胞中,有些細(xì)胞對(duì)雙眼的刺激都有反應(yīng),將這種有反應(yīng)的細(xì)胞稱為雙眼性細(xì)胞。大腦視區(qū)的大部分細(xì)胞都是雙眼性細(xì)胞,這些細(xì)胞對(duì)左右眼一般具有幾乎特性相同的感受野。雙眼性細(xì)胞左右視網(wǎng)膜上感受的位置,若投影到視野上,其位置并不完全一致,每個(gè)細(xì)胞逐次稍微偏離一點(diǎn),這種感受野對(duì)雙眼立體信息的提取有重要作用。如圖四所示,有3個(gè)雙眼性細(xì)胞A、B、C,它們的左右感受野之間有不同的差異度,在圖示的屏幕上給予刺激,這些細(xì)胞感受野的中心位置,在左眼視網(wǎng)膜上重疊為一點(diǎn),但在右眼視網(wǎng)膜上各有不同的位置,或者說,左眼的感受野在同一軸線上,右眼的感受野則在3個(gè)不同的視軸上。還有一些雙眼性細(xì)胞,對(duì)單眼刺激幾乎不起反應(yīng),但對(duì)雙眼刺激所引起的反應(yīng)的促進(jìn)作用卻非常明顯,并且給予雙眼刺激的位移量適當(dāng)時(shí),才有輸出。這樣的細(xì)胞在三維空間中,只有在離眼睛特定的地點(diǎn)放置光刺激時(shí),才能強(qiáng)烈反應(yīng),故可稱為雙眼性深度檢測(cè)細(xì)胞。???
生物視覺系統(tǒng)擁有大量的光敏元件,即視網(wǎng)膜視桿細(xì)胞和視錐細(xì)胞,由于視神經(jīng)纖維比視網(wǎng)膜的光敏元件少,故兩者不可能一一對(duì)應(yīng)。因?yàn)橐曈X信息傳導(dǎo)到神經(jīng)以前發(fā)生了某種平行加工,這種預(yù)加工是通過實(shí)時(shí)反映系統(tǒng)把圖形的重要特征迅速地提取出來。
2)、分層模型 ?
許多人提出了信息加工的分層模型,最著名的是馬爾科(Marko)提出的分層模型。
第一層是感受層;
第二層是由4個(gè)平行加工的、分別抽提出垂直、水平和2條對(duì)角線方向的方向濾波器組成;
第三層包含3條線條濾波器平行的組合,而分別得到曲率、角度、端點(diǎn)和交點(diǎn)的檢測(cè)器;
第四層在所謂拓?fù)渥儞Q的抽提中,圖像面壓縮成一個(gè)點(diǎn),這個(gè)點(diǎn)表示該圖像的某個(gè)總體特征。????
可以看出分層模型既考慮了分層的串連結(jié)構(gòu),也考慮了各通路的平行并聯(lián)結(jié)構(gòu),因此雙眼視覺具有強(qiáng)大的并行處理能力。
由于外部場(chǎng)景都是三維的,因此希望智能機(jī)器人的外傳感器能提供有關(guān)外部場(chǎng)景的三維立體信息。為達(dá)此目的,人仍從不同的角度對(duì)三維立體信息的獲取進(jìn)行了研究,采用立體視覺方法獲得外部場(chǎng)景的三維深度圖像。????
3)、三維視覺系統(tǒng)及數(shù)學(xué)模型結(jié)構(gòu)
三維視覺系統(tǒng)由CCD面陣攝像機(jī)、結(jié)構(gòu)激光投影器、圖像接口、圖像處理與分析軟件及PC機(jī)組成。視覺傳感器由攝像機(jī)與結(jié)構(gòu)激光投影器組成,二者剛性固定,結(jié)構(gòu)激光投影器產(chǎn)生的光學(xué)模式為20y,X10lyl及zZl5個(gè)空間方向不同的光面。
光電傳感器與視覺傳感器的比較
與光電傳感器相比,視覺傳感器賦予機(jī)器設(shè)計(jì)者更大的靈活性。以往需要多個(gè)光電傳感器的應(yīng)用,現(xiàn)在可以用一個(gè)視覺傳感器來檢驗(yàn)多項(xiàng)特征。視覺傳感器能夠檢驗(yàn)大得多的面積,并實(shí)現(xiàn)了更佳的目標(biāo)位置和方向靈活性。這使視覺傳感器在某些原先只有依靠光電傳感器才能解決的應(yīng)用中受到廣泛歡迎。在傳統(tǒng)上,這些應(yīng)用還需要昂貴的配件,以及能夠確保目標(biāo)物體始終以同一位置和姿態(tài)出現(xiàn)的精確運(yùn)動(dòng)控制。
此外,由于一個(gè)基本視覺傳感器的成本僅相當(dāng)于數(shù)個(gè)具有較貴配件的光電傳感器,因此價(jià)格已不再是問題。
視覺傳感器為應(yīng)用的切換提供了無與倫比的靈活性。例如,生產(chǎn)工序的切換(從單份裝酸奶切換成冰淇淋桶)可能僅需數(shù)秒鐘,并且可遙控完成。附加的檢驗(yàn)條件可輕松地添加到此應(yīng)用中。
機(jī)器視覺及視覺傳感器的應(yīng)用
只要是需要對(duì)物體進(jìn)行識(shí)別、特征判斷和檢測(cè),機(jī)器視覺就可以大展拳腳。如今,在農(nóng)業(yè)、工業(yè)、醫(yī)學(xué)等領(lǐng)域,機(jī)器視覺技術(shù)因其非接觸、速度快、精度高、現(xiàn)場(chǎng)抗干擾能力強(qiáng)等突出優(yōu)點(diǎn),得到了廣泛應(yīng)用
近幾十年來,機(jī)器視覺因其非接觸、速度快、精度高、現(xiàn)場(chǎng)抗干擾能力強(qiáng)等突出優(yōu)點(diǎn),使機(jī)器視覺技術(shù)在農(nóng)業(yè)、工業(yè)、醫(yī)學(xué)等領(lǐng)域得到了廣泛應(yīng)用。只要是需要對(duì)物體進(jìn)行識(shí)別、特征判斷和檢測(cè),機(jī)器視覺就可以大展拳腳,將任務(wù)完成得又快又好。
比如在農(nóng)業(yè)生產(chǎn)中,有一部分工作是對(duì)農(nóng)作物或農(nóng)產(chǎn)品的外觀進(jìn)行判斷,如水果品質(zhì)檢測(cè)、果實(shí)成熟度判別、作物生長狀況以及雜草的識(shí)別等。這些過去主要依靠人的視覺進(jìn)行辨別和判斷的工作可以由機(jī)器視覺技術(shù)部分或全部替代,從而實(shí)現(xiàn)農(nóng)業(yè)自動(dòng)化和智能化。例如,來自南京林業(yè)大學(xué)的黃秀玲團(tuán)隊(duì)就設(shè)計(jì)了一條可以對(duì)蘋果品質(zhì)進(jìn)行動(dòng)態(tài)、實(shí)時(shí)檢測(cè)的智能化分級(jí)生產(chǎn)線。生產(chǎn)線上,均勻分布的3個(gè)攝像頭一次性采集蘋果表面信息,通過計(jì)算機(jī)智能控制系統(tǒng)對(duì)采集信息進(jìn)行綜合分析,從而對(duì)蘋果進(jìn)行分級(jí)。不過,也有專家表示,由于農(nóng)田環(huán)境的復(fù)雜多變性以及非結(jié)構(gòu)化特性,目前機(jī)器視覺在農(nóng)業(yè)生產(chǎn)中的應(yīng)用尚不成熟,仍需進(jìn)一步完善。
在工業(yè)環(huán)境中,機(jī)器視覺應(yīng)用日臻成熟,在提高工業(yè)生產(chǎn)靈活性和自動(dòng)化程度方面發(fā)揮重大作用。此外,在危險(xiǎn)工作環(huán)境或人工視覺難以滿足要求的場(chǎng)合,用機(jī)器視覺來替代人工視覺也提高了作業(yè)的安全性。在流水線上通過圖像識(shí)別技術(shù)檢查產(chǎn)品外觀缺損、標(biāo)簽印刷錯(cuò)誤、電路板焊接質(zhì)量缺陷的圖像識(shí)別系統(tǒng)就是機(jī)器視覺系統(tǒng)應(yīng)用于工業(yè)領(lǐng)域的成功范例。印刷包裝、汽車工業(yè)、半導(dǎo)體材料、食品生產(chǎn)等,都是機(jī)器視覺在工業(yè)領(lǐng)域的應(yīng)用方向。
在勘探采集、有色冶煉等過程中,機(jī)器視覺技術(shù)也大有可為。選礦是礦產(chǎn)資源加工中的一個(gè)重要環(huán)節(jié),選礦水平高低直接影響礦物資源回收。近年來,基于機(jī)器視覺的礦物表面特征監(jiān)測(cè)技術(shù)已引起工業(yè)發(fā)達(dá)國家科研機(jī)構(gòu)的高度關(guān)注。資料顯示,歐盟聯(lián)合多家大學(xué)和企業(yè),于2000年啟動(dòng)了“基于機(jī)器視覺的氣泡結(jié)構(gòu)和顏色表征”項(xiàng)目;南非、智利等國家也將機(jī)器視覺應(yīng)用到石墨、鉑金屬的浮選監(jiān)控中。在國內(nèi),對(duì)煤和鎳的浮選監(jiān)控研究也取得了重大進(jìn)展。
機(jī)器視覺技術(shù)還可以應(yīng)用于智能交通、安全防范、醫(yī)療設(shè)備等方面。在醫(yī)學(xué)領(lǐng)域,機(jī)器視覺可以輔助醫(yī)生進(jìn)行醫(yī)學(xué)影像的分析,比如X射線透視圖、核磁共振圖像、CT圖像等。在科學(xué)研究領(lǐng)域,可以利用機(jī)器視覺進(jìn)行材料分析、生物分析、化學(xué)分析和生命科學(xué)分析,如血液細(xì)胞自動(dòng)分類計(jì)數(shù)、染色體分析、癌癥細(xì)胞識(shí)別等。
編輯:黃飛
?
評(píng)論