著名華人計(jì)算機(jī)視覺專家、斯坦福大學(xué)副教授李飛飛曾經(jīng)講過,“希望可以說服做機(jī)器人研究的朋友,(計(jì)算機(jī))視覺是機(jī)器人的殺手級應(yīng)用。”
隨著機(jī)器人研究的發(fā)展和“越來越接近人類”這個(gè)目標(biāo)的進(jìn)一步深入,越來越多的學(xué)者和從業(yè)者更深刻認(rèn)識到了計(jì)算機(jī)視覺對機(jī)器人整個(gè)行業(yè)發(fā)展的重要性。
機(jī)器人視覺系統(tǒng)是指用計(jì)算機(jī)來實(shí)現(xiàn)人的視覺功能,也就是用計(jì)算機(jī)來實(shí)現(xiàn)對客觀的三維世界的識別。機(jī)器人視覺主要研究用計(jì)算機(jī)來模擬人的視覺功能從客觀事物的圖像中提取信息,進(jìn)行處理并加以理解,最終用于實(shí)際檢測、測量和控制。
機(jī)器人視覺的發(fā)展
機(jī)器人視覺系統(tǒng)經(jīng)歷了三代的發(fā)展:
第一代機(jī)器人視覺的功能一般是按規(guī)定流程對圖像進(jìn)行處理并輸出結(jié)果。這種系統(tǒng)一般由普通數(shù)字電路搭成,主要用于平板材料的缺陷檢測。
第二代機(jī)器人視覺系統(tǒng)一般由一臺計(jì)算機(jī),一個(gè)圖像輸入設(shè)備和結(jié)果輸出硬件構(gòu)成。視覺信息在機(jī)內(nèi)以串行方式流動,有一定學(xué)習(xí)能力以適應(yīng)各種新情況。
第三代機(jī)器人視覺系統(tǒng)是目前國際上正在開發(fā)使用的系統(tǒng)。采用高速圖像處理芯片,并行算法,具有高度的智能和普通的適應(yīng)性,能模擬人的高度視覺功能。
機(jī)器人視覺目前存在的主要問題
1、如何準(zhǔn)確、高速(實(shí)時(shí))地識別出目標(biāo)。
2、如何有效地構(gòu)造和組織出可靠的識別算法,并且順利地實(shí)現(xiàn)。這期待著高速的陣列處理單元,以及算法(如神經(jīng)網(wǎng)絡(luò)法、小波變換等算法)的新突破,這樣就可以用極少的計(jì)算量高度地并行實(shí)現(xiàn)功能。
3、實(shí)時(shí)性是一個(gè)難以解決的重要問題。圖像采集速度較低以及圖像處理需要較長時(shí)間給系統(tǒng)帶來明顯的時(shí)滯,此外視覺信息的引入也明顯增大了系統(tǒng)的計(jì)算量,例如計(jì)算圖像雅可比矩陣、估計(jì)深度信息等等。圖像處理速度是影響視覺系統(tǒng)實(shí)時(shí)性的主要瓶頸之一。
4、穩(wěn)定性是所有控制系統(tǒng)首先考慮的問題,對于視覺控制系統(tǒng),無論是基于位置、基于圖像或者混合的視覺伺服方法都面臨著如下問題:當(dāng)初始點(diǎn)遠(yuǎn)離目標(biāo)點(diǎn)時(shí),如何保證系統(tǒng)的穩(wěn)定性,即增大穩(wěn)定區(qū)域和保證全局收斂;為了避免伺服失敗,如何保證特征點(diǎn)始終處在視場內(nèi)。
機(jī)器人視覺應(yīng)當(dāng)進(jìn)一步研究的問題
1.圖像特征的選擇問題。視覺伺服的性能密切依賴于所用的圖像特征,特征的選擇不僅要考慮識別的指標(biāo),還要考慮控制指標(biāo)。從控制的觀點(diǎn)看,用冗余特征可抑制噪聲的影響,提高視覺伺服的性能,但又會給圖像處理增加難度。因此如何選擇性能最優(yōu)的特征,如何處理特征以及如何評價(jià)特征,都是需要進(jìn)一步研究的問題。針對任務(wù)有時(shí)可能需要從一套特征切換到另一套,可以考慮把全局特征與局部特征結(jié)合起來。
2.結(jié)合計(jì)算機(jī)視覺及圖像處理的研究成果,建立機(jī)器人視覺系統(tǒng)的專用軟件庫。
3.加強(qiáng)系統(tǒng)的動態(tài)性能研究。目前的研究多集中于根據(jù)圖像信息確定期望的機(jī)器人運(yùn)動這一環(huán)節(jié)上,而對整個(gè)視覺伺服系統(tǒng)的動態(tài)性能缺乏研究。
4.利用智能技術(shù)的成果。
5.利用主動視覺的成果。主動視覺是當(dāng)今計(jì)算機(jī)視覺和機(jī)器人視覺研究領(lǐng)域中的一個(gè)熱門課題。它強(qiáng)調(diào)的是視覺系統(tǒng)與其所處環(huán)境之間的交互作用能力。
與傳統(tǒng)的通用視覺不同,主動視覺強(qiáng)調(diào)兩點(diǎn),一是認(rèn)為視覺系統(tǒng)應(yīng)具有主動感知的能力,二是認(rèn)為視覺系統(tǒng)應(yīng)基于一定的任務(wù)(TaskDirected)或目的(PurposiveDirected)。
主動視覺認(rèn)為在視覺信息獲取過程中,應(yīng)更主動地調(diào)整攝像機(jī)的參數(shù),如方向、焦距、孔徑等并能使攝像機(jī)迅速對準(zhǔn)感興趣的物體。更一般地,它強(qiáng)調(diào)注視機(jī)制(Attention),強(qiáng)調(diào)對分布于不同空間范圍和時(shí)間段上的信號采用不同的分辨率有選擇性地感知,這種主動感知既可在硬件層上通過攝像機(jī)物理參數(shù)的調(diào)整實(shí)現(xiàn),也可以在基于被動攝像機(jī)的前提下,在算法和表示層上通過對已獲得的數(shù)據(jù)有選擇性地處理實(shí)現(xiàn)。
同時(shí),主動視覺認(rèn)為不基于任何目的的視覺過程是毫無意義的,必須將視覺系統(tǒng)與具有的目的(如導(dǎo)航、識別、操作等)相聯(lián)系,從而形成感知/作用環(huán)(Perception/ActionCycle)。
6.多傳感器融合問題。視覺傳感器具有一定的使用范圍,如能有效地結(jié)合其它傳感器,利用它們之間性能互補(bǔ)的優(yōu)勢,便可以消除不確定性,取得更加可靠、準(zhǔn)確的結(jié)果。
給機(jī)器人加上一雙讀懂世界的“慧眼”是機(jī)器人的重要發(fā)展方向,也是先步信息的技術(shù)布局重點(diǎn)。
-
機(jī)器人
+關(guān)注
關(guān)注
211文章
28557瀏覽量
207672 -
機(jī)器視覺
+關(guān)注
關(guān)注
162文章
4396瀏覽量
120476
原文標(biāo)題:?【干貨】一文讀懂機(jī)器人視覺存在的問題及研究方向
文章出處:【微信號:vision263com,微信公眾號:新機(jī)器視覺】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
相關(guān)推薦
評論