顧名思義,機(jī)器視覺(jué)的核心價(jià)值,就是代替人眼和人腦對(duì)圖像和視頻信息作出感知和分析判斷。雖然機(jī)器視覺(jué)不算一個(gè)新概念,卻在過(guò)去的10年中獲得了高速的發(fā)展,且在可以預(yù)見(jiàn)的未來(lái)仍然保持相當(dāng)?shù)募铀俣?。機(jī)器視覺(jué)這樣一種發(fā)展態(tài)勢(shì),得益于三個(gè)因素。
第一個(gè)因素就是摩爾定律。從硬件的角度來(lái)看,一個(gè)機(jī)器視覺(jué)系統(tǒng)包含兩個(gè)核心的器件:一個(gè)是CMOS圖像傳感器(攝像頭),一個(gè)是處理器。而這兩者都是可以通過(guò)標(biāo)準(zhǔn)CMOS半導(dǎo)體工藝制造的,因此也就被套上了摩爾定律的的“魔咒”,在似乎永無(wú)止境的追求“三低一高”(低功耗、低成本、小尺寸、高性能)的征途上一路狂奔,不斷拉低機(jī)器視覺(jué)的獲取成本。想一想今天一個(gè)入門級(jí)手機(jī)攝像頭的分辨率,可能和幾年前中高端單反相機(jī)圖像傳感器的級(jí)別相當(dāng),這恐怕就是用戶對(duì)摩爾定律作用最直觀的感受了。
摩爾定律同樣在推動(dòng)處理器性能的提升,使其完全可以勝任復(fù)雜的圖像處理計(jì)算。在處理器硬件架構(gòu)的選擇上,今天機(jī)器視覺(jué)的開(kāi)發(fā)者有多種選擇:可以選擇專門為圖像處理優(yōu)化的DSP;也可以選擇采用ARM+GPU或其他圖像協(xié)處理器的平臺(tái);還有基于ARM+FPGA可編程邏輯的異構(gòu)處理架構(gòu)(如Xilinx Zynq 7000)可供使用。即使是主流的ARM通用處理器平臺(tái),配合優(yōu)化的軟件算法,同樣可以在很多機(jī)器視覺(jué)應(yīng)用中施展拳腳。想要獲得性價(jià)比更高的機(jī)器視覺(jué)處理器,對(duì)用戶來(lái)說(shuō)只是一個(gè)時(shí)間問(wèn)題。
推動(dòng)機(jī)器視覺(jué)快速發(fā)展的第二個(gè)因素,就是日益豐富的算法和軟件資源??梢哉f(shuō)被摩爾定律“綁架”了的硬件降低了機(jī)器視覺(jué)的使用門檻,但想真正讓機(jī)器像“人眼+人腦”一樣運(yùn)轉(zhuǎn)起來(lái),甚至更高能和高效地運(yùn)轉(zhuǎn),就必須要有軟件的配合。在上個(gè)世紀(jì),做機(jī)器視覺(jué)的算法和軟件,絕對(duì)是一個(gè)燒腦的工作,公司里沒(méi)有幾個(gè)Ph.D是不敢開(kāi)張的。這樣的局面從2000年起發(fā)生了改變——那一年Intel發(fā)布了OpenCV,這是一個(gè)基于BSD許可的開(kāi)源跨平臺(tái)計(jì)算機(jī)視覺(jué)庫(kù),開(kāi)發(fā)者通過(guò)一系列C/C++函數(shù)可以方便地實(shí)現(xiàn)很多圖像和視覺(jué)處理方面的通用算法。從那時(shí)起,基于不斷更新的OpenCV庫(kù),演化出了為不同機(jī)器視覺(jué)應(yīng)用而優(yōu)化的功能和算法,且更容易在嵌入式處理器中移植和運(yùn)行,由此逐漸形成了完備的機(jī)器視覺(jué)軟件生態(tài)系統(tǒng)。與此同時(shí),很多商業(yè)版的軟件開(kāi)發(fā)工具也開(kāi)始將視覺(jué)處理功能集成在其中,令機(jī)器視覺(jué)的應(yīng)用開(kāi)發(fā)更加觸手可及。
圖1,安富利提供的Blackfin嵌入式視覺(jué)學(xué)習(xí)開(kāi)發(fā)套件,包括完整的硬件和軟件資源,可以幫助機(jī)器視覺(jué)開(kāi)發(fā)者快速上手
可以說(shuō),硬件和軟件生態(tài)環(huán)境的成熟,造就了過(guò)去十年機(jī)器視覺(jué)版圖的快速擴(kuò)張。而接下來(lái),變得更加“智能”,則是機(jī)器視覺(jué)發(fā)展的核心訴求。在這個(gè)過(guò)程中,第三個(gè)要素將發(fā)揮至關(guān)重要的作用,它就是“人工智能”。利用深度學(xué)習(xí)等人工智能的核心技術(shù),機(jī)器視覺(jué)將獲得自我學(xué)習(xí)演化、不斷迭代增強(qiáng)的能力,越用越“聰明”。
人工智能與機(jī)器視覺(jué)相結(jié)合,比較經(jīng)典的做法就是將采集到的數(shù)據(jù)傳輸?shù)皆贫?,在云端?xùn)練出一個(gè)具有數(shù)據(jù)分析判斷和自我學(xué)習(xí)進(jìn)化能力的最強(qiáng)“大腦”。與此同時(shí),今天也有人在考慮,依托性能日益強(qiáng)大的機(jī)器視覺(jué)終端的能力,直接對(duì)終端進(jìn)行訓(xùn)練,讓深度學(xué)習(xí)的算法在終端產(chǎn)品上落地,以獲得更好的實(shí)時(shí)、準(zhǔn)確率、可靠性,也避免了在云端可能存在的隱私安全等方面的問(wèn)題。無(wú)論是哪種思路,其成功的應(yīng)用,無(wú)疑都會(huì)對(duì)機(jī)器視覺(jué)的未來(lái)產(chǎn)生深遠(yuǎn)的影響。
總之,在機(jī)器的世界里,人類眼睛的工作——至少是部分工作——已經(jīng)成了簡(jiǎn)單重復(fù)性的“力氣活兒”,在諸多要素的合力下,機(jī)器視覺(jué)代替甚至超越人類視覺(jué)的進(jìn)程,已經(jīng)停不下來(lái)了。
-
摩爾定律
+關(guān)注
關(guān)注
4文章
636瀏覽量
79196 -
機(jī)器視覺(jué)
+關(guān)注
關(guān)注
162文章
4405瀏覽量
120613
原文標(biāo)題:港真:你能“看見(jiàn)”的,比你看見(jiàn)的多得多!
文章出處:【微信號(hào):AvnetAsia,微信公眾號(hào):安富利】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
評(píng)論