0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

圖像處理技術(shù)面臨哪些挑戰(zhàn)?

QQ475400555 ? 來源:機(jī)器視覺沙龍 ? 2023-01-13 15:14 ? 次閱讀

當(dāng)人類觀看圖像時(shí),會(huì)感知物體、人物或景觀。當(dāng)機(jī)器“查看”圖像時(shí),他們看到的只是代表單個(gè)像素的數(shù)字。假設(shè)一個(gè)灰度圖像,每個(gè)像素由一個(gè)通常在0到255之間的數(shù)字表示,其中0表示黑色(無顏色),255表示白色(全強(qiáng)度)。0到255之間的任何一個(gè)都是灰色陰影,如下圖所示。

b951f244-7b80-11ed-8abf-dac502259ad0.png

因此,對(duì)于任何要獲取圖像內(nèi)容的機(jī)器來說,它必須以某種方式處理這些數(shù)字。

數(shù)據(jù)量大

正如上面所說,當(dāng)涉及到圖像時(shí),計(jì)算機(jī)得到的是很多數(shù)字,意味著需要大量的處理才能被理解。舉一個(gè)例子來說明圖像的數(shù)據(jù)量究竟有多大。如果是具有1920x1080分辨率的灰度(黑白)圖像,則表示該圖像由200萬個(gè)數(shù)字(1920*1080=2073600像素)描述,如果切換到彩色圖像,則一般需要三倍的數(shù)字。如果試圖分析來自視頻/攝像機(jī)流的圖像,假設(shè)幀率為30幀/秒(標(biāo)準(zhǔn)幀率),則每秒需要處理1.8億個(gè)數(shù)字(3*2073600*30=1.8億像素)。即使如今我們擁有強(qiáng)大的處理器和相對(duì)較大的內(nèi)存,也是一個(gè)巨大的挑戰(zhàn)。更何況如今幾千萬甚至上億像素的Sensor越來越普及,且其幀率更是高達(dá)上百幀/秒。

信息丟失

數(shù)字化過程中的信息丟失是造成計(jì)算機(jī)視覺難度的另一個(gè)主要因素。圖像處理的本質(zhì)是從3D世界(如果處理視頻流中的數(shù)據(jù)則是4D)投影到2D平面(即平面圖像)上獲取信息。這意味著在此過程中會(huì)丟失大量信息。人類的大腦可以非常出色的推斷出丟失的數(shù)據(jù)是什么,但是對(duì)于計(jì)算機(jī)來說卻是極其困難的挑戰(zhàn)。下圖顯示的是一個(gè)凌亂的房間。

人類可以很容易地看出,綠色健身球比桌子上的黑色平底鍋更大更遠(yuǎn)。但是如果黑色平底鍋比綠色球占據(jù)更多的像素,機(jī)器應(yīng)該如何推斷呢?這不是一件容易的事。當(dāng)然,可以嘗試通過同時(shí)拍攝兩張照片并從中提取3D信息來模擬用兩只眼睛看到的方式,這被稱為立體視覺。然而,將圖像拼接在一起也不是一項(xiàng)微不足道的任務(wù),因?yàn)橥瑯邮且粋€(gè)開放的研究領(lǐng)域。

伴隨噪聲

數(shù)字化過程中經(jīng)常伴隨著噪音。例如,沒有相機(jī)會(huì)拍攝出一個(gè)完美的不含噪聲的現(xiàn)實(shí)圖片,特別是當(dāng)用手機(jī)上的相機(jī)進(jìn)行拍照時(shí),他們會(huì)通過調(diào)整強(qiáng)度等級(jí),色彩飽和度等去嘗試捕捉美麗的世界。同時(shí)在圖像拍攝過程中肯能會(huì)出現(xiàn)“鏡頭光暈”的現(xiàn)象,人類可以輕松的判斷光暈后面是什么場(chǎng)景,而對(duì)于計(jì)算機(jī)來說確實(shí)非常困難。 雖然已經(jīng)有很多去除光暈的算法,但是去除光暈的算法本身也是開放的領(lǐng)域。另外,在圖像壓縮的過程中會(huì)對(duì)圖像降低像素或者變換操作,而這樣的圖片對(duì)于人來說可以輕松的識(shí)別,而對(duì)于計(jì)算機(jī),如果不告訴它壓縮變換的操作,它會(huì)當(dāng)作壓縮后的圖像為原圖像進(jìn)行識(shí)別,從而產(chǎn)生錯(cuò)誤。

ba7760f0-7b80-11ed-8abf-dac502259ad0.png

理解圖像含義困難

最后也是最重要的是就是對(duì)圖像內(nèi)容的理解。對(duì)于機(jī)器來說,這絕對(duì)是計(jì)算機(jī)視覺環(huán)境中最難處理的事情。當(dāng)人類觀看圖像時(shí),會(huì)用累積的學(xué)習(xí)和記憶(稱為先驗(yàn)知識(shí))來分析它。例如,人類知道,可以坐在健身球上,而平底鍋通常用在廚房里,因?yàn)檫@些東西過去已經(jīng)了解過。如果有一些東西看起來像天空中的平底鍋,很可能它不是平底鍋,因此可以進(jìn)一步仔細(xì)檢查,以確定對(duì)象可能是什么?;蛘呷绻腥藝G球踢球,很可能是小孩子的球而不是健身球。但機(jī)器沒有這種知識(shí)。他們不了解的世界,不了解其中固有的復(fù)雜性,以及在數(shù)千年的進(jìn)化中創(chuàng)造的眾多工具、商品、設(shè)備等。也許有一天機(jī)器將能夠獲得網(wǎng)絡(luò)并從那里了解有關(guān)對(duì)象的信息,但目前離這種情況很遠(yuǎn)。

編輯:黃飛

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 圖像處理
    +關(guān)注

    關(guān)注

    27

    文章

    1292

    瀏覽量

    56764
  • 計(jì)算機(jī)視覺
    +關(guān)注

    關(guān)注

    8

    文章

    1698

    瀏覽量

    46005

原文標(biāo)題:圖像處理技術(shù)難點(diǎn)

文章出處:【微信號(hào):機(jī)器視覺沙龍,微信公眾號(hào):機(jī)器視覺沙龍】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏

    評(píng)論

    相關(guān)推薦

    淺談大數(shù)據(jù)視頻圖像處理系統(tǒng)技術(shù)

    的發(fā)展帶來機(jī)遇的同時(shí)也帶來了挑戰(zhàn)。視頻圖像處理你了解多少?關(guān)注中國(guó)電子學(xué)會(huì)2013年度盛會(huì)---圖形圖像處理技術(shù)大會(huì)。 好用的
    發(fā)表于 09-24 15:22

    移動(dòng)電視射頻技術(shù)面臨什么挑戰(zhàn)

    隨著數(shù)字移動(dòng)電視不斷向移動(dòng)設(shè)備的應(yīng)用轉(zhuǎn)移,應(yīng)用和系統(tǒng)工程師正面臨著各種挑戰(zhàn),比如外形尺寸的小型化、更低的功耗以及信號(hào)完整性。對(duì)現(xiàn)有移動(dòng)電視標(biāo)準(zhǔn)的研究重點(diǎn)將放在了DVB-H上。本文將從系統(tǒng)角度討論DVB-H接收器設(shè)計(jì)所面臨的機(jī)遇和
    發(fā)表于 06-03 06:28

    LTE測(cè)試技術(shù)面臨什么挑戰(zhàn)

    運(yùn)營(yíng)商建設(shè)LTE網(wǎng)絡(luò)的基本策略之一為L(zhǎng)TE網(wǎng)絡(luò)、2G和3G網(wǎng)絡(luò)將長(zhǎng)期共存,共同發(fā)展,多模、多制式、多頻的融合。LTE網(wǎng)絡(luò)測(cè)試領(lǐng)域也在業(yè)界的持續(xù)努力與實(shí)驗(yàn)網(wǎng)的驗(yàn)證下取得了很大的進(jìn)步。但在多網(wǎng)協(xié)同的發(fā)展方向上,仍面臨諸多挑戰(zhàn),需要進(jìn)一步積極應(yīng)對(duì)。
    發(fā)表于 06-10 07:48

    多點(diǎn)綜合技術(shù)面臨什么挑戰(zhàn)?

    隨著設(shè)計(jì)復(fù)雜性增加,傳統(tǒng)的綜合方法面臨越來越大的挑戰(zhàn)。為此,Synplicity公司開發(fā)了同時(shí)適用于FPGA或 ASIC設(shè)計(jì)的多點(diǎn)綜合技術(shù),它集成了“自上而下”與“自下而上”綜合方法的優(yōu)勢(shì),能提供高結(jié)果質(zhì)量和高生產(chǎn)率,同時(shí)削減存
    發(fā)表于 10-17 06:29

    毫微安電流測(cè)量技術(shù)面臨了哪些挑戰(zhàn)?

    請(qǐng)問毫微安電流測(cè)量技術(shù)面臨挑戰(zhàn)有哪些?
    發(fā)表于 04-09 06:27

    SoC測(cè)試技術(shù)面臨挑戰(zhàn)是什么?其發(fā)展趨勢(shì)如何?

    SoC測(cè)試技術(shù)傳統(tǒng)的測(cè)試方法和流程面臨挑戰(zhàn)是什么?SoC測(cè)試技術(shù)一體化測(cè)試流程是怎樣的?基于光子探測(cè)的SoC測(cè)試技術(shù)是什么?有什么目的?
    發(fā)表于 04-15 06:16

    模擬電路技術(shù)在數(shù)字時(shí)代面臨挑戰(zhàn)有哪些?

    模擬技術(shù)的無可替代的優(yōu)勢(shì)是什么?模擬電路技術(shù)在數(shù)字時(shí)代面臨挑戰(zhàn)有哪些?未來,模擬技術(shù)的發(fā)展趨勢(shì)是什么?與過去相比,目前模擬
    發(fā)表于 04-21 07:11

    基于能量采集技術(shù)的BLE傳感器節(jié)點(diǎn)設(shè)計(jì)面臨哪些挑戰(zhàn)?

    基于能量采集技術(shù)的BLE傳感器節(jié)點(diǎn)設(shè)計(jì)面臨哪些挑戰(zhàn)?如何去應(yīng)對(duì)這些挑戰(zhàn)?
    發(fā)表于 05-17 06:03

    RFID原理是什么?RFID技術(shù)面臨哪些挑戰(zhàn)

    RFID原理是什么?RFID技術(shù)面臨哪些挑戰(zhàn)
    發(fā)表于 05-26 06:06

    無線智能IP監(jiān)控面臨技術(shù)挑戰(zhàn)是什么?怎么解決?

    無線智能IP監(jiān)控面臨技術(shù)挑戰(zhàn)是什么?怎么解決?
    發(fā)表于 05-31 06:27

    多聲道音頻技術(shù)是什么?PC音頻子系統(tǒng)面臨哪些設(shè)計(jì)挑戰(zhàn)?

    多聲道音頻技術(shù)是什么?PC音頻子系統(tǒng)面臨哪些設(shè)計(jì)挑戰(zhàn)?
    發(fā)表于 06-04 07:02

    何謂Full HD?Full HD面臨哪些技術(shù)挑戰(zhàn)?

    何謂Full HD?Full HD面臨哪些技術(shù)挑戰(zhàn)?
    發(fā)表于 06-07 07:14

    ARM應(yīng)對(duì)汽車圖像處理面臨挑戰(zhàn),發(fā)布Mali-C71圖像信號(hào)處理

    ARM今天正式發(fā)布Mali-C71圖像信號(hào)處理器(ISP),應(yīng)對(duì)汽車圖像處理面臨挑戰(zhàn),包括在
    發(fā)表于 04-25 17:30 ?1151次閱讀

    如何解決高光譜圖像分類面臨挑戰(zhàn)

    高光譜圖像的分類面臨著維數(shù)問題、非線性結(jié)構(gòu)問題等諸多挑戰(zhàn),面對(duì)這些挑戰(zhàn),我們有什么辦法去解決嗎?今天,小編給大家整理了以下幾個(gè)方法: 特征挖掘技術(shù)
    的頭像 發(fā)表于 06-29 09:41 ?1536次閱讀

    機(jī)器視覺的圖像處理技術(shù)面臨挑戰(zhàn)

    機(jī)器視覺(Machine Vision)是人工智能領(lǐng)域中發(fā)展迅速的一個(gè)重要分支,目前正處于不斷突破、走向成熟的階段。
    發(fā)表于 10-19 16:49 ?1206次閱讀