0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

單像素成像圖像智能處理算法和應(yīng)用場(chǎng)景

新機(jī)器視覺(jué) ? 來(lái)源:愛光學(xué) ? 作者:焦述銘 ? 2022-10-26 15:57 ? 次閱讀

圖像傳感器是把攝像頭接收到的光信號(hào)轉(zhuǎn)化成電子信號(hào)的感光元件,可以記錄光場(chǎng)強(qiáng)度的分布,對(duì)于拍照設(shè)備來(lái)說(shuō),它就如同人眼的視網(wǎng)膜。手機(jī)或者相機(jī)的傳感器一般是一個(gè)包含了很多個(gè)小單元的陣列,每個(gè)小單元對(duì)應(yīng)著照片中的一個(gè)像素。我們平時(shí)說(shuō)的,相機(jī)2000萬(wàn)像素就是指圖像傳感器上有2000萬(wàn)個(gè)小單元(感光點(diǎn))。

628a2c48-5447-11ed-a3b6-dac502259ad0.png

圖像傳感器單像素成像原理然而,近十多年來(lái),科學(xué)家們卻在探索一種新型的“單像素相機(jī)”[2],即圖像傳感器只包含一個(gè)像素,這種另類的光學(xué)成像方式就是“單像素成像”[1]。 那么單像素相機(jī)又是怎么工作的呢?單像素成像中,通過(guò)一個(gè)投影器件不斷向目標(biāo)物體照射不同的結(jié)構(gòu)光圖案,單像素探測(cè)器依次記錄下每次照射時(shí)物體場(chǎng)景總體光強(qiáng)度,最后計(jì)算重建出具有空間分辨率的物體圖像。數(shù)學(xué)上來(lái)說(shuō),單像素探測(cè)器記錄的光強(qiáng)度是投影圖案和物體圖像之間的內(nèi)積。單像素成像與以往常常提到的鬼成像和關(guān)聯(lián)成像的概念比較接近。

62a60d00-5447-11ed-a3b6-dac502259ad0.png

典型的單像素成像系統(tǒng)單像素成像智能處理算法由于單像素相機(jī)與普通相機(jī)有著不同的成像機(jī)制和框架,在最近的研究中,筆者設(shè)計(jì)了四種為其“量身打造”的圖像智能處理算法。 (1)運(yùn)動(dòng)物體單像素成像中模糊去除和質(zhì)量提升 單像素成像中需要依次投影大量不同圖案,記錄下很長(zhǎng)一串單像素值序列,才能重建出一張物體圖像,這顯然需要一定的成像時(shí)間。所以,拍攝快速運(yùn)動(dòng)的物體時(shí),幀率往往比較低,記錄前幾個(gè)單像素值時(shí)還“朝發(fā)白帝”,記錄后幾個(gè)單像素值時(shí)就已經(jīng)“暮到江陵”了。這導(dǎo)致最后記錄下的單像素值數(shù)據(jù)里包含了不同位置物體的混合信息,重建的圖像會(huì)包含比較多模糊和噪聲,類似于普通相機(jī)拍攝一輛飛馳而過(guò)的汽車得到的“拖尾”照片一樣。 為解決這一問(wèn)題,可以考慮一個(gè)基本的物理定律——運(yùn)動(dòng)的相對(duì)性,物體在運(yùn)動(dòng),投影圖案是靜止的,等效于物體是靜止的,而投影圖案在反方向運(yùn)動(dòng)。物體從左到右運(yùn)動(dòng),相當(dāng)于投影圖案從右到左運(yùn)動(dòng);物體順時(shí)針轉(zhuǎn)動(dòng),相當(dāng)于投影圖案逆時(shí)針轉(zhuǎn)動(dòng)。通過(guò)搜索估算物體的平移或者轉(zhuǎn)動(dòng)速度,對(duì)投影圖案做相應(yīng)的反向變換,然后計(jì)算時(shí)使用變換后的投影圖案替代原本的投影圖案,重建出的物體圖像就會(huì)清晰很多,質(zhì)量得到明顯提升[3]。

62c1c7d4-5447-11ed-a3b6-dac502259ad0.png

實(shí)驗(yàn)中,拍攝一個(gè)快速轉(zhuǎn)動(dòng)圓盤上的數(shù)字,我們?cè)O(shè)計(jì)的算法可以去除重建圖像中的模糊和噪聲 [3]。 (2)基于單像素成像的全光學(xué)物體快速分類 圖像常常需要進(jìn)行自動(dòng)分類識(shí)別,比如照片里的是一只貓,還是一只狗?一般無(wú)論普通相機(jī)還是單像素相機(jī),都要先拍攝到物體(比如數(shù)字或交通標(biāo)志)清晰的圖片,才能使用機(jī)器學(xué)習(xí)方法進(jìn)行圖像分類任務(wù)。 不過(guò),筆者提出的基于單像素成像的全光學(xué)物體快速分類方案中[4],不需要重建物體圖像,物體只被很少數(shù)量的投影圖案所照射,探測(cè)器只記錄下“寥寥無(wú)幾”的單像素值,該算法直接基于這些單像素值,在“不知道物體到底長(zhǎng)得什么樣”情況下,能夠進(jìn)行快速物體分類。比如我們要把物體分為10類,只需要從大量訓(xùn)練圖片中優(yōu)化設(shè)計(jì)出10個(gè)投影圖案,一共投影10次,而進(jìn)行完整的圖像重建可能需要投影幾百幾千次。

62eee458-5447-11ed-a3b6-dac502259ad0.png

從10個(gè)類別的數(shù)字圖像和交通標(biāo)志圖像中分別優(yōu)化設(shè)計(jì)出的10個(gè)用于快速物體分類的投影圖案(第四行)。 分類結(jié)果可以通過(guò)單像素值序列中最大光強(qiáng)度值直接顯示出來(lái),無(wú)需后續(xù)的數(shù)字處理,整個(gè)系統(tǒng)相當(dāng)于一個(gè)可以進(jìn)行線性分類任務(wù)的“光學(xué)計(jì)算機(jī)”。相比于2018年Science論文中多層級(jí)聯(lián)相位板結(jié)構(gòu)的全光學(xué)衍射神經(jīng)網(wǎng)絡(luò)(DNN)系統(tǒng)[5],我們的系統(tǒng)可以完成類似的全光學(xué)物體分類任務(wù),同時(shí)具有非相干光照射下工作,低實(shí)驗(yàn)復(fù)雜性,高可編程性等優(yōu)點(diǎn),更容易實(shí)現(xiàn)。 (3)單像素成像中圖像盲重建 單像素成像中一般既需要已知所有投影圖案,又需要已知所有單像素值,才能進(jìn)行物體圖像的重建。這樣看起來(lái)二者缺一就無(wú)法重建圖像,其實(shí)未必。

63148ffa-5447-11ed-a3b6-dac502259ad0.png

假設(shè)投影圖案雖然是未知的,但它們保持固定不變。如果已知一定數(shù)量不同的物體圖像和它們對(duì)應(yīng)單像素值序列作為訓(xùn)練樣本,可以通過(guò)機(jī)器學(xué)習(xí)方式實(shí)現(xiàn)盲重建。筆者在研究[6]中并沒(méi)有使用“時(shí)尚潮流之選”的深度學(xué)習(xí)方法,而使用了更簡(jiǎn)單的基于線性回歸模型的方式恢復(fù)未知的投影圖案,但獲得的結(jié)果在一定條件下優(yōu)于深度學(xué)習(xí)的結(jié)果。 事實(shí)上,很多相干和非相干的光學(xué)成像系統(tǒng)都是線性的,一些傳統(tǒng)方法也可能對(duì)系統(tǒng)進(jìn)行精確模擬,那么近年在各領(lǐng)域都普遍使用的深度學(xué)習(xí)方法是否一定優(yōu)于傳統(tǒng)方法?一些仿真和實(shí)驗(yàn)結(jié)果顯示,對(duì)于單像素成像系統(tǒng)和其他一些線性光學(xué)系統(tǒng),深度學(xué)習(xí)其實(shí)未必總能表現(xiàn)出優(yōu)勢(shì),尤其在需要大量訓(xùn)練樣本和泛化性這兩個(gè)方面表現(xiàn)出一定不足[6]。 (4)單像素成像中的可視加密 作為90后經(jīng)典童年回憶的《冒險(xiǎn)小虎隊(duì)》中,通過(guò)解密卡才能看到雜亂無(wú)章的條紋中隱藏的信息,這其實(shí)很類似于一種“可視加密”技術(shù)。

632ae052-5447-11ed-a3b6-dac502259ad0.png

可視加密(Visual Cryptography)把要隱藏的圖像分解成幾個(gè)隨機(jī)圖案,把它們打印在透明膠片上,每個(gè)圖案稱為一個(gè)可視密鑰(Visual Key),無(wú)法從中看到隱藏的圖像??墒钱?dāng)可視密鑰重疊在一起時(shí),隱藏圖像就可以在視覺(jué)上顯現(xiàn)出來(lái)。單像素成像中的探測(cè)器收集物體圖像總體光強(qiáng)度的方式,相當(dāng)于進(jìn)行了像素值的虛擬疊加操作,與可視加密一定程度上“異曲同工”。 筆者提出通過(guò)物體圖像和通過(guò)投影圖案兩種方式將可視加密在單像素成像中實(shí)現(xiàn)[7]。單像素的可視加密可以適用于打印在不透明介質(zhì)上的可視密鑰圖案,并且容易在肉眼觀察不到的非可見光波段以及視平線之外隱藏角落實(shí)現(xiàn)可視加密,物理層面上提升可視加密的安全性。 例如,(a)和(b)兩個(gè)二維碼可以作為一組可視密鑰,用手機(jī)掃它們,可以讀出同樣的信息,不過(guò)讀出的并不是要隱藏的信息,而是做偽裝的“幌子”。通過(guò)單像素可視加密系統(tǒng)虛擬疊加到一起之后,依舊是一個(gè)可以用手機(jī)掃的二維碼(c),不過(guò)真正隱藏的信息”O(jiān)K”浮現(xiàn)了出來(lái)。

633f2d1e-5447-11ed-a3b6-dac502259ad0.png

此外單像素成像中,只對(duì)一組投影圖案的隨機(jī)置換也能實(shí)現(xiàn)圖像加密[8]。單像素成像的應(yīng)用單像素成像可以把傳感器從一個(gè)單元陣列簡(jiǎn)化為單個(gè)像素,與此同時(shí),則需要額外的投影器件,比如,數(shù)字微鏡陣列DMD,并且要投影照射和記錄很多次,而不是一次性成像。 然而,這不妨礙在很多情況下,單像素相機(jī)仍然比普通相機(jī)更具有優(yōu)勢(shì),比如在可見光以外的一些波段,單元陣列傳感器難以制造,或者成本非常高,而只包含一個(gè)像素的簡(jiǎn)單傳感器就容易實(shí)現(xiàn)得多,單像素成像為這些波段的低成本相機(jī)提供了一個(gè)好的選擇。 再比如普通相機(jī)拍攝照片時(shí),物體需要放到鏡頭或者傳感器的視平線范圍內(nèi),而單像素探測(cè)器可以拍攝隱藏在拐角處的物體。當(dāng)同時(shí)對(duì)多個(gè)光譜和多個(gè)偏振態(tài)的光場(chǎng)進(jìn)行記錄時(shí),難以在同一個(gè)單元陣列傳感器上對(duì)這么多的“頻道”同時(shí)進(jìn)行復(fù)用,單像素探測(cè)器則比較容易在“頻道”間靈活來(lái)回切換。 目前,該技術(shù)已被研究者嘗試應(yīng)用于多個(gè)領(lǐng)域,如遙感成像、顯微鏡、光譜儀、無(wú)人駕駛激光雷達(dá)、加油站氣體泄露監(jiān)測(cè)、便攜式掃描儀等,單像素成像的潛在應(yīng)用場(chǎng)景一直在不斷被發(fā)掘和擴(kuò)展。

作者簡(jiǎn)介

焦述銘,深圳大學(xué)納米光子學(xué)研究中心副研究員,香港城市大學(xué)博士畢業(yè)。主要從事單像素成像,全息成像及顯示,圖像處理等方面研究。以第一作者發(fā)表期刊論文20余篇,曾入選Hong Kong PhD Fellowship Scheme和廣東省“珠江人才計(jì)劃”博士后資助項(xiàng)目。

審核編輯:郭婷

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 傳感器
    +關(guān)注

    關(guān)注

    2552

    文章

    51302

    瀏覽量

    755246
  • 攝像頭
    +關(guān)注

    關(guān)注

    60

    文章

    4857

    瀏覽量

    96000

原文標(biāo)題:?jiǎn)蜗袼爻上駡D像智能處理算法

文章出處:【微信號(hào):vision263com,微信公眾號(hào):新機(jī)器視覺(jué)】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏

    評(píng)論

    相關(guān)推薦

    系統(tǒng)放大器的技術(shù)原理和應(yīng)用場(chǎng)景

    放大和處理,以提供高清晰度和穩(wěn)定的圖像輸出。 生物醫(yī)學(xué):在生物醫(yī)學(xué)成像和信號(hào)采集過(guò)程中,系統(tǒng)放大器能夠增強(qiáng)來(lái)自傳感器的微弱信號(hào),助力進(jìn)一步的分析和處理。這對(duì)于醫(yī)療診斷、疾病監(jiān)測(cè)等領(lǐng)域具
    發(fā)表于 11-18 14:46

    實(shí)時(shí)示波器的技術(shù)原理和應(yīng)用場(chǎng)景

    波形圖像。在信號(hào)處理方面,示波器首先將接收到的被測(cè)信號(hào)進(jìn)行放大和濾波等處理,以確保信號(hào)的準(zhǔn)確性和穩(wěn)定性。然后,通過(guò)A/D轉(zhuǎn)換技術(shù),將模擬信號(hào)轉(zhuǎn)換為數(shù)字信號(hào),以便進(jìn)行后續(xù)的數(shù)字處理和顯示
    發(fā)表于 10-23 14:22

    FPGA在圖像處理領(lǐng)域的優(yōu)勢(shì)有哪些?

    。這種并行處理能力使得FPGA在處理大規(guī)模圖像數(shù)據(jù)時(shí)表現(xiàn)出色,能夠?qū)崟r(shí)完成復(fù)雜的圖像處理算法。 二、高靈活性 FPGA具有很高的靈活性,可以
    發(fā)表于 10-09 14:36

    智能IC卡測(cè)試設(shè)備的技術(shù)原理和應(yīng)用場(chǎng)景

    智能IC卡測(cè)試設(shè)備的技術(shù)原理和應(yīng)用場(chǎng)景,可以從以下幾個(gè)方面進(jìn)行闡述:技術(shù)原理智能IC卡測(cè)試設(shè)備的技術(shù)原理主要圍繞IC卡的通信和數(shù)據(jù)處理機(jī)制展開。IC卡(包括
    發(fā)表于 09-26 14:27

    淺談國(guó)產(chǎn)異構(gòu)雙核RISC-V+FPGA處理器AG32VF407的優(yōu)勢(shì)和應(yīng)用場(chǎng)景

    技術(shù)手段提高系統(tǒng)的安全性和可靠性,適用于對(duì)安全要求較高的應(yīng)用場(chǎng)景。 應(yīng)用場(chǎng)景 邊緣計(jì)算 : 在物聯(lián)網(wǎng)、智能城市等邊緣計(jì)算場(chǎng)景中,異構(gòu)雙核RISC-V+FPGA
    發(fā)表于 08-31 08:32

    LED像素間距的定義和應(yīng)用場(chǎng)景

    LED像素間距,也被稱為點(diǎn)間距,是LED顯示屏上一個(gè)關(guān)鍵的技術(shù)參數(shù),它直接關(guān)聯(lián)到顯示屏的分辨率、清晰度以及觀看體驗(yàn)。以下是對(duì)LED像素間距的詳細(xì)解析,包括其定義、重要性、影響因素、應(yīng)用場(chǎng)景以及選擇原則等方面。
    的頭像 發(fā)表于 08-10 09:59 ?1780次閱讀

    RISC-V適合什么樣的應(yīng)用場(chǎng)景

    解決方案,適用于邊緣計(jì)算、智能攝像頭、智能音箱等場(chǎng)景。 靈活性:RISC-V的開放性使得其能夠更容易地與各種AI框架和算法集成,滿足不同的AI應(yīng)用需求。 4. 自動(dòng)駕駛和汽車電子 定制
    發(fā)表于 07-29 17:16

    FPGA在人工智能中的應(yīng)用有哪些?

    和安全的云計(jì)算和網(wǎng)絡(luò)服務(wù)。 三、具體應(yīng)用場(chǎng)景 圖像分類:在圖像分類任務(wù)中,F(xiàn)PGA可以承擔(dān)前置處理、圖像卷積、全連接等任務(wù)。通過(guò)FPGA的并
    發(fā)表于 07-29 17:05

    FPGA與MCU的應(yīng)用場(chǎng)景

    大量計(jì)算任務(wù),這在實(shí)時(shí)處理等應(yīng)用中尤為重要。 高性能計(jì)算 FPGA在處理復(fù)雜算法和大規(guī)模數(shù)據(jù)時(shí)表現(xiàn)出色,特別是在人工智能(AI)和機(jī)器學(xué)習(xí)(ML)領(lǐng)域。它們可以加速神經(jīng)網(wǎng)絡(luò)的訓(xùn)練和推理
    發(fā)表于 07-29 15:45

    圖像檢測(cè)和圖像識(shí)別的原理、方法及應(yīng)用場(chǎng)景

    圖像檢測(cè)和圖像識(shí)別是計(jì)算機(jī)視覺(jué)領(lǐng)域的兩個(gè)重要概念,它們?cè)谠S多應(yīng)用場(chǎng)景中發(fā)揮著關(guān)鍵作用。 1. 定義 1.1 圖像檢測(cè) 圖像檢測(cè)(Object
    的頭像 發(fā)表于 07-16 11:19 ?4677次閱讀

    FPGA設(shè)計(jì)經(jīng)驗(yàn)之圖像處理

    NxN的算子中的N不能特別大。當(dāng)然FPGA也可以接DDR把圖像緩存到其中再讀出來(lái)進(jìn)行處理,但這種處理模式就和CPU差不多了,達(dá)不到最高的實(shí)時(shí)性。其實(shí)有些我們認(rèn)為需要隨機(jī)讀取數(shù)據(jù)的圖像
    發(fā)表于 06-12 16:26

    基于FPGA的實(shí)時(shí)邊緣檢測(cè)系統(tǒng)設(shè)計(jì),Sobel圖像邊緣檢測(cè),F(xiàn)PGA圖像處理

    搭建圖像處理硬件平臺(tái)成為圖像處理的發(fā)展趨勢(shì)。FPGA在運(yùn)算性能方面的具有較大優(yōu)勢(shì),使用FPGA并行加速圖像
    發(fā)表于 05-24 07:45

    NanoEdge AI的技術(shù)原理、應(yīng)用場(chǎng)景及優(yōu)勢(shì)

    NanoEdge AI 是一種基于邊緣計(jì)算的人工智能技術(shù),旨在將人工智能算法應(yīng)用于物聯(lián)網(wǎng)(IoT)設(shè)備和傳感器。這種技術(shù)的核心思想是將數(shù)據(jù)處理和分析從云端轉(zhuǎn)移到設(shè)備本身,從而減少數(shù)據(jù)傳輸延遲、降低
    發(fā)表于 03-12 08:09

    一種基于擴(kuò)散模型的傅里葉像素成像高分辨率迭代重建方法

    傅里葉像素成像(FSPI)是一種基于傅里葉分析理論的計(jì)算光學(xué)成像技術(shù)。
    的頭像 發(fā)表于 01-24 09:43 ?1200次閱讀
    一種基于擴(kuò)散模型的傅里葉<b class='flag-5'>單</b><b class='flag-5'>像素</b><b class='flag-5'>成像</b>高分辨率迭代重建方法

    AG32VF-MIPI應(yīng)用場(chǎng)景

    MIPI接口技術(shù)在圖像和視頻傳輸中的應(yīng)用越來(lái)越廣泛,應(yīng)用場(chǎng)景也在不斷拓展,而不僅限于移動(dòng)設(shè)備。MIPI接口在物聯(lián)網(wǎng)、智能家居、智能監(jiān)控、智能
    發(fā)表于 01-22 08:56