0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

渲染結(jié)果與原始圖像匹配 視覺(jué)系統(tǒng)精準(zhǔn)地提取場(chǎng)景參數(shù)

Tensorflowers ? 來(lái)源:yxw ? 2019-05-21 09:01 ? 次閱讀

近幾年,可嵌入到神經(jīng)網(wǎng)絡(luò)架構(gòu)中的新型可微圖形層開(kāi)始興起。從空間變換器到可微圖形渲染器,這些新型網(wǎng)絡(luò)層利用多年積累的計(jì)算機(jī)視覺(jué)和圖形學(xué)研究知識(shí)來(lái)構(gòu)建更高效的新型網(wǎng)絡(luò)架構(gòu)。通過(guò)將幾何先驗(yàn)和約束顯式建模到神經(jīng)網(wǎng)絡(luò)中,我們?yōu)槟軌蚋咝Х€(wěn)健地以自監(jiān)督方式(這點(diǎn)更為重要)接受訓(xùn)練的架構(gòu)打開(kāi)了大門(mén)。

總體來(lái)看,計(jì)算機(jī)圖形管道需要 3D 物體及其在場(chǎng)景中的絕對(duì)位置、對(duì)物體材質(zhì)的描述、光和攝像頭。然后,渲染器會(huì)解譯該場(chǎng)景描述,進(jìn)而生成合成渲染。

與之相比,計(jì)算機(jī)視覺(jué)系統(tǒng)會(huì)從圖像入手,試圖推斷場(chǎng)景的參數(shù)。這可以實(shí)現(xiàn)對(duì)場(chǎng)景中的物體,以及對(duì)其材質(zhì)、三維位置和方向的預(yù)測(cè)。

訓(xùn)練能夠解決這些復(fù)雜 3D 視覺(jué)任務(wù)的機(jī)器學(xué)習(xí)系統(tǒng)通常需要大量數(shù)據(jù)。由于標(biāo)記數(shù)據(jù)是一個(gè)成本高昂且復(fù)雜的過(guò)程,所以我們必須配備設(shè)計(jì)機(jī)器學(xué)習(xí)模型的機(jī)制,以設(shè)計(jì)出既能理解三維世界,又在訓(xùn)練時(shí)無(wú)需太多監(jiān)督的機(jī)器學(xué)習(xí)模型。通過(guò)將計(jì)算機(jī)視覺(jué)和計(jì)算機(jī)圖形學(xué)技術(shù)相結(jié)合,我們可以隨時(shí)利用大量無(wú)標(biāo)記數(shù)據(jù),這是絕無(wú)僅有的好機(jī)會(huì)。舉例而言,下圖所示的流程可以通過(guò)合成分析實(shí)現(xiàn),即視覺(jué)系統(tǒng)提取場(chǎng)景函數(shù),然后圖形系統(tǒng)根據(jù)這些函數(shù)返回渲染后的圖像。如果渲染結(jié)果與原始圖像匹配,則說(shuō)明視覺(jué)系統(tǒng)精準(zhǔn)地提取了場(chǎng)景參數(shù)。在該設(shè)置中,計(jì)算機(jī)視覺(jué)和計(jì)算機(jī)圖形學(xué)攜手合作,形成了一個(gè)類(lèi)似自編碼器的機(jī)器學(xué)習(xí)系統(tǒng),該系統(tǒng)能夠以自監(jiān)督方式進(jìn)行訓(xùn)練。

可微圖形層

接下來(lái),我們將探索 TensorFlow Graphics 的一些可用功能。本次探索之旅并未涵蓋所有內(nèi)容;如需更多信息,請(qǐng)?jiān)L問(wèn)我們的GitHub,探索 TensorFlow Graphics 推出的新功能。

變換

物體變換可控制物體的空間位置。如下圖所示,利用軸線角形式旋轉(zhuǎn)立方體。旋轉(zhuǎn)軸指向上方,旋轉(zhuǎn)方向?yàn)槟鏁r(shí)針,因此立方體以逆時(shí)針?lè)较蛐D(zhuǎn)。在此Colab 示例中,我們展示了如何在神經(jīng)網(wǎng)絡(luò)中訓(xùn)練旋轉(zhuǎn)形式,該神經(jīng)網(wǎng)絡(luò)在經(jīng)過(guò)訓(xùn)練后用于預(yù)測(cè)觀測(cè)物體的旋轉(zhuǎn)和平移。這項(xiàng)任務(wù)是很多應(yīng)用的核心,包括專(zhuān)注于與所處環(huán)境進(jìn)行交互的機(jī)器人。在這些場(chǎng)景中,用機(jī)械臂(例如,通過(guò)其手柄)抓取物體需要精確估測(cè)這些物體相對(duì)于機(jī)械臂的位置。

對(duì)攝像頭進(jìn)行建模

攝像頭模型在計(jì)算機(jī)視覺(jué)領(lǐng)域占據(jù)至關(guān)重要的地位,因?yàn)槠鋵?duì)三維物體投影到圖像平面的外觀影響極大。如下圖所示,此立方體似乎正在放大和縮小,但事實(shí)上這只是焦距改變帶來(lái)的變化。

材質(zhì)

材質(zhì)模型定義光線與物體的交互過(guò)程,從而賦予物體獨(dú)特的外觀。例如,某些材質(zhì)(如石膏)會(huì)均勻地向各個(gè)方向反射光線,而鏡面等其他材質(zhì)只會(huì)產(chǎn)生鏡面反射。在此交互式Colab 筆記本中,您將了解如何使用 Tensorflow Graphics 生成以下渲染。您還將有機(jī)會(huì)試驗(yàn)材質(zhì)和光線的參數(shù),充分了解其交互過(guò)程。準(zhǔn)確預(yù)測(cè)材質(zhì)屬性是許多任務(wù)的基礎(chǔ)。例如,它可以讓用戶在所處環(huán)境中放置虛擬家具,打造室內(nèi)環(huán)境與家具搭配的逼真場(chǎng)景,使用戶能夠準(zhǔn)確感知這件家具的外觀。

幾何學(xué) — 3D 卷積和池化

近年來(lái),以點(diǎn)云或網(wǎng)格形式輸出三維數(shù)據(jù)的傳感器正在逐漸融入我們的日常生活,包括智能手機(jī)深度傳感器、自動(dòng)駕駛汽車(chē)?yán)走_(dá)等等。由于其結(jié)構(gòu)不規(guī)則,在這些表征上執(zhí)行卷積要比在規(guī)則網(wǎng)格結(jié)構(gòu)上困難得多。TensorFlow Graphics 提供兩個(gè) 3D 卷積層和一個(gè) 3D 池化層,方便開(kāi)展訓(xùn)練,例如訓(xùn)練網(wǎng)絡(luò)在網(wǎng)格上執(zhí)行對(duì)語(yǔ)義部分的分類(lèi)(如下圖所示)

TensorBoard 3D

可視化調(diào)試是評(píng)估實(shí)驗(yàn)是否按正確方向開(kāi)展的重要方法。為此,TensorFlow Graphics 配備了 TensorBoard 插件,支持以交互方式顯示 3D 網(wǎng)格和點(diǎn)云。

聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 變換器
    +關(guān)注

    關(guān)注

    17

    文章

    2099

    瀏覽量

    109305
  • tensorflow
    +關(guān)注

    關(guān)注

    13

    文章

    329

    瀏覽量

    60536
  • 渲染器
    +關(guān)注

    關(guān)注

    0

    文章

    18

    瀏覽量

    3236
  • Graphics
    +關(guān)注

    關(guān)注

    0

    文章

    11

    瀏覽量

    5127

原文標(biāo)題:TensorFlow Graphics 簡(jiǎn)介:當(dāng)計(jì)算機(jī)圖形學(xué)遇上深度學(xué)習(xí)

文章出處:【微信號(hào):tensorflowers,微信公眾號(hào):Tensorflowers】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏

    評(píng)論

    相關(guān)推薦

    協(xié)作機(jī)器人TM25S:內(nèi)置視覺(jué)系統(tǒng)實(shí)現(xiàn)精準(zhǔn)作業(yè)

    步驟。 ? 內(nèi)置視覺(jué)系統(tǒng)具有四大功能:識(shí)別、增強(qiáng)、查找、測(cè)量。 識(shí)別功能可以對(duì)條形碼/QR碼/DataMatrix碼等二維碼進(jìn)行讀取、顏色識(shí)別、OCR等功能,可用于檢測(cè)、分揀、定位等多種工序。 增強(qiáng)功能可以增強(qiáng)圖像特征,提高特殊應(yīng)用環(huán)境中識(shí)別項(xiàng)目的
    的頭像 發(fā)表于 11-28 10:26 ?285次閱讀
    協(xié)作機(jī)器人TM25S:內(nèi)置<b class='flag-5'>視覺(jué)系統(tǒng)</b>實(shí)現(xiàn)<b class='flag-5'>精準(zhǔn)</b>作業(yè)

    安森美機(jī)器視覺(jué)系統(tǒng)解決方案

    ,它還用于驗(yàn)證數(shù)據(jù)矩陣碼、檢查食品包裝和讀取條形碼。機(jī)器視覺(jué)系統(tǒng)方案指南將全面介紹機(jī)器視覺(jué)系統(tǒng)方案及市場(chǎng)趨勢(shì),本文為第二部分,將重點(diǎn)介紹系統(tǒng)描述、方案概述、系統(tǒng)實(shí)現(xiàn)。
    的頭像 發(fā)表于 11-14 09:53 ?238次閱讀
    安森美機(jī)器<b class='flag-5'>視覺(jué)系統(tǒng)</b>解決方案

    康耐視AI視覺(jué)系統(tǒng)助力自動(dòng)化精準(zhǔn)檢測(cè)

    憑借高精度圖像分析、物體表面識(shí)別檢測(cè)、精準(zhǔn)定位等功能,視覺(jué)系統(tǒng)為自動(dòng)化流程的高效運(yùn)行提供了關(guān)鍵技術(shù)支持。
    的頭像 發(fā)表于 10-25 10:32 ?225次閱讀

    圖像采集卡不斷發(fā)展和改進(jìn),為視覺(jué)系統(tǒng)提供更大的價(jià)值

    圖像采集卡最初是為了從模擬機(jī)器視覺(jué)相機(jī)中獲取原始圖像而開(kāi)發(fā)的,人們?cè)欢阮A(yù)計(jì)該技術(shù)將被直接連接到電腦的技術(shù)所取代。然而,經(jīng)驗(yàn)卻并非如此。圖像
    的頭像 發(fā)表于 09-30 11:10 ?212次閱讀
    <b class='flag-5'>圖像</b>采集卡不斷發(fā)展和改進(jìn),為<b class='flag-5'>視覺(jué)系統(tǒng)</b>提供更大的價(jià)值

    視覺(jué)檢測(cè)是什么意思?機(jī)器視覺(jué)檢測(cè)的適用行業(yè)及場(chǎng)景有哪些?

    在快速迭代的工業(yè)世界中,機(jī)器視覺(jué)檢測(cè)以其精準(zhǔn)、高效的力量,已成為眾多產(chǎn)業(yè)不可或缺的技術(shù)支持。本文將深入探討機(jī)器視覺(jué)檢測(cè)的含義、應(yīng)用行業(yè)及具體場(chǎng)景,揭示其如何在現(xiàn)代生產(chǎn)中扮演關(guān)鍵角色。
    的頭像 發(fā)表于 08-30 11:20 ?370次閱讀

    什么是機(jī)器視覺(jué)opencv?它有哪些優(yōu)勢(shì)?

    Vision Library)是一個(gè)開(kāi)源的計(jì)算機(jī)視覺(jué)庫(kù),提供了大量的圖像處理和計(jì)算機(jī)視覺(jué)算法,廣泛應(yīng)用于機(jī)器視覺(jué)領(lǐng)域。 機(jī)器視覺(jué)概述 1.
    的頭像 發(fā)表于 07-16 10:33 ?785次閱讀

    機(jī)器視覺(jué)系統(tǒng)如何選擇圖像傳感器

    圖像傳感器是所有機(jī)器視覺(jué)(MV)系統(tǒng)的核心,這是負(fù)責(zé)將物理世界的信息轉(zhuǎn)換為數(shù)字?jǐn)?shù)據(jù)的基本元件,在確保機(jī)器視覺(jué)操作的準(zhǔn)確性、可靠性和高效率方面起到了關(guān)鍵作用。在這篇博文中,安森美探討了為
    的頭像 發(fā)表于 07-05 10:49 ?580次閱讀

    機(jī)器視覺(jué)的應(yīng)用流程是如何實(shí)現(xiàn)的

    機(jī)器視覺(jué)是一種利用計(jì)算機(jī)和圖像處理技術(shù),模擬人類(lèi)視覺(jué)系統(tǒng)對(duì)圖像進(jìn)行處理、分析和理解的技術(shù)。它在工業(yè)自動(dòng)化、智能交通、醫(yī)療診斷、安防監(jiān)控等領(lǐng)域有著廣泛的應(yīng)用。 在機(jī)器
    的頭像 發(fā)表于 07-04 10:47 ?421次閱讀

    機(jī)器視覺(jué)系統(tǒng)與運(yùn)動(dòng)控制系統(tǒng)的區(qū)別

      在工業(yè)自動(dòng)化和智能制造的浪潮中,機(jī)器視覺(jué)系統(tǒng)和運(yùn)動(dòng)控制系統(tǒng)作為兩大關(guān)鍵技術(shù),各自扮演著不可或缺的角色。它們雖然都是為了實(shí)現(xiàn)更高效、更精確的自動(dòng)化操作,但在技術(shù)原理、功能定位、應(yīng)用領(lǐng)域等方面卻存在顯著的區(qū)別。本文將從多個(gè)維度出發(fā),詳細(xì)探討機(jī)器
    的頭像 發(fā)表于 06-06 14:10 ?829次閱讀

    機(jī)器視覺(jué)系統(tǒng)的工作原理和應(yīng)用領(lǐng)域

      隨著科技的飛速發(fā)展,機(jī)器視覺(jué)系統(tǒng)已成為工業(yè)自動(dòng)化領(lǐng)域不可或缺的一部分。機(jī)器視覺(jué)系統(tǒng),顧名思義,就是使用機(jī)器來(lái)模擬和實(shí)現(xiàn)人類(lèi)視覺(jué)的功能,通過(guò)圖像攝取裝置將被攝取目標(biāo)轉(zhuǎn)換成
    的頭像 發(fā)表于 06-06 14:04 ?1043次閱讀

    機(jī)器視覺(jué)系統(tǒng)五個(gè)模塊介紹

    典型的機(jī)器視覺(jué)系統(tǒng)由五個(gè)主要模塊組成:照明、鏡頭、相機(jī)、圖像采集和視覺(jué)處理器。讓我們看一下這五個(gè)結(jié)構(gòu)的目的、特征和工作原理。機(jī)器視覺(jué)系統(tǒng):照明照明是影響機(jī)器
    的頭像 發(fā)表于 05-09 17:13 ?902次閱讀
    機(jī)器<b class='flag-5'>視覺(jué)系統(tǒng)</b>五個(gè)模塊介紹

    機(jī)器視覺(jué)系統(tǒng)的組成部分

    一般來(lái)說(shuō),一個(gè)完整的機(jī)器視覺(jué)系統(tǒng)由光學(xué)系統(tǒng)(光源、鏡頭、工業(yè)相機(jī))、圖像采集單元、圖像處理單元、執(zhí)行器和人機(jī)界面等模塊組成。各功能模塊缺一不可、相輔相成。1.照明(光源)照明是影響機(jī)器
    的頭像 發(fā)表于 04-29 14:51 ?1282次閱讀
    機(jī)器<b class='flag-5'>視覺(jué)系統(tǒng)</b>的組成部分

    如何提取匹配圖像特征點(diǎn)

    我們習(xí)慣從圖像中選取比較有代表性的點(diǎn),然后,在此基礎(chǔ)上,討論相機(jī)位姿估計(jì)問(wèn)題,以及這些點(diǎn)的定位問(wèn)題。 在經(jīng)典 SLAM 模型中,把它們稱(chēng)為路標(biāo),而在視覺(jué) SLAM 中,路標(biāo)則是指圖像特征(Features)。
    的頭像 發(fā)表于 04-19 11:41 ?663次閱讀

    機(jī)器人視覺(jué)系統(tǒng)深度解析

    從功能上來(lái)看,典型的機(jī)器視覺(jué)系統(tǒng)可以分為:圖像采集部分、圖像處理部分和運(yùn)動(dòng)控制部分。
    發(fā)表于 03-05 11:39 ?488次閱讀
    機(jī)器人<b class='flag-5'>視覺(jué)系統(tǒng)</b>深度解析

    機(jī)器視覺(jué)系統(tǒng)中常用攝像機(jī)的分類(lèi)

    攝像機(jī)是機(jī)器視覺(jué)系統(tǒng)中的一個(gè)關(guān)鍵組件,其最本質(zhì)的功能就是將光信號(hào)轉(zhuǎn)變成為有序的電信號(hào)。選擇合適的攝像機(jī)也是機(jī)器視覺(jué)系統(tǒng)設(shè)計(jì)中的重要環(huán)節(jié),攝像機(jī)的不僅是直接決定所采集到的圖像分辨率、圖像
    發(fā)表于 01-19 09:23 ?680次閱讀
    機(jī)器<b class='flag-5'>視覺(jué)系統(tǒng)</b>中常用攝像機(jī)的分類(lèi)