日本真人作爱试看免费观看,99久久免费精品国产72免费

現(xiàn)在的計(jì)算機(jī)視覺系統(tǒng)大多基于深度神經(jīng)網(wǎng)絡(luò)，它們可以通過學(xué)習(xí)大量數(shù)據(jù)集從而得到將圖像投影到普通的場(chǎng)景描述的功能，簡(jiǎn)單說就是見得多了習(xí)慣了。

然而和這種神經(jīng)網(wǎng)絡(luò)相比，我們的大腦顯然更加智能，可以利用先前的知識(shí)來(lái)推理，并做出遠(yuǎn)遠(yuǎn)超出看到的物品的推論。例如，如果看到桌子的三條腿，那么可以推斷出第四條腿的存在和其位置，基本與實(shí)際情況相同；即使看不到房間里的所有東西，你也可以畫出它的布局、想象它的外觀。嬰兒在八九個(gè)月時(shí)就可以理解“形狀恒常性”的存在，即使用布蓋住他面前的玩具，他也可以腦補(bǔ)出布下面玩具的樣子，而這，恰是深度神經(jīng)網(wǎng)絡(luò)不能識(shí)別的。

最近，通過模仿人大腦對(duì)環(huán)境的處理方法，DeepMind提出了一種新型計(jì)算機(jī)視覺框架：GQN （the Generative Query Network），這個(gè)框架實(shí)現(xiàn)了前面提到的功能，可以腦補(bǔ)出環(huán)境的另外部分，還可以將2D圖片渲染至3D。

GQN模型由兩部分組成：表示網(wǎng)絡(luò)和世代網(wǎng)絡(luò)。表示網(wǎng)絡(luò)將察結(jié)果輸入并對(duì)基礎(chǔ)場(chǎng)景產(chǎn)生描述性質(zhì)的的矢量表示，然后世代網(wǎng)絡(luò)從以前未觀察過的角度預(yù)測(cè)場(chǎng)景的表現(xiàn)。

表示網(wǎng)絡(luò)通過以分布式表示捕獲對(duì)象位置，顏色和房間布局等元素來(lái)實(shí)現(xiàn)準(zhǔn)確描述場(chǎng)景的真實(shí)布局。該網(wǎng)絡(luò)能夠以高度壓縮和抽象的方式描述場(chǎng)景，并將其留給世代網(wǎng)絡(luò)，從而可以在必要時(shí)加入詳細(xì)信息。

世代網(wǎng)絡(luò)就像是一個(gè)近似的3D渲染器，它可以以非常精確的方式從新視角預(yù)測(cè)以前未觀測(cè)到的場(chǎng)景。當(dāng)給出場(chǎng)景和新的攝像機(jī)視點(diǎn)時(shí)，無(wú)需事先規(guī)定透視法，遮擋法或照明法，它就可以生成清晰的圖像。

那么，GQN的可行性如何？

為了評(píng)估該框架的可行性，研究人員在模擬的3D環(huán)境中進(jìn)行了一系列嘗試。在第一組實(shí)驗(yàn)中，研究人員采用了包含各種對(duì)象的方形房間中的場(chǎng)景，墻面紋理、物體和燈的形狀、位置和顏色都是隨機(jī)的，以此有效地實(shí)現(xiàn)無(wú)限數(shù)量的總場(chǎng)景配置;隨后，研究人員使用有限數(shù)據(jù)集來(lái)訓(xùn)練和測(cè)試模型。訓(xùn)練結(jié)束后，GQN通過觀察一個(gè)先前未學(xué)習(xí)的測(cè)試場(chǎng)景的圖像來(lái)計(jì)算其場(chǎng)景表示，隨后的結(jié)果顯示，發(fā)生器在視點(diǎn)處的預(yù)測(cè)是高度準(zhǔn)確的，大部分與地面事實(shí)并沒有區(qū)別。

在這個(gè)實(shí)驗(yàn)中，GQN不可能通過隨機(jī)的方式準(zhǔn)確預(yù)測(cè)結(jié)果，它只能通過在場(chǎng)景感知和編碼物體的數(shù)量、位置、顏色，還有墻壁的顏色以及光源的間接觀察位置的方式來(lái)學(xué)習(xí)。與傳統(tǒng)的神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)不同，GQN學(xué)習(xí)如何從圖像中進(jìn)行推理，而不需要對(duì)場(chǎng)景內(nèi)容進(jìn)行任何明確的人為標(biāo)注。實(shí)驗(yàn)過程中，當(dāng)場(chǎng)景的內(nèi)容重度遮擋的情況時(shí)，預(yù)測(cè)模型就會(huì)出現(xiàn)不確定的情況，這種情況反映在最終結(jié)果的的變化性上。

隨后研究人員還采用了更復(fù)雜，程序化的迷宮環(huán)境來(lái)測(cè)試GQN的縮放屬性。迷宮由通過走廊連接的多個(gè)房間組成，不同場(chǎng)景中迷宮的布局和墻壁的顏色都是隨機(jī)的。在這個(gè)實(shí)驗(yàn)中，任何一次觀察都會(huì)提供有關(guān)當(dāng)前迷宮的少量信息。在進(jìn)行多次識(shí)別觀測(cè)后， GQN已經(jīng)可以在新的攝像機(jī)視點(diǎn)做出對(duì)迷宮環(huán)境正確的預(yù)測(cè)；在進(jìn)一步的訓(xùn)練中，模型甚至還可以高度準(zhǔn)確地預(yù)測(cè)迷宮自上而下的視圖。

在這個(gè)實(shí)驗(yàn)中，預(yù)測(cè)模型的不確定性隨著觀測(cè)數(shù)量的增大而降低，經(jīng)過大約五次觀察后，GQN的不確定性幾乎完全消失。

現(xiàn)在的GQN還只能在實(shí)驗(yàn)室實(shí)現(xiàn)，主要是因?yàn)樾枰芸胤治觥⒄鎸?shí)數(shù)據(jù)集的可用性有限、不足以生成復(fù)雜的模型等原因，但它的確可以處理視覺的遮擋、場(chǎng)景的組合等問題。隨著新的數(shù)據(jù)集可用化和建模能力的增強(qiáng)，GQN也會(huì)逐漸實(shí)現(xiàn)應(yīng)用。

阅读全文

聲明：本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人，不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用，如有內(nèi)容侵權(quán)或者其他違規(guī)問題，請(qǐng)聯(lián)系本站處理。舉報(bào)投訴

神經(jīng)網(wǎng)絡(luò)

神經(jīng)網(wǎng)絡(luò)

+關(guān)注

關(guān)注
42

文章
4793

瀏覽量
102034
計(jì)算機(jī)視覺

計(jì)算機(jī)視覺

+關(guān)注

關(guān)注
8

文章
1704

瀏覽量
46409

原文標(biāo)題：計(jì)算機(jī)視覺也可以腦補(bǔ)了？

文章出處：【微信號(hào)：ARchan_TT，微信公眾號(hào)：AR醬】歡迎添加關(guān)注！文章轉(zhuǎn)載請(qǐng)注明出處。

評(píng)論

相關(guān)推薦

計(jì)算機(jī)視覺有哪些優(yōu)缺點(diǎn)

計(jì)算機(jī)視覺作為人工智能領(lǐng)域的一個(gè)重要分支，旨在使計(jì)算機(jī)能夠像人類一樣理解和解釋圖像和視頻中的信息。這一技術(shù)的發(fā)展不僅推動(dòng)了多個(gè)行業(yè)的變革，也帶來(lái)了諸多優(yōu)勢(shì)，但同時(shí)也伴隨著一些挑戰(zhàn)和局限性。以下是對(duì)

發(fā)表于 08-14 09:49 ?1549次閱讀

計(jì)算機(jī)視覺技術(shù)的AI算法模型

計(jì)算機(jī)視覺技術(shù)作為人工智能領(lǐng)域的一個(gè)重要分支，旨在使計(jì)算機(jī)能夠像人類一樣理解和解釋圖像及視頻中的信息。為了實(shí)現(xiàn)這一目標(biāo)，計(jì)算機(jī)視覺技術(shù)依賴于

發(fā)表于 07-24 12:46 ?1382次閱讀

機(jī)器視覺和計(jì)算機(jī)視覺有什么區(qū)別

機(jī)器視覺和計(jì)算機(jī)視覺是兩個(gè)密切相關(guān)但又有所區(qū)別的概念。一、定義機(jī)器視覺機(jī)器視覺，又稱為計(jì)算機(jī)

發(fā)表于 07-16 10:23 ?832次閱讀

計(jì)算機(jī)視覺的五大技術(shù)

計(jì)算機(jī)視覺作為深度學(xué)習(xí)領(lǐng)域最熱門的研究方向之一，其技術(shù)涵蓋了多個(gè)方面，為人工智能的發(fā)展開拓了廣闊的道路。以下是對(duì)計(jì)算機(jī)視覺五大技術(shù)的詳細(xì)解析，包括圖像分類、對(duì)象檢測(cè)、目標(biāo)跟蹤、語(yǔ)義分割

發(fā)表于 07-10 18:26 ?1968次閱讀

計(jì)算機(jī)視覺的工作原理和應(yīng)用

計(jì)算機(jī)視覺（Computer Vision，簡(jiǎn)稱CV）是一門跨學(xué)科的研究領(lǐng)域，它利用計(jì)算機(jī)和數(shù)學(xué)算法來(lái)模擬人類視覺系統(tǒng)對(duì)圖像和視頻進(jìn)行識(shí)別、理解、分析和處理。其核心目標(biāo)在于使

發(fā)表于 07-10 18:24 ?2724次閱讀

機(jī)器人視覺與計(jì)算機(jī)視覺的區(qū)別與聯(lián)系

機(jī)器人視覺與計(jì)算機(jī)視覺是兩個(gè)密切相關(guān)但又有所區(qū)別的領(lǐng)域。 1. 引言在當(dāng)今科技迅猛發(fā)展的時(shí)代，機(jī)器人和計(jì)算機(jī)視覺技術(shù)在各個(gè)領(lǐng)域發(fā)揮著越來(lái)越

發(fā)表于 07-09 09:27 ?948次閱讀

計(jì)算機(jī)視覺與人工智能的關(guān)系是什么

引言 計(jì)算機(jī)視覺是一門研究如何使計(jì)算機(jī)能夠理解和解釋視覺信息的學(xué)科。它涉及到圖像處理、模式識(shí)別、機(jī)器學(xué)習(xí)等多個(gè)領(lǐng)域的知識(shí)。人工智能則是研究如何使計(jì)算

發(fā)表于 07-09 09:25 ?1002次閱讀

計(jì)算機(jī)視覺與智能感知是干嘛的

引言 計(jì)算機(jī)視覺（Computer Vision）是一門研究如何使計(jì)算機(jī)能夠理解和解釋視覺信息的學(xué)科。它涉及到圖像處理、模式識(shí)別、機(jī)器學(xué)習(xí)等多個(gè)領(lǐng)域，是人工智能的重要組成

發(fā)表于 07-09 09:23 ?1414次閱讀

計(jì)算機(jī)視覺和機(jī)器視覺區(qū)別在哪

計(jì)算機(jī)視覺和機(jī)器視覺是兩個(gè)密切相關(guān)但又有明顯區(qū)別的領(lǐng)域。一、定義 計(jì)算機(jī)視覺 計(jì)算機(jī)

發(fā)表于 07-09 09:22 ?675次閱讀

計(jì)算機(jī)視覺和圖像處理的區(qū)別和聯(lián)系

計(jì)算機(jī)視覺和圖像處理是兩個(gè)密切相關(guān)但又有明顯區(qū)別的領(lǐng)域。 1. 基本概念 1.1 計(jì)算機(jī)視覺 計(jì)算機(jī)視覺

發(fā)表于 07-09 09:16 ?1893次閱讀

計(jì)算機(jī)視覺屬于人工智能嗎

屬于，計(jì)算機(jī)視覺是人工智能領(lǐng)域的一個(gè)重要分支。引言 計(jì)算機(jī)視覺是一門研究如何使計(jì)算機(jī)具有視覺能

發(fā)表于 07-09 09:11 ?1768次閱讀

深度學(xué)習(xí)在計(jì)算機(jī)視覺領(lǐng)域的應(yīng)用

隨著人工智能技術(shù)的飛速發(fā)展，深度學(xué)習(xí)作為其中的核心技術(shù)之一，已經(jīng)在計(jì)算機(jī)視覺領(lǐng)域取得了顯著的成果。計(jì)算機(jī)視覺，作為計(jì)算機(jī)科學(xué)的一個(gè)重要分支，

發(fā)表于 07-01 11:38 ?1306次閱讀

機(jī)器視覺與計(jì)算機(jī)視覺的區(qū)別

很多方面有著相似之處，如基礎(chǔ)理論、技術(shù)框架等，但它們?cè)趯W(xué)科分類、應(yīng)用領(lǐng)域、側(cè)重點(diǎn)等方面存在明顯的區(qū)別。本文將對(duì)機(jī)器視覺和計(jì)算機(jī)視覺進(jìn)行詳細(xì)的對(duì)比分析，以便讀者更好地理解兩者的差異。

發(fā)表于 06-06 17:24 ?1862次閱讀

計(jì)算機(jī)視覺的主要研究方向

計(jì)算機(jī)視覺（Computer Vision, CV）作為人工智能領(lǐng)域的一個(gè)重要分支，致力于使計(jì)算機(jī)能夠像人眼一樣理解和解釋圖像和視頻中的信息。隨著深度學(xué)習(xí)、大數(shù)據(jù)等技術(shù)的快速發(fā)展，計(jì)算機(jī)

發(fā)表于 06-06 17:17 ?1458次閱讀

工業(yè)計(jì)算機(jī)與普通計(jì)算機(jī)的區(qū)別

在信息化和自動(dòng)化日益發(fā)展的今天，計(jì)算機(jī)已經(jīng)成為了我們?nèi)粘Ｉ詈凸ぷ髦胁豢苫蛉钡墓ぞ?。然而，?b class='flag-5'>計(jì)算機(jī)領(lǐng)域中，工業(yè)計(jì)算機(jī)和普通計(jì)算機(jī)雖然都具備基本的計(jì)算

發(fā)表于 06-06 16:45 ?2057次閱讀

搜索歷史

新型計(jì)算機(jī)視覺框架：GQN可以腦補(bǔ)出環(huán)境的另外部分

評(píng)論

計(jì)算機(jī)視覺有哪些優(yōu)缺點(diǎn)

計(jì)算機(jī)視覺技術(shù)的AI算法模型

機(jī)器視覺和計(jì)算機(jī)視覺有什么區(qū)別

計(jì)算機(jī)視覺的五大技術(shù)

計(jì)算機(jī)視覺的工作原理和應(yīng)用

機(jī)器人視覺與計(jì)算機(jī)視覺的區(qū)別與聯(lián)系

計(jì)算機(jī)視覺與人工智能的關(guān)系是什么

計(jì)算機(jī)視覺與智能感知是干嘛的

計(jì)算機(jī)視覺和機(jī)器視覺區(qū)別在哪

計(jì)算機(jī)視覺和圖像處理的區(qū)別和聯(lián)系

計(jì)算機(jī)視覺屬于人工智能嗎

深度學(xué)習(xí)在計(jì)算機(jī)視覺領(lǐng)域的應(yīng)用

機(jī)器視覺與計(jì)算機(jī)視覺的區(qū)別

計(jì)算機(jī)視覺的主要研究方向

工業(yè)計(jì)算機(jī)與普通計(jì)算機(jī)的區(qū)別

電子發(fā)燒友