婷婷五月情,一本大道香蕉久在线播放a,欧美精品国产白浆久久久久

谷歌發(fā)明的由2D圖像生成3D圖像的技術(shù)，利用3D估計(jì)神經(jīng)網(wǎng)絡(luò)圖像信息的補(bǔ)全以及預(yù)測(cè)，融合了拍攝角度、光照等信息，讓生成的3D圖像看起來(lái)更加逼真，這種技術(shù)對(duì)于三維建模以及工業(yè)應(yīng)用都具有極大的指導(dǎo)意義。

谷歌研究人員制作的一個(gè)AI工具，可以把涂鴉變成奇怪的怪物。這款工具名為Chimera Painter，使用機(jī)器學(xué)習(xí)來(lái)根據(jù)用戶的粗略草圖生成圖像。

Chimera Painter背后的團(tuán)隊(duì)在一篇博客文章中解釋了他們的方法和動(dòng)機(jī)，稱他們的想法是創(chuàng)造一種 “畫筆，它的行為不像工具，而更像助手”。Chimera Painter只是一個(gè)原型，但如果這樣的軟件變得普遍，它可以減少創(chuàng)造高質(zhì)量藝術(shù)所需的時(shí)間。

這種圖像生成技術(shù)，其實(shí)在三維渲染方面有著非常廣泛的應(yīng)用，其中最具有代表性的工作之一，就是由2D圖像生成3D圖像。我們知道，3D圖像相比于2D圖像多了深度信息這一個(gè)維度，但也就是這一個(gè)差別，導(dǎo)致了3D圖像相比于2D圖像所多出的信息不是一星半點(diǎn)。因此，倘若想要從2D圖像生成3D圖像，其難度之大可想而知。

為此，谷歌在18年10月18日申請(qǐng)了一項(xiàng)名為“通過(guò)渲染許多3D視圖來(lái)學(xué)習(xí)重構(gòu)3D形狀”的發(fā)明專利（申請(qǐng)?zhí)枺?01880030823.5），申請(qǐng)人為谷歌有限責(zé)任公司。

根據(jù)該專利目前公開的資料，讓我們一起來(lái)看看這項(xiàng)從2D圖像到3D圖像的生成方法吧。

谷歌發(fā)明的由2D圖像生成3D圖像技術(shù)解析

該技術(shù)中，主要使用了3D估計(jì)器神經(jīng)網(wǎng)絡(luò)，如上圖，為使用3D估計(jì)器神經(jīng)網(wǎng)絡(luò)來(lái)估計(jì)圖像中描繪的面部的3D形狀和紋理，并基于估計(jì)的3D形狀和紋理生成替身的系統(tǒng)示意圖。用戶通過(guò)上傳面部圖像105，系統(tǒng)100可以對(duì)照片進(jìn)行處理后生成替身115，這里所說(shuō)的替身也就是用戶的3D畫像。

在具體的過(guò)程中，照片首先由面部識(shí)別引擎110進(jìn)行處理，從而生成用戶的面部圖像特征112，該特征在3D估計(jì)神經(jīng)網(wǎng)絡(luò)中被處理，基于圖像特征估計(jì)照片中描繪的用戶面部的3D形狀和紋理，從而生成形狀紋理數(shù)據(jù)122。

最后，數(shù)據(jù)122被發(fā)送到3D渲染引擎130中，基于用戶獨(dú)特的面部形狀、紋理特征來(lái)生成用戶的3D畫像，并且為了做到更加真實(shí)，渲染引擎可以給出特定的視圖，視圖中融合了相機(jī)角度、光照以及視場(chǎng)的估計(jì)信息，可以讓生成的圖像質(zhì)量更加逼真。

谷歌發(fā)明的由2D圖像生成3D圖像技術(shù)解析

如上圖，為用于用戶3D渲染圖像生成的3D估計(jì)器神經(jīng)網(wǎng)絡(luò)220的系統(tǒng)框圖，整個(gè)系統(tǒng)的結(jié)構(gòu)還是相當(dāng)復(fù)雜的，從圖中我們可以看到這種神經(jīng)網(wǎng)絡(luò)是如何工作的。根據(jù)目前的技術(shù)來(lái)看，訓(xùn)練3D估計(jì)器神經(jīng)網(wǎng)絡(luò)通常有兩個(gè)困難：第一，由3D對(duì)象的圖像和那些3D對(duì)象的3D形狀和紋理組成的訓(xùn)練對(duì)通常是有限的并且難以獲得；第二，訓(xùn)練3D估計(jì)器神經(jīng)網(wǎng)絡(luò)可能經(jīng)常導(dǎo)致3D估計(jì)器神經(jīng)網(wǎng)絡(luò)的網(wǎng)絡(luò)欺騙。

因此，該專利發(fā)明的整個(gè)網(wǎng)絡(luò)分為了監(jiān)督訓(xùn)練回路以及無(wú)監(jiān)督訓(xùn)練回路，通過(guò)二者相結(jié)合的方式，在完全訓(xùn)練階段期間，僅利用無(wú)監(jiān)督訓(xùn)練回路，從而允許估計(jì)神經(jīng)網(wǎng)絡(luò)輸出更快地收斂。

因?yàn)闊o(wú)監(jiān)督訓(xùn)練回路可以在預(yù)訓(xùn)練階段和完全訓(xùn)練階段兩者期間使用，所以從無(wú)監(jiān)督訓(xùn)練回路開始，在預(yù)訓(xùn)練之后，完全訓(xùn)練可以對(duì)大量迭代和大量樣本單獨(dú)利用無(wú)監(jiān)督訓(xùn)練回路，來(lái)改進(jìn)3D估計(jì)神經(jīng)網(wǎng)絡(luò)估計(jì)圖像中的對(duì)象的3D形狀和紋理的能力。

谷歌發(fā)明的由2D圖像生成3D圖像技術(shù)解析

最后，是這種無(wú)監(jiān)督訓(xùn)練回路訓(xùn)練的流程圖，系統(tǒng)首先需要獲取對(duì)象圖像的第一圖像特征，該特征就是上述所說(shuō)用戶面部信息的原始數(shù)據(jù)，其次，將這種第一圖像特征提供給3D估計(jì)器神經(jīng)網(wǎng)絡(luò)并獲取3D形狀和紋理。

根據(jù)這些形狀和紋理進(jìn)行3D渲染，并從多個(gè)3D視圖中導(dǎo)出第二圖像特征，基于圖像特征的損失函數(shù)計(jì)算損失，以知道神經(jīng)網(wǎng)絡(luò)進(jìn)行反向傳播以得到更加良好的效果以及減少圖像生成的損失。

以上就是谷歌發(fā)明的利用2D圖像生成3D圖像的專利技術(shù)，從2D到3D圖像的轉(zhuǎn)換過(guò)程中，由于2D圖像缺少了很多信息，因此該技術(shù)利用3D估計(jì)神經(jīng)網(wǎng)絡(luò)進(jìn)行信息的補(bǔ)全以及預(yù)測(cè)，并融合了拍攝角度、光照等信息，讓生成的3D圖像看起來(lái)更加逼真，這種技術(shù)對(duì)于三維建模以及工業(yè)應(yīng)用都具有極大的指導(dǎo)意義。

關(guān)于嘉德

深圳市嘉德知識(shí)產(chǎn)權(quán)服務(wù)有限公司由曾在華為等世界500強(qiáng)企業(yè)工作多年的知識(shí)產(chǎn)權(quán)專家、律師、專利代理人組成，熟悉中歐美知識(shí)產(chǎn)權(quán)法律理論和實(shí)務(wù)，在全球知識(shí)產(chǎn)權(quán)申請(qǐng)、布局、訴訟、許可談判、交易、運(yùn)營(yíng)、標(biāo)準(zhǔn)專利協(xié)同創(chuàng)造、專利池建設(shè)、展會(huì)知識(shí)產(chǎn)權(quán)、跨境電商知識(shí)產(chǎn)權(quán)、知識(shí)產(chǎn)權(quán)海關(guān)保護(hù)等方面擁有豐富的經(jīng)驗(yàn)。
責(zé)任編輯:tzh

聲明：本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人，不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用，如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題，請(qǐng)聯(lián)系本站處理。舉報(bào)投訴

3D

3D

+關(guān)注

關(guān)注
9

文章
2878

瀏覽量
107555
谷歌

谷歌

+關(guān)注

關(guān)注
27

文章
6168

瀏覽量
105397
神經(jīng)網(wǎng)絡(luò)

神經(jīng)網(wǎng)絡(luò)

+關(guān)注

關(guān)注
42

文章
4771

瀏覽量
100778

評(píng)論

相關(guān)推薦

3D封裝熱設(shè)計(jì)：挑戰(zhàn)與機(jī)遇并存

隨著半導(dǎo)體技術(shù)的不斷發(fā)展，芯片封裝技術(shù)也在持續(xù)進(jìn)步。目前，2D封裝和3D封裝是兩種主流的封裝技術(shù)。這兩種封裝

發(fā)表于 07-25 09:46 ?1430次閱讀

<b class='flag-5'>3D</b>封裝熱設(shè)計(jì)：挑戰(zhàn)與機(jī)遇并存

歡創(chuàng)播報(bào) 騰訊元寶首發(fā)3D生成應(yīng)用

App。騰訊元寶APP發(fā)布時(shí)，就圍繞工作效率場(chǎng)景、日常生活等場(chǎng)景提供了豐富的應(yīng)用，并有創(chuàng)建個(gè)人智能體等個(gè)性化體驗(yàn)，“3D角色夢(mèng)工廠”則將大模型生成技術(shù)和3D應(yīng)用結(jié)合，進(jìn)一步創(chuàng)新了元寶

發(fā)表于 07-18 11:39 ?758次閱讀

歡創(chuàng)播報(bào) 騰訊元寶首發(fā)<b class='flag-5'>3D</b><b class='flag-5'>生成</b>應(yīng)用

蘇州吳中區(qū)多色PCB板元器件3D視覺檢測(cè)技術(shù)

3D視覺檢測(cè)相較于2D視覺檢測(cè)，有其獨(dú)特的優(yōu)勢(shì)，不受產(chǎn)品表面對(duì)比度影響，精確檢出產(chǎn)品形狀，可以測(cè)出高度（厚度）、體積、平整度等。在實(shí)際應(yīng)用中可以與2D結(jié)合做檢測(cè)。利用3D的特性，可以檢

發(fā)表于 06-14 15:02 ?416次閱讀

蘇州吳中區(qū)多色PCB板元器件<b class='flag-5'>3D</b>視覺檢測(cè)<b class='flag-5'>技術(shù)</b>

英倫科技的15.6寸2D-3D可切換光場(chǎng)裸眼3D顯示屏有哪些特點(diǎn)？

隨著科技的快速發(fā)展，人類對(duì)于視覺體驗(yàn)的追求也在不斷攀升。從平面的2D圖像到立體的3D影像，我們一直在探索如何讓虛擬世界更加逼真。如今，英倫科技憑借其創(chuàng)新實(shí)力，推出了一款革命性的顯示設(shè)備——15.6寸

發(fā)表于 05-28 11:17 ?367次閱讀

英倫科技的15.6寸<b class='flag-5'>2D-3D</b>可切換光場(chǎng)裸眼<b class='flag-5'>3D</b>顯示屏有哪些特點(diǎn)？

Teledyne e2v公司和Airy3D公司合作，提供更實(shí)惠的3D視覺解決方案

。 △Topaz5D?是一款1,920 x 1,080分辨率的低噪聲全局快門2D和3D圖像傳感器。Teledyne e2v Teledyne

發(fā)表于 05-11 10:12 ?409次閱讀

Teledyne e<b class='flag-5'>2</b>v公司和Airy<b class='flag-5'>3D</b>公司合作，提供更實(shí)惠的<b class='flag-5'>3D</b>視覺解決方案

NVIDIA Instant NeRF將多組靜態(tài)圖像變?yōu)?b class='flag-5'>3D數(shù)字場(chǎng)景

想象一幅風(fēng)光旖旎的畫面，比如水畔的懸崖峭壁。即便只是 2D 圖像，如此美景依舊令人心馳神往。如果同一畫面能以 3D 效果展現(xiàn)，那么無(wú)需跋涉就能身臨其境。

發(fā)表于 05-07 09:15 ?415次閱讀

通過(guò)2D/3D異質(zhì)結(jié)構(gòu)精確控制鐵電材料弛豫時(shí)間

受經(jīng)典德拜弛豫啟發(fā)的米勒模型提供了通過(guò)操縱弛豫時(shí)間來(lái)控制自發(fā)極化的理論框架。作者通過(guò)使用層轉(zhuǎn)移技術(shù)形成的2D/C-3D/2D異質(zhì)結(jié)構(gòu)克服了傳統(tǒng)異質(zhì)結(jié)存在的鐵電性惡化和能量損失的問(wèn)題。

發(fā)表于 04-29 10:27 ?682次閱讀

通過(guò)<b class='flag-5'>2D</b>/<b class='flag-5'>3D</b>異質(zhì)結(jié)構(gòu)精確控制鐵電材料弛豫時(shí)間

Teledyne e2v宣布推出一款全高清CMOS圖像傳感器：Topaz5D?

據(jù)麥姆斯咨詢報(bào)道，近期，Teledyne科技旗下公司、全球成像解決方案創(chuàng)新者Teledyne e2v宣布推出一款全高清CMOS圖像傳感器：Topaz5D?，旨在將2D視覺與

發(fā)表于 04-11 14:14 ?648次閱讀

有了2D NAND，為什么要升級(jí)到3D呢？

2D NAND和3D NAND都是非易失性存儲(chǔ)技術(shù)（NVM Non-VolatileMemory），屬于Memory（存儲(chǔ)器）的一種。

發(fā)表于 03-17 15:31 ?1023次閱讀

有了<b class='flag-5'>2D</b> NAND，為什么要升級(jí)到<b class='flag-5'>3D</b>呢？

將MLX75027 3D圖像傳感器與CX3 RDK MIPI開發(fā)板連接后報(bào)錯(cuò)如何解決？

我們打算將MLX75027 3D圖像傳感器與CX3 RDK MIPI開發(fā)板連接，但EZ-USB-suite軟件中配置MIPI塊參數(shù)中針對(duì)的是2D圖像

發(fā)表于 02-28 07:41

Adobe提出DMV3D：3D生成只需30秒！讓文本、圖像都動(dòng)起來(lái)的新方法！

因此，本文研究者的目標(biāo)是實(shí)現(xiàn)快速、逼真和通用的 3D 生成。為此，他們提出了 DMV3D。DMV3D 是一種全新的單階段的全類別擴(kuò)散模型，能直接根據(jù)模型文字或單張圖片的輸入，

發(fā)表于 01-30 16:20 ?864次閱讀

高分工作！Uni3D：3D基礎(chǔ)大模型，刷新多個(gè)SOTA！

我們主要探索了3D視覺中scale up模型參數(shù)量和統(tǒng)一模型架構(gòu)的可能性。在NLP / 2D vision領(lǐng)域，scale up大模型（GPT-4，SAM，EVA等）已經(jīng)取得了很impressive

發(fā)表于 01-30 15:56 ?886次閱讀

介紹一種使用2D材料進(jìn)行3D集成的新方法

美國(guó)賓夕法尼亞州立大學(xué)的研究人員展示了一種使用2D材料進(jìn)行3D集成的新穎方法。

發(fā)表于 01-13 11:37 ?1071次閱讀

如何搞定自動(dòng)駕駛3D目標(biāo)檢測(cè)！

可用于自動(dòng)駕駛場(chǎng)景下基于圖像的3D目標(biāo)檢測(cè)的數(shù)據(jù)集總結(jié)。其中一些數(shù)據(jù)集包括多個(gè)任務(wù)，這里只報(bào)告了3D檢測(cè)基準(zhǔn)（例如KITTI 3D發(fā)布了超過(guò)40K的

發(fā)表于 01-05 10:43 ?589次閱讀

一種用于2D/3D圖像處理算法的指令集架構(gòu)以及對(duì)應(yīng)的算法部署方法

二維（2D）和三維（3D）雙模視覺信息在自動(dòng)駕駛、工業(yè)機(jī)器人、人機(jī)交互等前沿領(lǐng)域具有廣泛的應(yīng)用前景。

發(fā)表于 01-05 10:35 ?463次閱讀

搜索歷史

谷歌發(fā)明的由2D圖像生成3D圖像技術(shù)解析

評(píng)論