亚洲精品久久久久成人AⅤ,爱情岛亚洲永久自拍品质

來自華南理工大學、香港理工大學、跨維智能、鵬城實驗室等機構的研究團隊提出了一種基于文本驅(qū)動的三維模型風格化方法，該方法可對輸入的三維模型根據(jù)文本進行更具真實性和魯棒性的風格化。

根據(jù)給定輸入創(chuàng)建 3D 內(nèi)容（例如，根據(jù)文本提示、圖像或 3D 形狀）在計算機視覺和圖形領域具有重要應用。然而這個問題是具有挑戰(zhàn)性的，現(xiàn)實中通常需要專業(yè)藝術家（Technical Artist）耗費大量的時間成本去創(chuàng)作 3D 內(nèi)容。同時，許多網(wǎng)上的三維模型庫中的資源通常是沒有任何材質(zhì)的裸露三維模型，要想將他們應用到現(xiàn)階段的渲染引擎中，需要 Technical Artist 為它們創(chuàng)作高質(zhì)量的材質(zhì)，燈光和法向貼圖。因此，如果有辦法可以實現(xiàn)自動化、多樣化和逼真的三維模型資產(chǎn)生成，將是很有前景的。

因此，華南理工大學、香港理工大學、跨維智能、鵬城實驗室等機構的研究團隊提出了一種基于文本驅(qū)動的三維模型風格化方法——TANGO，該方法對于給定的三維模型和文本，可以自動生成更具有真實性的 SVBRDF 材質(zhì)，法向貼圖和燈光，并且對低質(zhì)量三維模型有更好的魯棒性。該研究已被 NeurIPS 2022 接收。

模型效果

對于給定的文本輸入和三維模型，TANGO 可以產(chǎn)生精細程度較高的具有照片級真實感的細節(jié)，并且不會在三維模型表面產(chǎn)生自交問題。如下圖 1 所示， TANGO 不僅在光滑的材料（如金，銀等材質(zhì)）上呈現(xiàn)出了逼真的反射效果，而且對于不平整的材質(zhì)（例如磚塊等）也能通過逐點法線的估計渲染出凹凸不平的效果。

圖 1. TANGO 的風格化結果

TANGO 能夠生成真實渲染結果的關鍵在于能夠精準地把著色模型中的每一個部件（SVBRDF，法向貼圖，燈光）拆分開，并分別學習，最后這些拆分的部件再通過球高斯可微分渲染器輸出圖片，并送到 CLIP 中和輸入文本計算 loss。為了展現(xiàn)解耦部件的合理性，該研究對每個部件都進行了可視化。圖 2 （a）展示了 “一雙磚塊做成的鞋子” 的風格化結果，（b）展示了三維模型原本的法向，（c）是 TANGO 對三維模型上每個點預測的法向，（d）（e）（f）分別表示 SVBRDF 中的漫反射，粗糙度和鏡面反射參數(shù)，（g）是 TANGO預測的用球高斯函數(shù)表達的環(huán)境光。

圖 2 解耦的渲染部件可視化

同時，該研究也可以對 TANGO 輸出的結果進行編輯。例如在圖 3 中，該研究可以換用其他的光照貼圖對 TANGO 的結果進行重新打光；在圖 4 中，可以對粗糙度和鏡面反射度參數(shù)進行編輯，實現(xiàn)對物體表面反射程度的改變。

圖 3 對 TANGO 風格化結果進行重新打光

圖 4 對物體材質(zhì)進行編輯

另外，由于 TANGO 采用預測法向貼圖的方式增添物體表面細節(jié)，因此對于頂點數(shù)較少的三維模型也有很好的魯棒性。如圖 5 所示，原始的 lamp 和 alien 模型分別有 41160 和 68430 個面，研究人員對原始模型進行了降采樣，得到了只有 5000 個面的模型?？梢钥吹?TANGO 在原始模型和降采樣模型上的表現(xiàn)基本相似，而 Text2Mesh 則在低質(zhì)量的模型上出現(xiàn)了較為嚴重的自交現(xiàn)象。

圖 5 魯棒性測試

原理方法

TANGO 主要關注于由文本指導三維物體風格化的方法。這一領域目前最相關的工作是 Text2Mesh，它使用了預訓練模型 CLIP 作為指導，預測三維模型表面頂點的顏色和位置偏移，從而實現(xiàn)風格化。然而簡單地預測表面頂點顏色通常會產(chǎn)生不真實的渲染效果，且不規(guī)則的頂點偏移會造成很嚴重的自交。因此，該研究借鑒傳統(tǒng)的基于物理的渲染管線，將整個渲染過程解耦為 SVBRDF 材質(zhì)，法向貼圖和燈光的預測過程，并分別用球高斯函數(shù)表達解耦的元素。這種基于物理的解耦方式使得 TANGO 可以正確產(chǎn)生具有真實感的渲染效果，并具有很好的魯棒性。

圖 6 TANGO 流程圖

圖 6 展示了 TANGO 的工作流程。給定一個三維模型和文本（例如圖中的“一個金子做成的鞋”），該研究先把這個三維模型縮放到一個單位球內(nèi)，接著在三維模型的附近采樣相機位置，在這個相機位置發(fā)射射線找到與三維模型的交點xp和該交點的法線方向np。接下來，xp和np會被送入SVBRDF網(wǎng)絡和 Normal 網(wǎng)絡中，預測該點的材質(zhì)參數(shù)和法線方向，同時，用多個球高斯函數(shù)來表達場景中的光照。對于每一次訓練迭代，該研究使用可微分的球高斯渲染器渲染圖像，然后使用 CLIP 模型的圖像編碼器對增強圖像進行編碼，最后 CLIP 模型反向傳播梯度更新所有可學習的參數(shù)。

總結

本文提出了 TANGO，一種根據(jù)輸入文本對三維模型生成逼真外觀風格，對低質(zhì)量模型具有魯棒性的新方法。通過將外觀風格解耦 SVBRDF，局部幾何變化（逐點法向）和光照條件，并將這些用球高斯函數(shù)表示并渲染，能夠用 CLIP 作為 loss 監(jiān)督并進行學習。與現(xiàn)有方法相比，即使對于低質(zhì)量的三維模型，TANGO 也可以具有很好的魯棒性。然而，逐點法向提供幾何細節(jié)的方式在避免產(chǎn)生自交的同時，也會使得能表達的材質(zhì)表面凹凸程度略微降低，該研究認為 TANGO 和基于頂點偏移的 Text2Mesh 在各自的方向上都進行了很好的初步嘗試，會啟發(fā)更多的后續(xù)研究。

審核編輯：彭靜

阅读全文

聲明：本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權轉載。文章觀點僅代表作者本人，不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用，如有內(nèi)容侵權或者其他違規(guī)問題，請聯(lián)系本站處理。舉報投訴

3D

3D

+關注

關注
9

文章
2936

瀏覽量
109088
計算機視覺

計算機視覺

+關注

關注
8

文章
1704

瀏覽量
46437
三維模型

三維模型

+關注

關注
0

文章
52

瀏覽量
13220

原文標題：NeurIPS 2022 | 基于文本驅(qū)動的三維模型風格化方法

文章出處：【微信號：3D視覺工坊，微信公眾號：3D視覺工坊】歡迎添加關注！文章轉載請注明出處。

基于OpenGL 的汽車轉向三維模型設計

汽車軌跡的誤差。使用OpenGL 設計汽車三維模型，通過估算橫擺角速度得出簡化的轉向軌跡模型。據(jù)此設計汽車轉向三維動畫，實驗結果表明汽車軌跡和姿態(tài)都取得了較好的可視

發(fā)表于 05-17 11:53

三維快速建模技術與三維掃描建模的應用

相關處理，構建其三維模型和對模型進行紋路映射，最終完成物體的三維模型構建。該三維掃描建模流程

發(fā)表于 08-07 11:14

Altium Designer三維PCB可視化引擎

　　Altium Limited為 Altium Designer 新增了三維PCB可視化引擎，讓所有設計師體驗逼真的板卡設計。通過 Altium Designer 6.8的三維 PCB 可視

發(fā)表于 08-31 11:23

三維可視化的應用和優(yōu)勢

，為此三維可視化運維系統(tǒng)登場了?！　?b class='flag-5'>三維可視化的應用　　宏觀場景可視化：在特定的環(huán)境中對隨著時間推移而不斷變化的目標實體進行檢測，可以直觀、

發(fā)表于 12-02 11:52

如何導入機械臂的三維模型

目的　　本文手把手教你如何在 Mathematica 軟件中搭建機械臂的三維仿真環(huán)境，包括以下幾部分：　　1.　如何導入機械臂的三維模型；　　2.　如何進行（正/逆）運動學仿真；　　3.

發(fā)表于 09-07 09:25

Web環(huán)境下的三維虛擬人模型研究

針對用戶有聲化、可視化獲取網(wǎng)頁文本信息需求，提出嵌入式三維虛擬人方法，以實現(xiàn)Web環(huán)境下的可視語音合成。建立連桿結構的

發(fā)表于 01-06 17:17 ?15次下載

三維模型教材

發(fā)表于 11-20 17:44 ?0次下載

三維模型的空間匹配與拼接

為獲得敦煌莫高窟第172窟的全景三維模型，實現(xiàn)文化遺產(chǎn)數(shù)字化保護，提出一種三維模型的空間匹配與拼接方法

發(fā)表于 11-22 16:46 ?0次下載

基于非量測相片的三維模型重建

隨著地球數(shù)字化、信息化、智能化的發(fā)展，快速將物體的原態(tài)呈現(xiàn)出來，建立物體的三維模型成為當前的研究熱點。目前，已有的

發(fā)表于 02-23 10:30 ?0次下載

三維數(shù)字化三維激光掃描技術是連接BIM模型和工程現(xiàn)場的有效紐帶

劇院三維數(shù)字化三維激光掃描技術是連接BIM模型和工程現(xiàn)場的有效紐帶三維激光掃描技術是整個三維數(shù)

發(fā)表于 04-10 17:37 ?1292次閱讀

三維數(shù)字化三維激光掃描技術是連接BIM模型和工程現(xiàn)場的有效紐帶

劇院三維數(shù)字化三維激光掃描技術是連接BIM模型和工程現(xiàn)場的有效紐帶三維激光掃描技術是整個三維數(shù)

發(fā)表于 04-12 09:51 ?1225次閱讀

劇院三維數(shù)字化三維激光掃描技術是連接BIM模型和工程現(xiàn)場

劇院三維數(shù)字化三維激光掃描技術是連接BIM模型和工程現(xiàn)場的有效紐帶三維激光掃描技術是整個三維數(shù)

發(fā)表于 04-24 15:33 ?912次閱讀

智慧城市_實景三維|物業(yè)樓三維掃描案例分享_泰來三維

三維激光掃描技術是近年來發(fā)展的新型測量方法,通過三維掃描獲取大量全面點云數(shù)據(jù),形成三維立體模型,實現(xiàn)快速掌握被測目標信息。

發(fā)表于 05-16 13:56 ?1221次閱讀

泰來三維|三維掃描助力變電站數(shù)字化建設

通過三維激光掃描儀對變電站進行三維掃描，獲取精準三維掃描模型，實現(xiàn)數(shù)字化孿生精準數(shù)據(jù)支持。1、數(shù)字化

發(fā)表于 08-22 14:09 ?1090次閱讀

泰來三維|文物三維掃描，文物三維模型怎樣制作

文物三維掃描，文物三維模型怎樣制作：我們都知道文物是不可再生的，要繼續(xù)保存?zhèn)鞒校枰奈?b class='flag-5'>三維數(shù)字化保護，所以

發(fā)表于 03-12 11:10 ?871次閱讀