0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

逼真到頭發(fā)絲,光線可調(diào),Meta推出實時3D頭像合成方法

3D視覺工坊 ? 來源:機器之心 ? 2023-12-10 10:02 ? 次閱讀

Meta 一直沒放棄元宇宙。

2021 年,F(xiàn)acebook 將「元宇宙(metaverse)」作為公司主營業(yè)務(wù),并將公司名稱更改為 Meta。然而,這一年,隨著 ChatGPT 的橫空出世,生成式 AI 成為一個新的研究趨勢,很多科技公司都將生成式 AI 作為公司重要研發(fā)業(yè)務(wù)。但 Meta 一直沒有停止 VR/AR 的研究步伐。

最近,Meta 的 Codec Avatars Lab 提出了一種高保真、光線可調(diào)節(jié)的虛擬頭像合成方法 ——Relightable Gaussian Codec Avatars。

302b95da-96ad-11ee-8b88-92fbcf53809c.png

論文地址:https://arxiv.org/pdf/2312.03704.pdf

項目主頁:https://shunsukesaito.github.io/rgca/

今年 9 月,Meta 首席執(zhí)行官馬克?扎克伯格與麻省理工學(xué)院(MIT)科學(xué)家 Lex Fridman 在元宇宙里進行了一小時的對話。彼時,兩位的形象是使用掃描技術(shù)構(gòu)建的用戶面部 3D 模型,逼真度已經(jīng)很高。

現(xiàn)在,Relightable Gaussian Codec Avatars 能夠構(gòu)建更加逼真、光線可調(diào)節(jié)的實時 3D 頭像,精細到連頭發(fā)絲都清晰可見:

30442b4a-96ad-11ee-8b88-92fbcf53809c.png

下面我們來看下 Relightable Gaussian Codec Avatars 方法的核心內(nèi)容和實驗結(jié)果。

方法簡介

我們知道,人類的視覺感知對人臉外觀高度敏感,因此合成 3D 頭像 / 虛擬化身(avatar)一直存在一些挑戰(zhàn)。

首先,人類頭部由高度復(fù)雜和多樣化的材料組成,這些材料表現(xiàn)出不同的散射和反射特性。例如,皮膚由于微觀幾何形狀以及顯著的次表面散射而產(chǎn)生復(fù)雜的反射,頭發(fā)由于其半透明纖維結(jié)構(gòu)而表現(xiàn)出具有多次反射的面外散射,而眼睛有多個具有高反射膜的層??偟膩碚f,沒有一種單一的材料表征可以準確地表示所有這些,尤其是實時的。

為了以統(tǒng)一的方式表征人體頭部的多種材質(zhì),該研究提出了一種基于可學(xué)習(xí)輻射傳輸(radiance transfer)的新型可重新照明外觀模型,使用球面高斯實現(xiàn)了全頻率反射的實時重新照明。

304d9a86-96ad-11ee-8b88-92fbcf53809c.gif

另一方面,對運動中的底層幾何體進行精確跟蹤和建模極具挑戰(zhàn)性。為此,該研究提出基于 3D 高斯的可驅(qū)動化身,使用 Gaussian Splatting 技術(shù)有效地渲染復(fù)雜的幾何細節(jié)。

305a52ee-96ad-11ee-8b88-92fbcf53809c.gif

3063e49e-96ad-11ee-8b88-92fbcf53809c.gif

此外,該研究還提出了可重新照明的顯式眼睛模型,首次以完全數(shù)據(jù)驅(qū)動的方式實現(xiàn)對其他面部運動以及全頻率眼部反射的注視控制,并進一步提高了眼睛反射的保真度。

30714d00-96ad-11ee-8b88-92fbcf53809c.gif

最終,Relightable Gaussian Codec Avatars 可以捕獲 3D 一致的亞毫米細節(jié),例如動態(tài)面部序列上的發(fā)絲和毛孔。

307d7a30-96ad-11ee-8b88-92fbcf53809c.png

實驗及結(jié)果

上圖 1 顯示了重建的虛擬人物可以擁有新的表情、視圖以及光照,包括點光源和高分辨率環(huán)境圖。就連眼睛中的光反射,都忠實地再現(xiàn)了周圍環(huán)境,而不會丟失高頻細節(jié)。

如圖 3 所示,Relightable Gaussian Codec Avatars方法能夠?qū)崿F(xiàn) 3D 一致且高保真的內(nèi)部分解。

30846a0c-96ad-11ee-8b88-92fbcf53809c.png

幾何表征。該研究通過比較三種變體來評估幾何組件:本文方法、本文方法但排除了顯式眼睛模型(EEM)和基于體素的原型。為了公平比較,該研究使用相同的外觀模型,僅改變幾何表征(表 1 和表 2 B、D、H)。

3090d09e-96ad-11ee-8b88-92fbcf53809c.png

309a584e-96ad-11ee-8b88-92fbcf53809c.png

圖 4 清楚地表明,基于 3D 高斯的幾何體可以比 MVP 更好地建模皮膚細節(jié)和發(fā)絲。此外,完整的模型與 EEM 結(jié)合使用時,眼睛里的反光都非常令人折服。除了在強光下的 SSIM 指標外,高斯模型在所有指標中都取得了優(yōu)異的性能。

30a5828c-96ad-11ee-8b88-92fbcf53809c.png

外觀表征。對于外觀表征,該研究將外觀模型與現(xiàn)有的 relightable 外觀表征進行了比較。如上表 1 和表 2 C、D、E 顯示,本文的外觀表征在大多數(shù)指標中優(yōu)于現(xiàn)有的外觀模型。

如圖 5 所示,雖然線性模型可以產(chǎn)生正確的顏色,但 relighting 的結(jié)果模糊且缺乏高頻細節(jié)。EyeNeRF 中與視圖相關(guān)的球諧函數(shù)顯示出更詳細的反射,但由于使用球諧函數(shù)來實現(xiàn)鏡面反射,因此其表現(xiàn)力受到限制。此外,該研究觀察到依賴于視圖的球諧函數(shù)更容易過度擬合,從而導(dǎo)致動畫中出現(xiàn)閃爍偽影。相比之下,Relightable Gaussian Codec Avatars方法不受帶寬限制,因此實現(xiàn)了高頻反射。

30b1c7b8-96ad-11ee-8b88-92fbcf53809c.png

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 3D
    3D
    +關(guān)注

    關(guān)注

    9

    文章

    2878

    瀏覽量

    107548
  • Facebook
    +關(guān)注

    關(guān)注

    3

    文章

    1429

    瀏覽量

    54759
  • Meta
    +關(guān)注

    關(guān)注

    0

    文章

    271

    瀏覽量

    11388

原文標題:逼真到頭發(fā)絲,光線可調(diào),Meta推出實時3D頭像合成方法

文章出處:【微信號:3D視覺工坊,微信公眾號:3D視覺工坊】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏

    評論

    相關(guān)推薦

    3D光線掃輪廓傳感器在汽車行業(yè)的汽車車縫檢測的應(yīng)用

    在實際應(yīng)用中,3D光線掃傳感器可以集成到自動化檢測系統(tǒng)中,與機器人或自動化輸送系統(tǒng)配合,實現(xiàn)對汽車車縫的全面檢測。這些系統(tǒng)通常包括傳感器、控制軟件、數(shù)據(jù)處理單元和用戶界面,能夠自動分析檢測數(shù)據(jù)
    的頭像 發(fā)表于 09-14 09:00 ?464次閱讀
    <b class='flag-5'>3D</b>激<b class='flag-5'>光線</b>掃輪廓傳感器在汽車行業(yè)的汽車車縫檢測的應(yīng)用

    裸眼3D筆記本電腦——先進的光場裸眼3D技術(shù)

    隨著科技的不斷進步,裸眼3D技術(shù)已經(jīng)不再是科幻電影中的幻想。如今,英倫科技裸眼3D筆記本電腦將這一前沿科技帶到了我們的日常生活中。無論你是專業(yè)的3D模型設(shè)計師,還是希望在視頻播放和模型展示中體驗
    的頭像 發(fā)表于 07-16 10:04 ?543次閱讀

    Meta推出革命性3D Gen AI模型:1分鐘內(nèi)生成高質(zhì)量3D內(nèi)容

    在科技日新月異的今天,Meta再次引領(lǐng)創(chuàng)新潮流,宣布了一項令人矚目的技術(shù)突破——3D Gen AI模型的誕生。這款先進的模型以其前所未有的高效性與卓越品質(zhì),重新定義了3D內(nèi)容創(chuàng)作的邊界,標志著數(shù)字藝術(shù)創(chuàng)作進入了一個全新的快速響應(yīng)
    的頭像 發(fā)表于 07-04 18:12 ?1027次閱讀

    奧比中光3D相機打造高質(zhì)量、低成本的3D動作捕捉與3D動畫內(nèi)容生成方

    高質(zhì)量、低成本的3D動作捕捉與3D動畫內(nèi)容生成方案。 Moverse公司總部位于希臘塞薩洛尼基,是三維動畫相關(guān)媒體和娛樂行業(yè)的一家科技創(chuàng)業(yè)公司?;趭W比中光3D相機,Moverse可以
    的頭像 發(fā)表于 06-25 16:37 ?1081次閱讀

    VIVERSE 推行實時3D渲染: 探索Polygon Streaming技術(shù)力量與應(yīng)用

    在商業(yè)領(lǐng)域和娛樂行業(yè)中,3D渲染技術(shù)一直是推動視覺體驗革新的關(guān)鍵力量。隨著技術(shù)的進步,實時3D渲染技術(shù)逐漸成為主流,近期VIVERSE平臺對外發(fā)布引入一項全新技術(shù)——Polygon
    的頭像 發(fā)表于 05-31 15:49 ?2344次閱讀
    VIVERSE 推行<b class='flag-5'>實時</b><b class='flag-5'>3D</b>渲染: 探索Polygon Streaming技術(shù)力量與應(yīng)用

    什么是光場裸眼3D?

    光場裸眼3D技術(shù),是一種無需任何輔助設(shè)備(如3D眼鏡或頭顯)即可產(chǎn)生真實三維效果的技術(shù)。它通過特殊的顯示設(shè)備,精確控制光線的方向和強度,使觀察者在不同的角度都能看到清晰、連續(xù)的立體圖像。這種技術(shù)的核心在于模擬人眼對真實世界的觀察
    的頭像 發(fā)表于 05-27 14:21 ?1096次閱讀
    什么是光場裸眼<b class='flag-5'>3D</b>?

    光纖尖端上3D打印的玻璃折射率傳感器,可測量有機溶劑的濃度

    據(jù)麥姆斯咨詢報道,瑞典斯德哥爾摩皇家理工學(xué)院(KTH Royal Institute of Technology)的研究人員首次在光纖尖端(其表面小至只有人類頭發(fā)絲橫截面大?。┥?b class='flag-5'>3D打印了石英玻璃微光學(xué)器件。
    的頭像 發(fā)表于 05-24 09:39 ?455次閱讀
    光纖尖端上<b class='flag-5'>3D</b>打印的玻璃折射率傳感器,可測量有機溶劑的濃度

    天馬微電子首發(fā)TIANMA META SIGHT光場3D解決方案

    3D顯示領(lǐng)域,視角的大小和畫面的穩(wěn)定性一直是行業(yè)內(nèi)的難題,TIANMA META SIGHT 3D光場顯示器采用了先進的追蹤式超多視點技術(shù)
    的頭像 發(fā)表于 05-23 10:21 ?511次閱讀
    天馬微電子首發(fā)TIANMA <b class='flag-5'>META</b> SIGHT光場<b class='flag-5'>3D</b>解決方案

    UltiMaker正式推出了工業(yè)級3D打印機—UltiMaker Factor 4

    與之前的UltiMaker S系列桌面3D打印機不同,全球3D打印領(lǐng)域的領(lǐng)導(dǎo)者UltiMaker正式推出了工業(yè)級3D打印機——UltiMaker Factor 4。
    的頭像 發(fā)表于 05-09 16:58 ?561次閱讀

    Meta發(fā)布SceneScript視覺模型,高效構(gòu)建室內(nèi)3D模型

    Meta 表示,此模型具備創(chuàng)建室內(nèi) 3D 模型的高效與輕便,僅需幾KB內(nèi)存便能生成完整清晰的幾何圖形,同時,這些形狀數(shù)據(jù)具備可解釋性,便于用戶理解和編輯。
    的頭像 發(fā)表于 03-26 11:16 ?580次閱讀

    Stability AI推出全新Stable Video 3D模型

    近日,Stability AI 推出了全新的 Stable Video 3D 模型,該模型以其獨特的功能吸引了眾多關(guān)注。此模型具備從單張圖像中生成多視圖3D視頻的能力,為視頻制作領(lǐng)域帶來了革命性的突破。
    的頭像 發(fā)表于 03-22 10:30 ?855次閱讀

    谷歌模型合成軟件有哪些

    谷歌模型合成軟件通常指的是谷歌提供的用于創(chuàng)建、修改和共享3D模型的軟件。目前,谷歌推出的模型合成軟件中最知名的是Google SketchUp。
    的頭像 發(fā)表于 02-29 18:20 ?1395次閱讀

    Adobe提出DMV3D3D生成只需30秒!讓文本、圖像都動起來的新方法

    因此,本文研究者的目標是實現(xiàn)快速、逼真和通用的 3D 生成。為此,他們提出了 DMV3D。DMV3D 是一種全新的單階段的全類別擴散模型,能直接根據(jù)模型文字或單張圖片的輸入,生成
    的頭像 發(fā)表于 01-30 16:20 ?863次閱讀
    Adobe提出DMV<b class='flag-5'>3D</b>:<b class='flag-5'>3D</b>生成只需30秒!讓文本、圖像都動起來的新<b class='flag-5'>方法</b>!

    介紹一種使用2D材料進行3D集成的新方法

    美國賓夕法尼亞州立大學(xué)的研究人員展示了一種使用2D材料進行3D集成的新穎方法。
    的頭像 發(fā)表于 01-13 11:37 ?1070次閱讀

    友思特C系列3D相機:實時3D點云圖像

    3D相機
    虹科光電
    發(fā)布于 :2024年01月10日 17:39:25