據(jù)美國商標與專利局近日發(fā)布的信息,微軟已獲新型專利,利用深度學(xué)習(xí)構(gòu)建真實感十足的多模態(tài) 3D 面部模擬肖像。
此項專利名為《多模態(tài)三維面部建模及追蹤,制作栩栩如生的虛擬肖像》。其系統(tǒng)包括處理器和存儲器系統(tǒng),前者負責(zé)收集初始數(shù)據(jù)(即面部初始模樣)以及多元數(shù)據(jù)信號(例如用戶聲波等音頻數(shù)據(jù)),再將兩者整合并進行擬合處理。
3D 面部建模與追蹤技術(shù)通過捕捉用戶面部特征,建立 3D 頂點,并對中性面部頂點進行變形,以呈現(xiàn)出數(shù)字面部模型的各種表情。
此外,該系統(tǒng)運用深度學(xué)習(xí)技術(shù)設(shè)計虛擬肖像,可模擬用戶面部表情,用戶亦可進行微調(diào),使之更具個性。
聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。
舉報投訴
-
微軟
+關(guān)注
關(guān)注
4文章
6625瀏覽量
104311 -
存儲器
+關(guān)注
關(guān)注
38文章
7527瀏覽量
164168 -
深度學(xué)習(xí)
+關(guān)注
關(guān)注
73文章
5512瀏覽量
121398
發(fā)布評論請先 登錄
相關(guān)推薦
利用OpenVINO部署Qwen2多模態(tài)模型
多模態(tài)大模型的核心思想是將不同媒體數(shù)據(jù)(如文本、圖像、音頻和視頻等)進行融合,通過學(xué)習(xí)不同模態(tài)之間的關(guān)聯(lián),實現(xiàn)更加智能化的信息處理。簡單來說
Meta發(fā)布多模態(tài)LLAMA 3.2人工智能模型
Meta Platforms近日宣布了一項重要技術(shù)突破,成功推出了多模態(tài)LLAMA 3.2人工智能模型。這一創(chuàng)新模型不僅能夠
發(fā)掘3D文件格式的無限潛力:打造沉浸式虛擬世界
在當(dāng)今數(shù)字化時代,3D技術(shù)的應(yīng)用范圍日益廣泛,涵蓋電影后期制作、產(chǎn)品原型設(shè)計、虛擬現(xiàn)實(VR)、增強現(xiàn)實(AR)、游戲等眾多領(lǐng)域。而3D文件格式作為
依圖多模態(tài)大模型伙伴CTO精研班圓滿舉辦
大模型在不同行業(yè)領(lǐng)域的應(yīng)用前景;7月19日, “依圖科技多模態(tài)大模型伙伴CTO精研班”在杭州圓滿舉辦,讓更多的伙伴們深度體驗了依圖
裸眼3D筆記本電腦——先進的光場裸眼3D技術(shù)
隨著科技的不斷進步,裸眼3D技術(shù)已經(jīng)不再是科幻電影中的幻想。如今,英倫科技裸眼3D筆記本電腦將這一前沿科技帶到了我們的日常生活中。無論你是專業(yè)的3D
3D建模的重要內(nèi)容和應(yīng)用
3D建模是一種技術(shù),通過計算機軟件創(chuàng)建虛擬三維模型,模擬現(xiàn)實世界中的物體或場景。這項技術(shù)廣泛應(yīng)用于建筑設(shè)計、電影制作、游戲開發(fā)、工程仿真等領(lǐng)
VR虛擬空間中的3D 技術(shù)
空間中塑造3D模型 索尼在CES 2024上展示了其最新的具有“空間內(nèi)容創(chuàng)建”功能的MR頭顯,讓用戶在佩戴頭顯的同時也能編輯和塑造3D模型。用戶可以使用左右兩個不同形狀的控制器同時操縱
ad19中3d模型不顯示?
封裝庫導(dǎo)入3d模型不顯示,但導(dǎo)入3d模型后的封裝庫生成pcb文件時顯示3d模型,這是什么原因?qū)е?/div>
發(fā)表于 04-24 13:41
包含具有多種類型信息的3D模型
、安全和高效的建筑系統(tǒng),讓居住者能夠擁有可持續(xù)、彈性舒適且符合人體工程學(xué)的建筑。建筑信息模型
(BIM) 是建筑工程師在建筑物和其他結(jié)構(gòu)設(shè)計中使用的一種3D建模過程。BIM軟件提供了一個基于模型
發(fā)表于 03-28 17:18
谷歌推出多模態(tài)VLOGGER AI
谷歌最新推出的VLOGGER AI技術(shù)引起了廣泛關(guān)注,這項創(chuàng)新的多模態(tài)模型能夠讓靜態(tài)肖像圖“活”起來并“說話”。用戶只需提供一張人物
Stability AI推出全新Stable Video 3D模型
近日,Stability AI 推出了全新的 Stable Video 3D 模型,該模型以其獨特的功能吸引了眾多關(guān)注。此模型具備從單張圖像中生成多
Adobe Substance 3D整合AI功能:基于文本生成紋理、背景
Substance 3D Stager是以Adobe Dimension為基礎(chǔ)改造而成,使用者可直觀地進行3D場景構(gòu)建,包括模型、材質(zhì)和燈光等要素。借助其強大功能,能夠生成極具觀賞性的
谷歌發(fā)布VLOGGER AI模型,實現(xiàn)肖像朗讀音頻內(nèi)容
具體來說,VLOGGER AI 采用一種適應(yīng)虛擬肖像的多模態(tài) Diffusion 模型,通過 MENTOR 數(shù)據(jù)庫進行訓(xùn)練,涵蓋了超80萬個
基于深度學(xué)習(xí)的方法在處理3D點云進行缺陷分類應(yīng)用
背景部分介紹了3D點云應(yīng)用領(lǐng)域中公開可訪問的數(shù)據(jù)集的重要性,這些數(shù)據(jù)集對于分析和比較各種模型至關(guān)重要。研究人員專門設(shè)計了各種數(shù)據(jù)集,包括用于3D形狀分類、3D物體檢測和
高分工作!Uni3D:3D基礎(chǔ)大模型,刷新多個SOTA!
我們主要探索了3D視覺中scale up模型參數(shù)量和統(tǒng)一模型架構(gòu)的可能性。在NLP / 2D vision領(lǐng)域,scale up大模型(GP
評論