0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內(nèi)不再提示

SIGGRAPH 2023 | NVIDIA 擴展 Maxine 視頻編輯功能,展示 3D 虛擬會議研究成果

NVIDIA英偉達 ? 來源:未知 ? 2023-08-10 20:15 ? 次閱讀

Maxine 的生產(chǎn)版本現(xiàn)已在 NVIDIA AI Enterprise 中推出;研究演示示范了 3D 技術(shù)如何提升視頻通信的質(zhì)量。

NVIDIA Maxine 的幫助下,專業(yè)人士、團隊、創(chuàng)作者等能夠利用 AI 的強大性能用普通麥克風和網(wǎng)絡攝像頭創(chuàng)造出高品質(zhì)的音視頻效果。

通過這套由 GPU 加速的軟件開發(fā)工具套件和云原生微服務,用戶可以部署能夠改進實時通信服務和平臺的音視頻及增強現(xiàn)實效果的 AI 功能。Maxine 還將擴展視頻編輯功能,使團隊的視頻通信能力達到新的高度。

此外,在本周舉行的 SIGGRAPH 大會上,NVIDIA Research 還演示了 AI 如何通過 3D 功能樹立視頻會議的新標桿。

NVIDIA Maxine 功能擴展至視頻編輯領域

無線連接使人們能夠在更多地點參加虛擬會議。一般情況下,當通話者在移動中或位于連接不佳的地點時,音視頻質(zhì)量就會受到嚴重影響。

而借助背景音降噪、超高分辨率、眼神交流等先進的實時 Maxine 功能,遠程用戶可以獲得更好的人際交流體驗。

此外,Maxine 現(xiàn)在還可用于視頻編輯。NVIDIA 合作伙伴正在使用提升視頻會議質(zhì)量的 Maxine 功能改變這一專業(yè)工作流。無論是銷售宣傳還是網(wǎng)絡研討會,編輯視頻的目的都是為了盡可能廣泛的吸引受眾。通過 Maxine,專業(yè)人員可以充分利用 AI 功能增強音視頻信號。

有了 Maxine,發(fā)言人可以將目光從屏幕移到參考筆記或腳本上,而在屏幕上他們?nèi)栽谥币曠R頭。用戶還能以低分辨率拍攝視頻,并在后期提高質(zhì)量。另外,Maxine 還使用戶能夠用多種不同語言錄制視頻并導出英語視頻。

今年的 Maxine 搶先體驗版中將發(fā)布的功能有:

  • Interpreter:將中文、俄語、法語、德語和西班牙語翻譯成英語,同時將用戶影像轉(zhuǎn)換成他們在說英文的動畫形象。

  • Voice Font:使用戶能夠應用發(fā)言者的聲音特征并將其映射到輸出的音頻中。

  • Audio Super Resolution:通過提高音頻信號的時間分辨率和擴展帶寬來提升音頻質(zhì)量。該功能目前支持從 8,000Hz 到 16,000Hz 以及從 16,000Hz 到 48,000Hz 的上采樣,在更新后還減少了 50% 的延遲,提高了 2 倍的吞吐量。

  • Maxine Client:將 Maxine 微服務的 AI 功能加入到 PC 上的視頻會議中。該應用針對低延遲流式傳輸進行了優(yōu)化,并將使用云來滿足其所有 GPU 計算需求。瘦客戶端將于今年秋季在 Windows 上推出,之后還將增加對其他操作系統(tǒng)的支持。

Maxine 可以部署在云端、本地或邊緣,這意味著用戶可以在幾乎任何地方進行高質(zhì)量的通信。

樹立視頻會議的新標桿

許多合作伙伴和客戶正在體驗 Maxine 帶來的高質(zhì)量視頻會議和視頻編輯。Maxine 的兩項功能 Eye Contact 和 Live Portrait 現(xiàn)已在 NVIDIA AI Enterprise 軟件平臺上發(fā)布。Eye Contact 通過估計用戶的視線并將其與攝像頭對齊來模擬用戶直視攝像頭。而 Live Portrait 則能通過用戶的實時視頻畫面將用戶的人像照片轉(zhuǎn)換成動畫。

軟件公司 Descript 的目標是讓視頻與文檔和幻燈片一樣,成為每位溝通者的主要工具。借助 NVIDIA Maxine,使用 Descript 的專業(yè)人員和初學者都可以使用 AI 功能改進他們的視頻內(nèi)容工作流程。

Descript 業(yè)務和企業(yè)發(fā)展主管 Jay LeBoeuf 表示:“有了 NVIDIA Maxine 的 Eye Contact 功能,用戶再也不用擔心背誦腳本或枯燥乏味的重復拍攝視頻了。他們每次都可以在保持完美屏幕形象的同時,準確無誤地說完腳本?!?/p>

Reincubate 的 Camo 應用程序充分利用人們已擁有的硬件和設備,擴大精彩視頻的制作渠道。為此,該應用為用戶提供了更大的圖像控制權(quán),并實現(xiàn)了強大、高效的視頻特效和轉(zhuǎn)換處理流程。通過使用 NVIDIA Maxine 所提供的技術(shù),Camo 為用戶提供了一條更加簡單的精彩視頻創(chuàng)作途徑。

Reincubate 創(chuàng)始人兼首席執(zhí)行官 Aidan Fitzpatrick 表示:“將 NVIDIA Maxine 集成到 Camo 中讓我們能夠輕松地充分利用用戶 RTX GPU 的高性能。有了 Maxine,團隊能夠更快、更有信心地開展工作。”

Quicklink 的 Cre8 是一個功能強大的視頻制作平臺,可用于創(chuàng)建專業(yè)的品牌化制作以及虛擬和混合現(xiàn)場活動。其用戶友好的界面整合了直觀的設計與構(gòu)建、編輯和自定義專業(yè)化制作所需的所有工具。Cre8 采用 NVIDIA Maxine 技術(shù),最大程度地提高了生產(chǎn)力以及視頻制作的質(zhì)量,使一切盡在用戶的掌握之中。

Quicklink 首席執(zhí)行官 Richard Rees 表示:“Quicklink Cre8 可以提供全球先進的視頻制作平臺。通過 NVIDIA Maxine,我們能夠添加更多先進功能,比如自動構(gòu)圖、視頻噪音消除、噪音和回聲消除以及眼神交流模擬等?!?/p>

gemelo.ai 打造了一個能夠擴展用戶的語音、內(nèi)容和互動的 AI 孿生創(chuàng)建平臺。gemelo.ai 團隊可以使用 Maxine 的 Live Portrait 功能,為經(jīng)過擴展的個性化內(nèi)容和一對一互動帶來新的可能性。

帶來了顛覆的變化。我們的客戶現(xiàn)在可以設計并部署無比逼真的數(shù)字孿生,獲得無限擴展內(nèi)容制作以及跨應用、網(wǎng)站和混合現(xiàn)實體驗交互的‘超能力’。”

NVIDIA Research 展示 3D 視頻如何提高沉浸式通信的質(zhì)量

除了支持 Maxine 的高級功能外,NVIDIA AI 還能提升 3D 視頻通信的質(zhì)量。NVIDIA Research 最近發(fā)表的一篇論文展示了 AI 如何利用最少的捕捉設備來支持 3D 視頻會議系統(tǒng)。

3D 網(wǎng)真會議系統(tǒng)通常價格昂貴、需要很大的空間或制作工作室,并且要用到高帶寬、高容量的視頻流式傳輸,這些都限制了該技術(shù)的普及。NVIDIA Research 分享了一種新的方法,該方法運行在基于 VisionTransformer 的新型編碼器上,可將普通網(wǎng)絡攝像頭輸入的 2D 視頻轉(zhuǎn)換成 3D 視頻。AI 無需在與會者之間來回傳遞 3D 數(shù)據(jù),使通話的帶寬要求與 2D 會議相同。

這項技術(shù)采用體積渲染技術(shù),將用戶的 2D 視頻自動創(chuàng)建為一種被稱為神經(jīng)輻射場(NeRF)的 3D 呈現(xiàn)方式。因此,與會者可以像在傳統(tǒng)視頻會議中一樣,在解碼可實時渲染的高質(zhì)量 3D 圖像的同時傳輸 2D 視頻。而且借助 Maxine 的 Live Portrait,用戶能夠以 3D 形式呈現(xiàn)自己的肖像。

以 AI 為媒介的 3D 視頻會議可以大幅降低 3D 捕捉成本、提供高保真的 3D 呈現(xiàn)、展示逼真或風格化的虛擬形象并在視頻會議中實現(xiàn)相互之間的眼神交流。相關(guān)研究項目展示了 AI 如何幫助提升通信和虛擬互動水平,這也為 NVIDIA 未來的視頻會議技術(shù)指明了方向。

請觀看下面的系統(tǒng)演示。SIGGRAPH 與會者可以蒞臨 Emerging Technologies 展臺,在 Looking Glass 設計的 3D 顯示屏上現(xiàn)場觀看演示。

供應情況

進一步了解現(xiàn)已在 NVIDIA AI Enterprise 上提供的 NVIDIA Maxine。

了解 3D 視頻會議項目背后的更多研究。

主題圖片由 NVIDIA Research 提供。

SIGGRAPH 2023

NVIDIA 精彩發(fā)布

【1】SIGGRAPH 主題演講:NVIDIA 首席執(zhí)行官帶來生成式 AI 多項創(chuàng)新 SIGGRAPH 2023 | NVIDIA 發(fā)布新一代 GH200 Grace Hopper 超級芯片平臺 SIGGRAPH 2023 | NVIDIA 發(fā)布支持生成式 AI 與 OpenUSD 的重大 Omniverse 升級 SIGGRAPH 2023 | NVIDIA Omniverse 開啟通往 OpenUSD 廣闊天地的大門 SIGGRAPH 2023 | NVIDIA 與全球數(shù)據(jù)中心系統(tǒng)制造商大力推動 AI 與工業(yè)數(shù)字化的發(fā)展 SIGGRAPH 2023 | NVIDIA 與全球工作站廠商共同推出用于生成式 AI、LLM 開發(fā)、內(nèi)容創(chuàng)作和數(shù)據(jù)科學的系統(tǒng) SIGGRAPH 2023 | NVIDIA AI Workbench 助力全球企業(yè)加速采用自定義生成式 AI SIGGRAPH 2023 | NVIDIA 與 Hugging Face 將連接數(shù)百萬開發(fā)者與生成式 AI 超級計算

更多精彩,仍在繼續(xù)...

敬請持續(xù)關(guān)注

點擊“閱讀原文”,或掃描下方海報二維碼,觀看 NVIDIA 創(chuàng)始人兼 CEO 黃仁勛在 SIGGRAPH 現(xiàn)場發(fā)表的 NVIDIA 主題演講回放,了解 NVIDIA 的新技術(shù),包括屢獲殊榮的研究,OpenUSD 開發(fā),以及最新的 AI 內(nèi)容創(chuàng)作解決方案。


原文標題:SIGGRAPH 2023 | NVIDIA 擴展 Maxine 視頻編輯功能,展示 3D 虛擬會議研究成果

文章出處:【微信公眾號:NVIDIA英偉達】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。


聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 英偉達
    +關(guān)注

    關(guān)注

    22

    文章

    3783

    瀏覽量

    91239

原文標題:SIGGRAPH 2023 | NVIDIA 擴展 Maxine 視頻編輯功能,展示 3D 虛擬會議研究成果

文章出處:【微信號:NVIDIA_China,微信公眾號:NVIDIA英偉達】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏

    評論

    相關(guān)推薦

    NVIDIA Research在ECCV 2024上展示多項創(chuàng)新成果

    在米蘭舉行的歐洲計算機視覺國際會議 (ECCV) 上,NVIDIA Research 展示了多項突破性的創(chuàng)新成果,共發(fā)表了 14 篇論文。
    的頭像 發(fā)表于 11-19 15:07 ?323次閱讀

    SynSense時識科技與海南大學聯(lián)合研究成果發(fā)布

    近日,SynSense時識科技與海南大學聯(lián)合在影響因子高達7.7的國際知名期刊《Computers in Biology and Medicine》上發(fā)表了最新研究成果展示了如何用低維信號通用類腦
    的頭像 發(fā)表于 10-23 14:40 ?321次閱讀
    SynSense時識科技與海南大學聯(lián)合<b class='flag-5'>研究成果</b>發(fā)布

    發(fā)掘3D文件格式的無限潛力:打造沉浸式虛擬世界

    在當今數(shù)字化時代,3D技術(shù)的應用范圍日益廣泛,涵蓋電影后期制作、產(chǎn)品原型設計、虛擬現(xiàn)實(VR)、增強現(xiàn)實(AR)、游戲等眾多領域。而3D文件格式作為3D技術(shù)的核心組成部分,對于實現(xiàn)
    的頭像 發(fā)表于 09-26 18:14 ?1549次閱讀
    發(fā)掘<b class='flag-5'>3D</b>文件格式的無限潛力:打造沉浸式<b class='flag-5'>虛擬</b>世界

    機房動環(huán)監(jiān)測:3D巡檢功能是什么

    機房動環(huán)監(jiān)測的3D巡檢功能是一種基于三維可視化技術(shù)的創(chuàng)新巡檢方式,它利用三維BIM模型結(jié)合日常巡檢工作,對機房內(nèi)的動力、環(huán)境、安防等設備進行虛擬仿真和動態(tài)展示,從而實現(xiàn)對機房的全面、直
    的頭像 發(fā)表于 09-18 18:14 ?251次閱讀
    機房動環(huán)監(jiān)測:<b class='flag-5'>3D</b>巡檢<b class='flag-5'>功能</b>是什么

    NVIDIA 在 Hot Chips 大會展示提升數(shù)據(jù)中心性能和能效的創(chuàng)新技術(shù)

    來源: NVIDIA 在此次大會期間舉行的四場演講中,NVIDIA 工程師詳細介紹了 NVIDIA Blackwell 平臺、新的液冷研究成果以及支持芯片設計的 AI 代理。 作為面向
    的頭像 發(fā)表于 08-28 16:38 ?387次閱讀
    <b class='flag-5'>NVIDIA</b> 在 Hot Chips 大會<b class='flag-5'>展示</b>提升數(shù)據(jù)中心性能和能效的創(chuàng)新技術(shù)

    如何使用NVIDIA Edify創(chuàng)建出細節(jié)考究的 3D 沙漠景觀

    即可創(chuàng)建出一個細節(jié)考究的 3D 沙漠景觀。 作為本屆 SIGGRAPH 圖形大會備受矚目的會議之一,NVIDIA 研究人員
    的頭像 發(fā)表于 08-02 16:00 ?714次閱讀

    使用NVIDIA Edify助力的服務創(chuàng)建3D資產(chǎn)和虛擬環(huán)境照明

    使用 NVIDIA Edify 助力的服務創(chuàng)建 3D 資產(chǎn)和虛擬環(huán)境照明,或是減半生成圖像時間。
    的頭像 發(fā)表于 08-02 15:22 ?529次閱讀

    SK海力士5層堆疊3D DRAM制造良率已達56.1%

    在全球半導體技術(shù)的激烈競爭中,SK海力士再次展示了其卓越的研發(fā)實力與創(chuàng)新能力。近日,在美國夏威夷舉行的VLSI 2024峰會上,SK海力士宣布了其在3D DRAM技術(shù)領域的最新研究成果,其中5層堆疊的
    的頭像 發(fā)表于 06-27 10:50 ?649次閱讀

    VR虛擬空間中的3D 技術(shù)

    空間中塑造3D模型 索尼在CES 2024上展示了其最新的具有“空間內(nèi)容創(chuàng)建”功能的MR頭顯,讓用戶在佩戴頭顯的同時也能編輯和塑造3D模型。
    的頭像 發(fā)表于 04-29 09:36 ?1547次閱讀
    VR<b class='flag-5'>虛擬</b>空間中的<b class='flag-5'>3D</b> 技術(shù)

    科技前沿 |?學術(shù)交融:中圖儀器與合肥工業(yè)大學共探3D顯微形貌測量技術(shù)

    通過與合肥工業(yè)大學的學術(shù)交流,中圖儀器深入了解學術(shù)界對于3D顯微形貌測量技術(shù)的最新研究成果和需求,同時分享了中圖在該領域的研究成果和應用經(jīng)驗,為學術(shù)界提供更多實踐指導和技術(shù)支持。
    的頭像 發(fā)表于 04-09 09:59 ?632次閱讀
    科技前沿 |?學術(shù)交融:中圖儀器與合肥工業(yè)大學共探<b class='flag-5'>3D</b>顯微形貌測量技術(shù)

    NVIDIA生成式AI研究實現(xiàn)在1秒內(nèi)生成3D形狀

    NVIDIA 研究人員使 LATTE3D (一款最新文本轉(zhuǎn) 3D 生成式 AI 模型)實現(xiàn)雙倍加速。
    的頭像 發(fā)表于 03-27 10:28 ?510次閱讀
    <b class='flag-5'>NVIDIA</b>生成式AI<b class='flag-5'>研究</b>實現(xiàn)在1秒內(nèi)生成<b class='flag-5'>3D</b>形狀

    奧比中光3D相機及方案亮相,攜手NVIDIA探索機器人應用革新

    3月18日-21日,奧比中光作為英偉達NPN合作伙伴亮相NVIDIA GTC 2024 AI開發(fā)者大會,在美國加州圣何塞會議中心帶來基于奧比中光3D相機與
    的頭像 發(fā)表于 03-22 09:37 ?375次閱讀

    Stability AI推出Stable Video 3D模型,可制作多視角3D視頻

    SV3D_u是Stable Video 3D的一個版本,僅需單幅圖片即可生成運動軌跡視頻,無須進行相機調(diào)整。擴充版本的SV3D_p加入了軌道視圖的特性,使其可以根據(jù)預設的相機路徑創(chuàng)建
    的頭像 發(fā)表于 03-21 14:57 ?1042次閱讀

    Adobe Substance 3D整合AI功能:基于文本生成紋理、背景

    Substance 3D Stager是以Adobe Dimension為基礎改造而成,使用者可直觀地進行3D場景構(gòu)建,包括模型、材質(zhì)和燈光等要素。借助其強大功能,能夠生成極具觀賞性的虛擬
    的頭像 發(fā)表于 03-20 10:28 ?759次閱讀

    奧比中光3D相機及方案亮相,攜手NVIDIA探索機器人應用革新

    3月18日-22日,奧比中光作為英偉達NPN合作伙伴亮相NVIDIA GTC 2024 AI開發(fā)者大會,在美國加州圣何塞會議中心帶來基于奧比中光3D相機與
    的頭像 發(fā)表于 03-19 17:20 ?681次閱讀