0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

NVIDIA AI模型QUEEN實現高效內容直播

NVIDIA英偉達企業(yè)解決方案 ? 來源:NVIDIA英偉達企業(yè)解決方案 ? 2024-12-19 16:42 ? 次閱讀

這個被稱為 QUEEN 的模型支持低帶寬、高質量的場景生成,可用于工業(yè)機器人操作、3D 視頻會議和直播等流媒體應用。

NVIDIA Research 與馬里蘭大學合作開發(fā)的 AI 模型 QUEEN 將內容直播帶入全新的維度。有了 QUEEN,直播自由視角視頻有望成為現實,也就是說,觀眾可以從任意視角體驗 3D 場景。

QUEEN 可用于構建沉浸式直播應用,例如教授烹飪等技能、讓球迷就像身處球場一樣從任意視角觀看比賽,或者在工作場所舉行更加身臨其境的視頻會議。QUEEN 也能用于工業(yè)環(huán)境,幫助操作員遠程操控倉庫或工廠中的機器人

該模型在本月于溫哥華舉行的年度 AI 盛會 NeurIPS 上進行了展示。

NVIDIA 研究總監(jiān)、杰出研究科學家 Shalini De Mello 表示:“要想近乎實時地直播自由視角視頻,就必須同時重建和壓縮 3D 場景。QUEEN 巧妙地平衡了壓縮率、視覺質量、編碼時間和渲染時間等各種因素,從而創(chuàng)建了一個優(yōu)化的流程,為視覺質量和可直播性樹立了新的標桿?!?/p>

通過減少渲染量,重復利用

和循環(huán)利用等方式實現高效直播

自由視角視頻通常使用來自各種攝像角度拍攝的視頻素材制作而成,例如多機位拍攝、倉庫里的一組安防攝像頭或是辦公室中的視頻會議攝像頭系統(tǒng)。

以往用于生成自由視角視頻的 AI 方法要么占用過多的內存用于直播,要么為了縮小文件大小而犧牲視覺質量,而 QUEEN 在兩者之間取得了平衡。即便是存在火花、火焰或毛茸動物的動態(tài)場景,也能輕松地把高質量的視頻內容從主機服務器傳輸到客戶端設備。而且,與之前的方法相比,它還能夠更快地渲染視頻內容以進行直播。

在大多數真實環(huán)境中,場景中的許多元素都是靜止不動的。在視頻中,這意味著某個幀中的大部分像素與其它幀中的像素相同。為了節(jié)省計算時間,QUEEN 跟蹤并重復使用這些靜態(tài)區(qū)域的渲染,從而騰出資源來專注于重建那些隨時間變化的內容。

研究人員使用了一塊 NVIDIA Tensor Core GPU,在多個基準測試中評估 QUEEN 的性能,他們發(fā)現該模型的表現在一系列指標上都優(yōu)于目前最先進的在線自由視角視頻制作方法。對于從不同角度拍攝同一場景的 2D 視頻,通常只需不到五秒的訓練時間,就能以每秒約 350 幀的速度渲染自由視角視頻。

同時實現高速度和高視覺質量,這意味著音樂會和體育賽事轉播能夠提供身臨其境般的虛擬現實體驗或比賽集錦的即時回放。

在倉庫場景中,機器人操作員可以利用 QUEEN,在操縱物體時更精準地測量深度。在視頻會議中,例如 SIGGRAPH 和 NVIDIA GTC 大會上的 3D 視頻會議 demo,它可以幫助主持人演示烹飪或折紙等場景,同時讓觀眾可以選擇最適合自己學習的視角。

NVIDIA 為 NeurIPS 制作和撰寫了 50 多篇學術海報和論文,QUEEN 是其中之一。這些學術海報和論文介紹了在模擬、機器人和醫(yī)療等領域具有巨大應用前景的開創(chuàng)性 AI 研究成果。

首次介紹了 GAN 模型的論文《生成式對抗網絡》在 NeurIPS 2024 大會上榮獲“時間檢驗獎”。該論文被引用超過 8.5 萬次,其中一個作者是 NVIDIA 的杰出工程師 Bing Xu。

NVIDIA Research 在全球擁有數百名科學家和工程師,專注于 AI、計算機圖形學、計算機視覺、自動駕駛汽車和機器人等領域的研究,歡迎點擊“閱讀原文”查看他們的最新研究成果 。

大型語言模型、模擬和建模、邊緣 AI 等領域的學術科研人員可以申請 NVIDIA 學術資助計劃。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規(guī)問題,請聯系本站處理。 舉報投訴
  • NVIDIA
    +關注

    關注

    14

    文章

    5045

    瀏覽量

    103326
  • AI
    AI
    +關注

    關注

    87

    文章

    31223

    瀏覽量

    269579
  • 模型
    +關注

    關注

    1

    文章

    3277

    瀏覽量

    48957

原文標題:NVIDIA Research 開發(fā)的模型實現了快速、高效的動態(tài)場景重建

文章出處:【微信號:NVIDIA-Enterprise,微信公眾號:NVIDIA英偉達企業(yè)解決方案】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦

    NVIDIA推出面向RTX AI PC的AI基礎模型

    NVIDIA 今日發(fā)布能在 NVIDIA RTX AI PC 本地運行的基礎模型,為數字人、內容創(chuàng)作、生產力和開發(fā)提供強大助力。
    的頭像 發(fā)表于 01-08 11:01 ?190次閱讀

    NVIDIA推出多個生成式AI模型和藍圖

    NVIDIA 宣布推出多個生成式 AI 模型和藍圖,將 NVIDIA Omniverse 一體化進一步擴展至物理 AI 應用,如機器人、自動
    的頭像 發(fā)表于 01-08 10:48 ?116次閱讀

    NVIDIA推出全新生成式AI模型Fugatto

    NVIDIA 開發(fā)了一個全新的生成式 AI 模型。利用輸入的文本和音頻,該模型可以創(chuàng)作出包含任意的音樂、人聲和聲音組合的作品。
    的頭像 發(fā)表于 11-27 11:29 ?393次閱讀

    NVIDIA AI助力實現更好的癌癥檢測

    由美國頂級醫(yī)療中心和研究機構的專家組成了一個專家委員會,該委員會正在使用 NVIDIA 支持的聯邦學習來評估聯邦學習和 AI 輔助注釋對訓練 AI 腫瘤分割模型的影響。
    的頭像 發(fā)表于 11-19 15:54 ?198次閱讀

    NVIDIA NIM助力企業(yè)高效部署生成式AI模型

    Canonical、Nutanix 和 Red Hat 等廠商的開源 Kubernetes 平臺集成了 NVIDIA NIM,將允許用戶通過 API 調用來大規(guī)模地部署大語言模型。
    的頭像 發(fā)表于 10-10 09:49 ?412次閱讀

    NVIDIA CorrDiff生成式AI模型能夠精準預測臺風

    NVIDIA GPU 上運行的一個擴散模型向天氣預報工作者展示了加速計算如何實現新的用途并提升能效。
    的頭像 發(fā)表于 09-13 17:13 ?727次閱讀

    NVIDIA助力提供多樣、靈活的模型選擇

    在本案例中,Dify 以模型中立以及開源生態(tài)的優(yōu)勢,為廣大 AI 創(chuàng)新者提供豐富的模型選擇。其集成的 NVIDIAAPI Catalog、NVIDIA NIM和Triton 推理服務器
    的頭像 發(fā)表于 09-09 09:19 ?496次閱讀

    借助NVIDIA NIM加速AI應用部署

    大語言模型(LLM)在企業(yè)組織中的應用日益廣泛,許多企業(yè)都將其整合到 AI 應用中。雖然從基礎模型著手十分高效,但需要花費一定的精力才能將它們整合到生產就緒型環(huán)境中。
    的頭像 發(fā)表于 08-23 16:38 ?412次閱讀
    借助<b class='flag-5'>NVIDIA</b> NIM加速<b class='flag-5'>AI</b>應用部署

    NVIDIA Broadcast助力實現高質量直播和遠程工作

    AI 為計算領域帶來了深遠的改變。雖然最近的焦點是生成式 AI,但多年來,由 NVIDIA RTX 提供支持的 AI 加速工具也在改善游戲、內容
    的頭像 發(fā)表于 08-23 15:35 ?618次閱讀

    英偉達推出全新NVIDIA AI Foundry服務和NVIDIA NIM推理微服務

    NVIDIA 宣布推出全新 NVIDIA AI Foundry 服務和 NVIDIA NIM 推理微服務,與同樣剛推出的 Llama 3.1 系列開源
    的頭像 發(fā)表于 07-25 09:48 ?736次閱讀

    NVIDIA AI Foundry 為全球企業(yè)打造自定義 Llama 3.1 生成式 AI 模型

    借助 NVIDIA AI Foundry,企業(yè)和各國現在能夠使用自有數據與 Llama 3.1 405B 和 NVIDIA Nemotron 模型配對,來構建“超級
    發(fā)表于 07-24 09:39 ?727次閱讀
    <b class='flag-5'>NVIDIA</b> <b class='flag-5'>AI</b> Foundry 為全球企業(yè)打造自定義 Llama 3.1 生成式 <b class='flag-5'>AI</b> <b class='flag-5'>模型</b>

    直播預告】基于ISO 26262實現高質量的MBD過程

    直播時間:2024年6月12號20:00直播平臺:視頻號、CSDN、B站、抖音下方一鍵預約直播大綱?基于模型的軟件開發(fā)(MBD)基本原則和優(yōu)勢模型
    的頭像 發(fā)表于 06-06 08:25 ?407次閱讀
    【<b class='flag-5'>直播</b>預告】基于ISO 26262<b class='flag-5'>實現</b>高質量的MBD過程

    英偉達推出AI模型推理服務NVIDIA NIM

    英偉達近日宣布推出一項革命性的AI模型推理服務——NVIDIA NIM。這項服務將極大地簡化AI模型部署過程,為全球的2800萬英偉達開發(fā)者
    的頭像 發(fā)表于 06-04 09:15 ?695次閱讀

    NVIDIA在加速識因智能AI模型落地應用方面的重要作用介紹

    本案例介紹了 NVIDIA 在加速識因智能 AI模型落地應用方面的重要作用。生成式大模型已廣泛應用于各領域,通過學習人類思維方式,能快速挖掘海量
    的頭像 發(fā)表于 03-29 15:28 ?659次閱讀

    NVIDIA生成式AI研究實現在1秒內生成3D形狀

    NVIDIA 研究人員使 LATTE3D (一款最新文本轉 3D 生成式 AI 模型實現雙倍加速。
    的頭像 發(fā)表于 03-27 10:28 ?520次閱讀
    <b class='flag-5'>NVIDIA</b>生成式<b class='flag-5'>AI</b>研究<b class='flag-5'>實現</b>在1秒內生成3D形狀