0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

在 NVIDIA ACE 中使用 AI 動(dòng)畫和語音功能打造逼真的虛擬形象

NVIDIA英偉達(dá)企業(yè)解決方案 ? 來源:未知 ? 2023-12-15 15:50 ? 次閱讀

NVIDIA 近日公布了 NVIDIA Avatar Cloud Engine(ACE)的一系列技術(shù),增強(qiáng)了 AI 虛擬形象和數(shù)字人的真實(shí)感和可訪問性,這些新的動(dòng)畫和語音功能實(shí)現(xiàn)了更自然的對(duì)話和情感表達(dá)。

開發(fā)者現(xiàn)在可以使用新的云 API 在應(yīng)用中輕松實(shí)現(xiàn)和擴(kuò)展智能虛擬形象,包括自動(dòng)語音識(shí)別(ASR)、文本轉(zhuǎn)語音(TTS)、神經(jīng)機(jī)器翻譯(NMT)和 Audio2Face(A2F)。

借助這些高級(jí)功能,搶先體驗(yàn)計(jì)劃的創(chuàng)作者可以利用 NVIDIA 技術(shù)快速構(gòu)建新一代虛擬形象體驗(yàn)?,F(xiàn)在,使用 Unreal Engine 5 等一些熱門渲染工具,可以更輕松地在任何地方大規(guī)模構(gòu)建和部署數(shù)字人。

AI 驅(qū)動(dòng)的情感動(dòng)畫

用戶可使用最新的 ACE AI 動(dòng)畫功能和微服務(wù)(包括新添加的 A2F 情感支持)構(gòu)建更具表現(xiàn)力的數(shù)字人,現(xiàn)在還提供用于身體、頭部和眼球運(yùn)動(dòng)的 Animation Graph 微服務(wù)。

對(duì)于使用云來處理渲染生產(chǎn)或?qū)で筮M(jìn)行實(shí)時(shí)推理的開發(fā)者,現(xiàn)在有了易于使用的微服務(wù)。A2F 的質(zhì)量改進(jìn)包括嘴型同步,可為數(shù)字人帶來更多的真實(shí)感。

wKgZomV8BleAIMjEAAECxiUeNCk281.png

圖 1. NVIDIA ACE 端到端開發(fā)套件

增強(qiáng)的 AI 語音功能

現(xiàn)在支持的語言包括意大利語、西班牙語、德語和普通話,ASR 技術(shù)的整體準(zhǔn)確性也得到了提高,ASR、TTS 和 NMT 的云 API 簡(jiǎn)化了對(duì)最新語音 AI 功能的訪問。

無論用戶是想使用自己的語音將自定義語音應(yīng)用到智能 NPC,還是在視頻會(huì)議通話中隨機(jī)化用戶的語音,新的 Voice Font 微服務(wù)都能讓用戶自定義 TTS 輸出。這項(xiàng)技術(shù)可將說話者的獨(dú)特音調(diào)和音量轉(zhuǎn)換為參考音頻,同時(shí)保持相同的節(jié)奏和聲音模式。

新工具和框架

ACE Agent 是一家專業(yè)的對(duì)話管理和系統(tǒng)集成商,它能夠提供更加流暢的端到端體驗(yàn),并高效地協(xié)調(diào)微服務(wù)之間的連接。開發(fā)者還可以利用與 NVIDIA Omniverse 平臺(tái)的集成,通過 NVIDIA NeMo Guardrails、NVIDIA SteerLM 和 LangChain 來更好地控制精確且可調(diào)節(jié)的響應(yīng)。

現(xiàn)在,可以更輕松地在用戶選擇的渲染器或編碼環(huán)境中啟動(dòng)和運(yùn)行這些工具。新功能包括:

  • 在 Avatar 配置器中支持 Blendshape,以輕松集成 Unreal Engine 等熱門渲染器。

  • 面向 Python 用戶的全新 A2F 應(yīng)用程序。

  • 一款參考應(yīng)用程序,適用于有興趣為客戶服務(wù)構(gòu)建虛擬助理的開發(fā)者。

總結(jié)

這些新推出的 NVIDIA ACE 功能提高了數(shù)字人體驗(yàn)的質(zhì)量標(biāo)準(zhǔn)。借助簡(jiǎn)化構(gòu)建和部署的增強(qiáng)功能,開發(fā)者現(xiàn)在可以獲得構(gòu)建新一代數(shù)字人應(yīng)用所需的簡(jiǎn)化配置。

想要探索尖端數(shù)字人技術(shù)?點(diǎn)擊“閱讀原文”,申請(qǐng) NVIDIA ACE 搶先體驗(yàn)。

GTC 2024 將于 2024 年 3 月 18 至 21 日在美國(guó)加州圣何塞會(huì)議中心舉行,線上大會(huì)也將同期開放。掃描下方海報(bào)二維碼,立即注冊(cè) GTC 大會(huì)。


原文標(biāo)題:在 NVIDIA ACE 中使用 AI 動(dòng)畫和語音功能打造逼真的虛擬形象

文章出處:【微信公眾號(hào):NVIDIA英偉達(dá)企業(yè)解決方案】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。


聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 英偉達(dá)
    +關(guān)注

    關(guān)注

    22

    文章

    3821

    瀏覽量

    91512
收藏 人收藏

    評(píng)論

    相關(guān)推薦

    0xmd公司通過NVIDIA GPU打造醫(yī)療AI解決方案

    本案例中,0xmd 公司通過 NVIDIA GPU 打造醫(yī)療 AI 解決方案,覆蓋影像分析和文本解讀等領(lǐng)域。
    的頭像 發(fā)表于 01-14 16:23 ?100次閱讀

    聯(lián)發(fā)科與NVIDIA合作 為NVIDIA 個(gè)人AI超級(jí)計(jì)算機(jī)設(shè)計(jì)NVIDIA GB10超級(jí)芯片

    聯(lián)發(fā)科近日宣布與NVIDIA合作設(shè)計(jì)NVIDIA GB10 Grace Blackwell超級(jí)芯片,將應(yīng)用于NVIDIA 的個(gè)人AI超級(jí)計(jì)算機(jī)NVI
    的頭像 發(fā)表于 01-07 16:26 ?133次閱讀

    NVIDIA和GeForce RTX GPU專為AI時(shí)代打造

    NVIDIA 和 GeForce RTX GPU 專為 AI 時(shí)代打造。
    的頭像 發(fā)表于 01-06 10:45 ?163次閱讀

    堅(jiān)米智能借助NVIDIA Isaac Lab加速四足機(jī)器人開發(fā)

    堅(jiān)米智能(中堅(jiān)科技)借助NVIDIA Isaac Lab平臺(tái),通過NVIDIA Isaac Sim的 3D 生成與建模技術(shù)構(gòu)建高度逼真的虛擬場(chǎng)景,將現(xiàn)實(shí)世界的復(fù)雜場(chǎng)景抽象并轉(zhuǎn)化為高質(zhì)量
    的頭像 發(fā)表于 12-29 14:01 ?192次閱讀

    賴耶科技通過NVIDIA AI Enterprise平臺(tái)打造超級(jí)AI工廠

    NVIDIA 技術(shù)團(tuán)隊(duì)保持合作。賴耶科技通過NVIDIA AI Enterprise平臺(tái)打造的超級(jí) AI 工廠,致力于加速大模型場(chǎng)景應(yīng)用
    的頭像 發(fā)表于 11-19 14:55 ?439次閱讀

    NVIDIA助力印度打造AI基礎(chǔ)設(shè)施

    孟買舉辦的 NVIDIA AI Summit 上,黃仁勛和穆克什·安巴尼(Mukesh Ambani)探討了關(guān)于 AI 基礎(chǔ)設(shè)施的投資,這些投資有望為各行各業(yè)帶來變革。
    的頭像 發(fā)表于 10-27 09:44 ?296次閱讀

    語音提示器-WT3000A離在線TTS方案-打破語種限制/AI對(duì)話多功能支持

    TTS(Text To Speech )技術(shù)作為智能語音領(lǐng)域的重要組成部分,能夠?qū)⑽谋拘畔⑥D(zhuǎn)化為逼真的語音輸出,為各類硬件設(shè)備提供便捷的語音提示服務(wù)。本方案正是基于唯創(chuàng)知音的離在線TT
    的頭像 發(fā)表于 10-25 10:36 ?284次閱讀
    <b class='flag-5'>語音</b>提示器-WT3000A離在線TTS方案-打破語種限制/<b class='flag-5'>AI</b>對(duì)話多<b class='flag-5'>功能</b>支持

    語音提示器-WT3000A離在線TTS方案-打破語種限制/AI對(duì)話多功能支持

    前言forewordTTS(TextToSpeech)技術(shù)作為智能語音領(lǐng)域的重要組成部分,能夠?qū)⑽谋拘畔⑥D(zhuǎn)化為逼真的語音輸出,為各類硬件設(shè)備提供便捷的語音提示服務(wù)。本方案正是基于唯創(chuàng)知
    的頭像 發(fā)表于 10-25 08:11 ?274次閱讀
    <b class='flag-5'>語音</b>提示器-WT3000A離在線TTS方案-打破語種限制/<b class='flag-5'>AI</b>對(duì)話多<b class='flag-5'>功能</b>支持

    NVIDIA與思科合作打造企業(yè)級(jí)生成式AI基礎(chǔ)設(shè)施

    NVIDIA 加速計(jì)算平臺(tái)、NVIDIA AI Enterprise 軟件和 NVIDIA NIM 推理微服務(wù)加持的思科 Nexus HyperFabric
    的頭像 發(fā)表于 10-10 09:35 ?392次閱讀

    微軟Azure AI語音服務(wù)革新:引入虛擬人形象,文本一鍵轉(zhuǎn)生動(dòng)視頻

    微軟于8月23日宣布,在其領(lǐng)先的Azure AI語音服務(wù)中融入了一項(xiàng)革命性創(chuàng)新——虛擬人形象功能,此功能徹底顛覆了傳統(tǒng)交互方式,讓文本轉(zhuǎn)視頻
    的頭像 發(fā)表于 08-23 16:25 ?736次閱讀

    NVIDIA Holoscan SDK中使用OpenCV構(gòu)建零拷貝AI傳感器處理管線

    NVIDIA Holoscan 是 NVIDIA 的跨領(lǐng)域多模態(tài)實(shí)時(shí) AI 傳感器處理平臺(tái),為開發(fā)者構(gòu)建端到端傳感器處理管線奠定了基礎(chǔ)。
    的頭像 發(fā)表于 07-02 11:50 ?552次閱讀
    <b class='flag-5'>在</b><b class='flag-5'>NVIDIA</b> Holoscan SDK<b class='flag-5'>中使</b>用OpenCV構(gòu)建零拷貝<b class='flag-5'>AI</b>傳感器處理管線

    NVIDIA推出用于支持全新GeForce RTX AI筆記本電腦上運(yùn)行的AI助手及數(shù)字人

    》中。NVIDIA 還發(fā)布專為 NVIDIA ACE 數(shù)字人平臺(tái)打造的首個(gè)基于 PC 的 NVIDIA NIM 推理微服務(wù)。 這些技術(shù)由?
    的頭像 發(fā)表于 06-04 10:19 ?828次閱讀

    NVIDIA宣布全面推出 NVIDIA ACE 生成式 AI 微服務(wù)

    NVIDIA ACE 現(xiàn)已全面云端推出,并在 RTX AI PC 上提供搶先體驗(yàn),已獲戴爾科技、ServiceNow、Aww Inc.、英業(yè)達(dá)、完美世界游戲等多家客戶服務(wù)、游戲和醫(yī)療
    的頭像 發(fā)表于 06-04 10:18 ?688次閱讀

    NVIDIA發(fā)布數(shù)字人微服務(wù),為制作生成式AI數(shù)字化身鋪平未來之路

    NVIDIA ACE現(xiàn)已全面云端推出,并在RTX AI PC上提供搶先體驗(yàn),已獲戴爾科技、ServiceNow、Aww Inc.、英業(yè)達(dá)、完美世界游戲等多家客戶服務(wù)、游戲和醫(yī)療保健領(lǐng)
    發(fā)表于 06-03 17:43 ?187次閱讀

    賽輪思與NVIDIA合作,利用生成式AI打造下一代車內(nèi)體驗(yàn)

    AI 驅(qū)動(dòng)的移動(dòng)出行創(chuàng)新企業(yè)與 NVIDIA 合作,打造下一代車內(nèi)體驗(yàn)。
    的頭像 發(fā)表于 05-23 10:12 ?1268次閱讀