0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

使用自然語(yǔ)言語(yǔ)音指令創(chuàng)建 XR 體驗(yàn):Project Mellon 應(yīng)用測(cè)試

NVIDIA英偉達(dá)企業(yè)解決方案 ? 來(lái)源:未知 ? 2023-04-08 00:30 ? 次閱讀

Project Mellon 是一個(gè)輕量級(jí)的 Python 軟件包,能夠利用強(qiáng)大的語(yǔ)音 AI(NVIDIA Riva)和大型語(yǔ)言模型(LLMs)(NVIDIA NeMo 服務(wù)),簡(jiǎn)化沉浸式環(huán)境中的用戶交互。NVIDIA 在 GTC 2023 上宣布,Project Mellon 現(xiàn)已支持開發(fā)者進(jìn)行測(cè)試。基于此,開發(fā)者可開始探索如何創(chuàng)建由自然語(yǔ)言語(yǔ)音指令控制的、解放雙手的擴(kuò)展現(xiàn)實(shí)(XR)體驗(yàn)。

正如 J·R·R·托爾金(J.R.R.Tolkien)在《都林之門(Doors of Durin)》中的謎語(yǔ)—“請(qǐng)說(shuō),朋友,而后進(jìn)入”所示,文字可以移山倒海。Project Mellon 背后蘊(yùn)含著一個(gè)基本理念,即以更實(shí)用有效的方式來(lái)利用語(yǔ)音 AI 和 LLM 之力打開虛擬世界的大門,并在其中完成更多的事情。

在 XR 中,用戶界面可能非常復(fù)雜且難以使用,會(huì)破壞虛擬、混合和增強(qiáng)現(xiàn)實(shí)的本質(zhì)—即沉浸式體驗(yàn)的自然感。Project Mellon 可賦能多類應(yīng)用程序(無(wú)論是 XR 還是平板生態(tài))開發(fā)者,輕松地將自然語(yǔ)言理解作為以人為本且可解放雙手的新型用戶界面,添加至其開發(fā)的軟件之中。

Project Mellon 平臺(tái)包含以下組成部分:

  • Project Mellon SDK(軟件開發(fā)套件)

  • NVIDIA Riva(ASR 、TTS 、NMT)

  • NeMo 服務(wù)(其他 LLM 也可獲取支持)

Project Mellon 1.0 發(fā)布的主要功能包括:

  • 輕量且易于集成的 Python 庫(kù)

  • 保持自然語(yǔ)言理解準(zhǔn)確性的 LLM

  • 無(wú)需特定指令進(jìn)行訓(xùn)練的零樣本語(yǔ)言模型

  • 具有對(duì)話和視覺上下文的自然語(yǔ)言指令支持

  • 支持詢問有關(guān)指令和情境的問題,并提供自然語(yǔ)言回答

  • 用于理解和執(zhí)行指令的簡(jiǎn)單 Python API

  • 基于 Web 的測(cè)試應(yīng)用程序

  • 可以在本地或遠(yuǎn)程托管 ASR、TTS、LLM 和神經(jīng)網(wǎng)絡(luò)機(jī)器翻譯(NMT),以實(shí)現(xiàn)低延遲響應(yīng)

ESI 集團(tuán)解決方案和技術(shù)專家 Jan Wurster 在 GTC 主題演講—“在虛擬現(xiàn)實(shí)中與 AI 協(xié)作:沉浸式數(shù)字助手(會(huì)議代碼:[S51355])中表示:“我們發(fā)現(xiàn),通過集成對(duì)話式 AI 與 NVIDIA Project Mellon,可以降低使用 XR 展開協(xié)作的技術(shù)門檻,并為 IC.IDO Weave 用戶提供更加人性化的體驗(yàn)。通過輸入自然語(yǔ)音,我們的虛擬 AI 助手可以幫助團(tuán)隊(duì)完成復(fù)核任務(wù)、查詢可用情況或發(fā)現(xiàn)相關(guān)問題,這些功能無(wú)需記住特定指令、僅需輸入自然語(yǔ)言就可使用?!?/p>

(2023 年 4 月 10 日前登錄 GTC 官網(wǎng),即可觀看演講回放,了解其團(tuán)隊(duì)如何在動(dòng)態(tài)、協(xié)作的 XR 環(huán)境中,在使用對(duì)話式 AI 的過程中受益)

Project Mellon 現(xiàn)已可供開發(fā)人員使用。觀看 Project Mellon 相關(guān)演示,了解如何利用自然語(yǔ)音指令,驅(qū)動(dòng)設(shè)計(jì)審查、更改實(shí)時(shí)配置、控制機(jī)器人以及操縱相機(jī)和場(chǎng)景元素。

了解如何啟用 Project Mellon 進(jìn)行開發(fā)

人工智能正在改變?nèi)祟惻c工作及工具進(jìn)行交互的方式。開發(fā)人員可以通過語(yǔ)音 AI 和 Project Mellon,簡(jiǎn)化并提升用戶體驗(yàn)的人性化水平,且不再需要培訓(xùn)用戶操作虛擬現(xiàn)實(shí)(VR)中的每一項(xiàng)功能。用戶可以在虛擬現(xiàn)實(shí)應(yīng)用程序中,用自己的語(yǔ)言來(lái)控制 XR 體驗(yàn)。

點(diǎn)擊“閱讀原文”,申請(qǐng)?jiān)囉?Project Mellon。

0f42f7e0-d561-11ed-bfe3-dac502259ad0.png ?

掃描海報(bào)二維碼,即可觀看 NVIDIA 創(chuàng)始人兼首席執(zhí)行官黃仁勛 GTC23 主題演講重播!

0f48be1e-d561-11ed-bfe3-dac502259ad0.jpg


原文標(biāo)題:使用自然語(yǔ)言語(yǔ)音指令創(chuàng)建 XR 體驗(yàn):Project Mellon 應(yīng)用測(cè)試

文章出處:【微信公眾號(hào):NVIDIA英偉達(dá)企業(yè)解決方案】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。


聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 英偉達(dá)
    +關(guān)注

    關(guān)注

    22

    文章

    3780

    瀏覽量

    91205

原文標(biāo)題:使用自然語(yǔ)言語(yǔ)音指令創(chuàng)建 XR 體驗(yàn):Project Mellon 應(yīng)用測(cè)試

文章出處:【微信號(hào):NVIDIA-Enterprise,微信公眾號(hào):NVIDIA英偉達(dá)企業(yè)解決方案】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏

    評(píng)論

    相關(guān)推薦

    自然語(yǔ)言處理與機(jī)器學(xué)習(xí)的關(guān)系 自然語(yǔ)言處理的基本概念及步驟

    自然語(yǔ)言處理(Natural Language Processing,簡(jiǎn)稱NLP)是人工智能和語(yǔ)言學(xué)領(lǐng)域的一個(gè)分支,它致力于研究如何讓計(jì)算機(jī)能夠理解、解釋和生成人類語(yǔ)言。機(jī)器學(xué)習(xí)(Machine
    的頭像 發(fā)表于 12-05 15:21 ?507次閱讀

    語(yǔ)音識(shí)別與自然語(yǔ)言處理的關(guān)系

    在人工智能的快速發(fā)展中,語(yǔ)音識(shí)別和自然語(yǔ)言處理(NLP)成為了兩個(gè)重要的技術(shù)支柱。語(yǔ)音識(shí)別技術(shù)使得機(jī)器能夠理解人類的語(yǔ)音,而自然語(yǔ)言處理則讓
    的頭像 發(fā)表于 11-26 09:21 ?423次閱讀

    ASR與自然語(yǔ)言處理的結(jié)合

    ASR(Automatic Speech Recognition,自動(dòng)語(yǔ)音識(shí)別)與自然語(yǔ)言處理(NLP)是人工智能領(lǐng)域的兩個(gè)重要分支,它們?cè)谠S多應(yīng)用中緊密結(jié)合,共同構(gòu)成了自然語(yǔ)言理解和生成的技術(shù)體系
    的頭像 發(fā)表于 11-18 15:19 ?429次閱讀

    自然語(yǔ)言處理與機(jī)器學(xué)習(xí)的區(qū)別

    在人工智能的快速發(fā)展中,自然語(yǔ)言處理(NLP)和機(jī)器學(xué)習(xí)(ML)成為了兩個(gè)核心的研究領(lǐng)域。它們都致力于解決復(fù)雜的問題,但側(cè)重點(diǎn)和應(yīng)用場(chǎng)景有所不同。 1. 自然語(yǔ)言處理(NLP) 定義: 自然語(yǔ)言處理
    的頭像 發(fā)表于 11-11 10:35 ?607次閱讀

    自然語(yǔ)言處理的應(yīng)用實(shí)例

    在當(dāng)今數(shù)字化時(shí)代,自然語(yǔ)言處理(NLP)技術(shù)已經(jīng)成為我們?nèi)粘I畹囊徊糠帧闹悄苁謾C(jī)的語(yǔ)音助手到在線客服機(jī)器人,NLP技術(shù)的應(yīng)用無(wú)處不在。 1. 語(yǔ)音識(shí)別與虛擬助手 隨著Siri、Google
    的頭像 發(fā)表于 11-11 10:31 ?333次閱讀

    語(yǔ)音識(shí)別和自然語(yǔ)言處理的區(qū)別和聯(lián)系

    語(yǔ)音識(shí)別和自然語(yǔ)言處理是人工智能領(lǐng)域的兩個(gè)重要分支,它們?cè)诤芏喾矫嬗兄o密的聯(lián)系,同時(shí)也存在一些明顯的區(qū)別。本文將詳細(xì)介紹語(yǔ)音識(shí)別和自然語(yǔ)言處理的區(qū)別和聯(lián)系。 一、
    的頭像 發(fā)表于 07-05 10:09 ?1810次閱讀

    自然語(yǔ)言處理技術(shù)有哪些

    自然語(yǔ)言處理(Natural Language Processing,簡(jiǎn)稱NLP)是人工智能領(lǐng)域的一個(gè)分支,它致力于使計(jì)算機(jī)能夠理解、解釋和生成人類語(yǔ)言。自然語(yǔ)言處理技術(shù)的發(fā)展已經(jīng)取得了顯著的進(jìn)展
    的頭像 發(fā)表于 07-03 14:30 ?1188次閱讀

    自然語(yǔ)言處理模式的優(yōu)點(diǎn)

    得到了廣泛的應(yīng)用,如搜索引擎、語(yǔ)音助手、機(jī)器翻譯、情感分析等。 1. 提高信息獲取效率 自然語(yǔ)言處理技術(shù)能夠快速地從大量文本數(shù)據(jù)中提取關(guān)鍵信息,幫助用戶節(jié)省查找和篩選信息的時(shí)間。例如,搜索引擎通過NLP技術(shù)理解用戶的查詢意圖,提供更準(zhǔn)確、更相關(guān)的搜索結(jié)果。
    的頭像 發(fā)表于 07-03 14:24 ?801次閱讀

    自然語(yǔ)言處理技術(shù)的核心是什么

    ,廣泛應(yīng)用于機(jī)器翻譯、情感分析、語(yǔ)音識(shí)別、智能問答、文本摘要等眾多領(lǐng)域。 自然語(yǔ)言處理技術(shù)的發(fā)展可以追溯到20世紀(jì)50年代。1950年,圖靈提出了著名的圖靈測(cè)試,標(biāo)志著自然語(yǔ)言處理技術(shù)
    的頭像 發(fā)表于 07-03 14:20 ?782次閱讀

    自然語(yǔ)言處理是什么技術(shù)的一種應(yīng)用

    廣泛,包括機(jī)器翻譯、語(yǔ)音識(shí)別、情感分析、信息檢索、問答系統(tǒng)、文本摘要、聊天機(jī)器人等。 一、自然語(yǔ)言處理的基本概念 自然語(yǔ)言自然語(yǔ)言是人類用來(lái)交流思想、表達(dá)情感和傳遞信息的
    的頭像 發(fā)表于 07-03 14:18 ?969次閱讀

    自然語(yǔ)言處理包括哪些內(nèi)容

    自然語(yǔ)言處理(Natural Language Processing,簡(jiǎn)稱NLP)是人工智能領(lǐng)域的一個(gè)重要分支,它涉及到計(jì)算機(jī)與人類語(yǔ)言之間的交互。NLP的目標(biāo)是讓計(jì)算機(jī)能夠理解、生成和處理人類語(yǔ)言
    的頭像 發(fā)表于 07-03 14:15 ?949次閱讀

    什么是自然語(yǔ)言處理 (NLP)

    自然語(yǔ)言處理(Natural Language Processing, NLP)是人工智能領(lǐng)域中的一個(gè)重要分支,它專注于構(gòu)建能夠理解和生成人類語(yǔ)言的計(jì)算機(jī)系統(tǒng)。NLP的目標(biāo)是使計(jì)算機(jī)能夠像人類一樣
    的頭像 發(fā)表于 07-02 18:16 ?1204次閱讀

    自然語(yǔ)言處理技術(shù)的原理的應(yīng)用

    自然語(yǔ)言處理(Natural Language Processing, NLP)作為人工智能(AI)領(lǐng)域的一個(gè)重要分支,旨在使計(jì)算機(jī)能夠理解和處理人類自然語(yǔ)言。隨著互聯(lián)網(wǎng)的普及和大數(shù)據(jù)技術(shù)的發(fā)展
    的頭像 發(fā)表于 07-02 12:50 ?539次閱讀

    神經(jīng)網(wǎng)絡(luò)在自然語(yǔ)言處理中的應(yīng)用

    自然語(yǔ)言處理(NLP)是人工智能領(lǐng)域中的一個(gè)重要分支,它研究的是如何使計(jì)算機(jī)能夠理解和生成人類自然語(yǔ)言。隨著人工智能技術(shù)的飛速發(fā)展,神經(jīng)網(wǎng)絡(luò)在自然語(yǔ)言處理中的應(yīng)用逐漸展現(xiàn)出其強(qiáng)大的潛力和優(yōu)勢(shì)。本文
    的頭像 發(fā)表于 07-01 14:09 ?523次閱讀

    微軟擬在Win11引入強(qiáng)大AI文件管理功能

    按照微軟的愿景,用戶與文件管理器的交互將不再受限于傳統(tǒng)的鼠標(biāo)點(diǎn)擊操作,而是可通過自然語(yǔ)言語(yǔ)音指令實(shí)現(xiàn)更為便捷和高效的查詢體驗(yàn)。
    的頭像 發(fā)表于 03-06 10:48 ?696次閱讀