0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

NVIDIA發(fā)布Riva語音AI和大型LLM軟件

星星科技指導(dǎo)員 ? 來源:NVIDIA ? 作者:Siddharth Sharma ? 2022-04-01 16:27 ? 次閱讀

NVIDIA 發(fā)布了 NVIDIA Riva 在語音人工智能方面的新突破, NVIDIA NeMo 在大規(guī)模語言建模( LLM )方面的新突破。 Riva 是一款 GPU 加速語音人工智能 SDK ,用于企業(yè)為其品牌和虛擬助手生成富有表現(xiàn)力的類人語音。 NeMo 是語音和 NLU 的加速培訓(xùn)框架,它現(xiàn)在有能力開發(fā)具有數(shù)萬億參數(shù)的大規(guī)模語言模型。

語音和語言人工智能的這些進(jìn)步使企業(yè)和研究機(jī)構(gòu)能夠輕松構(gòu)建針對其行業(yè)和領(lǐng)域定制的最先進(jìn)的對話人工智能功能。

英偉達(dá) Riva

NVIDIA 發(fā)布了一個具有定制語音功能的新版本,企業(yè)只需 30 分鐘的語音數(shù)據(jù)即可輕松創(chuàng)建獨特的語音來代表其品牌。

此外, NVIDIA 宣布了Riva Enterprise,這是一項付費計劃,包括為需要大規(guī)模 Riva 部署的企業(yè)提供 NVIDIA 專家支持。 Riva 仍然免費提供給工作量較小的客戶和合作伙伴。

亮點包括:

在 A100 上用一天 30 分鐘的音頻數(shù)據(jù)創(chuàng)建一個新的神經(jīng)語音。

細(xì)粒度控件以生成富有表現(xiàn)力的聲音。

A100 上的 Fastpitch + HiFiGAN 比 V100 上的 Tacotron2 + WaveGlow 性能高 12 倍。

支持五種其他語言的世界級語音識別

擴(kuò)展到成百上千的實時流。

在任何云端、本地和邊緣運(yùn)行。

注冊以接收有關(guān) Riva Enterprise 的最新消息和更新,以進(jìn)行大規(guī)模部署 》》

使用 Riva 開發(fā)應(yīng)用程序

閱讀此introductory post to了解 Riva 工作流中的組件。

接下來,按照本教程構(gòu)建您自己的端到端語音識別服務(wù):

Parthart: 1-EC6

Parthart: H2-Em7

Parthut: 3-ECEN-18

有關(guān)構(gòu)建virtual assistants和transcription with entity recognition等語音應(yīng)用程序的更多教程,請訪問Riva Getting Started. 》》

NVIDIA NeMo Megatron 、 Triton 多 – GPU 多節(jié)點推理和 Megatron 530B

NVIDIA 還推出了為企業(yè)構(gòu)建、定制和部署大型語言模型的功能。 NeMo Megatron 是 NeMo 框架中的一項新功能,用于培訓(xùn)多達(dá)數(shù)萬億個參數(shù)的大型語言模型( LLM )。

它包括Megatron方面的進(jìn)步,這是一個由 NVIDIA 研究人員領(lǐng)導(dǎo)的開源項目,旨在開發(fā)有效培訓(xùn)法學(xué)碩士的技術(shù)。企業(yè)可以使用 NeMo Megatron 定制 LLM ,如 Megatron 530B ,并使用 NVIDIA Triton 推理服務(wù)器跨多個 GPU 和節(jié)點進(jìn)行部署。

亮點包括:

在包含數(shù)十億頁文本的龐大數(shù)據(jù)集上自動化數(shù)據(jù)整理。

為新的域和語言培訓(xùn)Megatron 530B等模型。

從單節(jié)點擴(kuò)展到超級計算機(jī),包括數(shù)十個DGX A100系統(tǒng)。

導(dǎo)出到多個節(jié)點和 GPU s ,用于使用 NVIDIA Triton 推理服務(wù)器進(jìn)行實時推理。

關(guān)于作者

Siddharth Sharma 是NVIDIA 加速計算的高級技術(shù)營銷經(jīng)理。在加入NVIDIA 之前, Siddharth 是 Mathworks Simulink 和 Stateflow 的產(chǎn)品營銷經(jīng)理,與汽車和航空航天公司密切合作,采用基于模型的設(shè)計來創(chuàng)建控制軟件。

審核編輯:郭婷

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • NVIDIA
    +關(guān)注

    關(guān)注

    14

    文章

    5059

    瀏覽量

    103413
  • 服務(wù)器
    +關(guān)注

    關(guān)注

    12

    文章

    9262

    瀏覽量

    85782
  • 人工智能
    +關(guān)注

    關(guān)注

    1793

    文章

    47532

    瀏覽量

    239306
  • LLM
    LLM
    +關(guān)注

    關(guān)注

    0

    文章

    297

    瀏覽量

    359
收藏 人收藏

    評論

    相關(guān)推薦

    NVIDIA 發(fā)布保障代理式 AI 應(yīng)用安全的 NIM 微服務(wù)

    務(wù)是 NVIDIA NeMo Guardrails 軟件工具系列的一部分。這些可移植且經(jīng)過優(yōu)化的推理微服務(wù)可幫助企業(yè)提高生成式 AI 應(yīng)用的安全性、精準(zhǔn)性
    發(fā)表于 01-17 16:29 ?40次閱讀

    NVIDIA TensorRT-LLM中啟用ReDrafter的一些變化

    Recurrent Drafting (簡稱 ReDrafter) 是蘋果公司為大語言模型 (LLM) 推理開發(fā)并開源的一種新型推測解碼技術(shù),該技術(shù)現(xiàn)在可與 NVIDIA TensorRT-LLM 一起使用。
    的頭像 發(fā)表于 12-25 17:31 ?206次閱讀
    在<b class='flag-5'>NVIDIA</b> TensorRT-<b class='flag-5'>LLM</b>中啟用ReDrafter的一些變化

    解鎖NVIDIA TensorRT-LLM的卓越性能

    NVIDIA TensorRT-LLM 是一個專為優(yōu)化大語言模型 (LLM) 推理而設(shè)計的庫。它提供了多種先進(jìn)的優(yōu)化技術(shù),包括自定義 Attention Kernel、Inflight
    的頭像 發(fā)表于 12-17 17:47 ?230次閱讀

    NVIDIA TensorRT-LLM Roadmap現(xiàn)已在GitHub上公開發(fā)布

    感謝眾多用戶及合作伙伴一直以來對NVIDIA TensorRT-LLM的支持。TensorRT-LLM 的 Roadmap 現(xiàn)已在 GitHub 上公開發(fā)布!
    的頭像 發(fā)表于 11-28 10:43 ?318次閱讀
    <b class='flag-5'>NVIDIA</b> TensorRT-<b class='flag-5'>LLM</b> Roadmap現(xiàn)已在GitHub上公開<b class='flag-5'>發(fā)布</b>

    NVIDIA助力Amdocs打造生成式AI智能體

    正在使用NVIDIA DGX Cloud 與 NVIDIA AI Enterprise軟件開發(fā)和交付基于商用大語言模型(LLM)和領(lǐng)域適配
    的頭像 發(fā)表于 11-19 14:48 ?384次閱讀

    NVIDIA AI Foundry 為全球企業(yè)打造自定義 Llama 3.1 生成式 AI 模型

    借助 NVIDIA AI Foundry,企業(yè)和各國現(xiàn)在能夠使用自有數(shù)據(jù)與 Llama 3.1 405B 和 NVIDIA Nemotron 模型配對,來構(gòu)建“超級模型” NVIDIA
    發(fā)表于 07-24 09:39 ?728次閱讀
    <b class='flag-5'>NVIDIA</b> <b class='flag-5'>AI</b> Foundry 為全球企業(yè)打造自定義 Llama 3.1 生成式 <b class='flag-5'>AI</b> 模型

    什么是LLM?LLM的工作原理和結(jié)構(gòu)

    隨著人工智能技術(shù)的飛速發(fā)展,大型語言模型(Large Language Model,簡稱LLM)逐漸成為自然語言處理(NLP)領(lǐng)域的研究熱點。LLM以其強(qiáng)大的文本生成、理解和推理能力,在文本
    的頭像 發(fā)表于 07-02 11:45 ?8310次閱讀

    【算能RADXA微服務(wù)器試用體驗】+ GPT語音與視覺交互:1,LLM部署

    。環(huán)境變量的配置,未來在具體項目中我們會再次提到。 下面我們正式開始項目。項目從輸入到輸出分別涉及了語音識別,圖像識別,LLM,TTS這幾個與AI相關(guān)的模塊。先從最核心的LLM開始。
    發(fā)表于 06-25 15:02

    AI初創(chuàng)公司Alembic攻克LLM虛假信息難題

    近日,AI領(lǐng)域的創(chuàng)新者Alembic公司宣布了一項重大突破:其全新AI系統(tǒng)成功解決了LLM大型語言模型)中的虛假信息生成問題。這一成就標(biāo)志著長久以來困擾
    的頭像 發(fā)表于 06-18 14:26 ?558次閱讀

    NVIDIA 通過 Holoscan 為 NVIDIA IGX 提供企業(yè)軟件支持

    Enterprise-IGX軟件現(xiàn)已在NVIDIA IGX平臺上正式可用,以滿足工業(yè)邊緣對實時 AI 計算日益增長的需求。它們將共同幫助醫(yī)療、工業(yè)和科學(xué)計算領(lǐng)域的解決方案提供商利用企業(yè)級軟件
    的頭像 發(fā)表于 06-04 10:21 ?534次閱讀

    NVIDIA 通過 Holoscan 為 NVIDIA IGX 提供企業(yè)軟件支持,實現(xiàn)邊緣實時醫(yī)療、工業(yè)和科學(xué) AI 應(yīng)用

    NVIDIA Holoscan 的 NVIDIA AI Enterprise-IGX 軟件現(xiàn)已在 NVIDIA IGX 平臺上正式可用,以
    發(fā)表于 06-03 09:48 ?329次閱讀
      <b class='flag-5'>NVIDIA</b> 通過 Holoscan 為 <b class='flag-5'>NVIDIA</b> IGX 提供企業(yè)<b class='flag-5'>軟件</b>支持,實現(xiàn)邊緣實時醫(yī)療、工業(yè)和科學(xué) <b class='flag-5'>AI</b> 應(yīng)用

    研華與英偉達(dá)深化合作, 成為NVIDIA AI Enterprise軟件全球分銷商

    )的軟件平臺。近日發(fā)布NVIDIA AI Enterprise 5.0將為用戶提供一系列微服務(wù),其中包括NVIDIA NIM。這是一套用于
    發(fā)表于 05-07 11:21 ?404次閱讀
    研華與英偉達(dá)深化合作, 成為<b class='flag-5'>NVIDIA</b> <b class='flag-5'>AI</b> Enterprise<b class='flag-5'>軟件</b>全球分銷商

    英偉達(dá)H200性能顯著提升,年內(nèi)將推出B200新一代AI半導(dǎo)體

    同一天,NVIDIA發(fā)布了H200的性能評估報告,表明在與美國Meta公司的大型語言模型——LLM“Llama 2”的對比中,H200使AI
    的頭像 發(fā)表于 04-01 09:36 ?1455次閱讀

    基于NVIDIA Megatron Core的MOE LLM實現(xiàn)和訓(xùn)練優(yōu)化

    本文將分享阿里云人工智能平臺 PAI 團(tuán)隊與 NVIDIA Megatron-Core 團(tuán)隊在 MoE (Mixture of Experts) 大語言模型(LLM)實現(xiàn)與訓(xùn)練優(yōu)化上的創(chuàng)新工作。
    的頭像 發(fā)表于 03-22 09:50 ?824次閱讀
    基于<b class='flag-5'>NVIDIA</b> Megatron Core的MOE <b class='flag-5'>LLM</b>實現(xiàn)和訓(xùn)練優(yōu)化

    TensorRT LLM加速Gemma!NVIDIA與谷歌牽手,RTX助推AI聊天

    NVIDIA今天在其官方博客中表示,今天與谷歌合作,在所有NVIDIA AI平臺上為Gemma推出了優(yōu)化。
    的頭像 發(fā)表于 02-23 09:42 ?643次閱讀
    TensorRT <b class='flag-5'>LLM</b>加速Gemma!<b class='flag-5'>NVIDIA</b>與谷歌牽手,RTX助推<b class='flag-5'>AI</b>聊天