0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

NVIDIA NeMo開源框架概述、優(yōu)勢及功能特性

NVIDIA英偉達(dá)企業(yè)解決方案 ? 來源:NVIDIA英偉達(dá)企業(yè)解決方案 ? 作者:NVIDIA英偉達(dá)企業(yè)解 ? 2022-07-19 10:53 ? 次閱讀

NVIDIA NeMo 是一款供開發(fā)者構(gòu)建和訓(xùn)練先進(jìn)的對話式 AI 模型的開源框架。

NVIDIA NeMo 是什么?

NVIDIA NeMo 是一個框架,用于借助簡單的 Python 界面構(gòu)建、訓(xùn)練和微調(diào) GPU 加速的語音和自然語言理解(NLU)模型。使用 NeMo,開發(fā)者可以創(chuàng)建新的模型架構(gòu),并通過易于使用的應(yīng)用編程接口(API),在 NVIDIA GPU 中的Tensor Core 上使用混合精度計算對其進(jìn)行訓(xùn)練。

NeMo Megatron 是此框架的一部分,提供并行化技術(shù)(例如 Megatron-LM 研究項(xiàng)目中的工作流和張量并行化),用于訓(xùn)練大規(guī)模語言模型。

借助 NeMo,您可以構(gòu)建用于實(shí)時自動語音識別(ASR)、自然語言處理(NLP)和文本轉(zhuǎn)語音(TTS)應(yīng)用(例如視頻通話轉(zhuǎn)錄、智能視頻助理以及醫(yī)療健康、金融、零售和電信行業(yè)的自動化呼叫中心支持)的模型。

NVIDIA NeMo 的優(yōu)勢

快速建模

使用簡單的 Python API 快速配置、構(gòu)建和訓(xùn)練模型。

可定制的模型

從 NVIDIA NGC 目錄中下載并自定義經(jīng)過預(yù)訓(xùn)練的先進(jìn)模型。

廣泛集成

實(shí)現(xiàn) NeMo 與 PyTorch 和 PyTorch Lightning 生態(tài)系統(tǒng)的互操作。

輕松部署

應(yīng)用 NVIDIA TensorRT 優(yōu)化,并導(dǎo)出至 NVIDIA Riva 進(jìn)行高性能推理

NVIDIA NeMo 的功能特性

輕松構(gòu)建新的模型架構(gòu)

NeMo 包含針對 ASR、NLP 和 TTS 的特定領(lǐng)域集合,用于開發(fā) Citrinet、Jasper、BERT、Fastpitch 和 HiFiGAN 等先進(jìn)模型。NeMo 模型由神經(jīng)模組構(gòu)成,神經(jīng)模組是模型的基礎(chǔ)模組。神經(jīng)類型將這些模組的輸入和輸出強(qiáng)有力地類型化,可自動在模塊之間執(zhí)行語義檢查。

NeMo 旨在提供高靈活性,您可以使用 Hydra 框架輕松修改模型的行為。例如,您可以使用 Hydra 在以下圖表中修改 Citrinet Encoder 模組的架構(gòu)。

訓(xùn)練先進(jìn)的對話式 AI 模型

NGC 中的幾個 NeMo 預(yù)訓(xùn)練的先進(jìn)模型基于開源的免費(fèi)數(shù)據(jù)集在 NVIDIA DGX 上進(jìn)行了超過 100000 小時的訓(xùn)練。在訓(xùn)練您的用例之前,您可以微調(diào)這些模型或使用 NeMo 修改它們。

NeMo 使用 Tensor Core上的混合精度,訓(xùn)練速度能達(dá)到在單個 GPU 上使用 FP32 精度的 4.5 倍。您可以進(jìn)一步將訓(xùn)練擴(kuò)展到多 GPU 系統(tǒng)和多節(jié)點(diǎn)集群。

使用 NeMo Megatron 進(jìn)行大規(guī)模語言建模

基于 Transformer 的大規(guī)模語言模型正應(yīng)用于廣泛的自然語言任務(wù),例如文本生成、摘要和聊天機(jī)器人。NeMo Megatron 能夠管理訓(xùn)練數(shù)據(jù),并使用多達(dá)數(shù)萬億個參數(shù)訓(xùn)練大規(guī)模模型。它會執(zhí)行數(shù)據(jù)管理任務(wù),例如格式化、過濾、重復(fù)數(shù)據(jù)刪除和混合,使用其他方式完成這些任務(wù)可能需要花費(fèi)數(shù)月時間。它還使用張量并行性在節(jié)點(diǎn)內(nèi)擴(kuò)展模型,并利用數(shù)據(jù)和工作流并行性跨節(jié)點(diǎn)擴(kuò)展數(shù)據(jù)和模型。

NeMo Megatron 可依托數(shù)千個 GPU 提供高訓(xùn)練效率,使企業(yè)訓(xùn)練大規(guī)模 NLP 變得可行。

NeMo Megatron 可以將經(jīng)過訓(xùn)練的模型導(dǎo)出到 NVIDIA Triton 推理服務(wù)器,以在多個 GPU 和多個節(jié)點(diǎn)上運(yùn)行大規(guī)模 NLP 模型。

靈活、開源、快速擴(kuò)展的生態(tài)系統(tǒng)

NeMo 基于 PyTorch 和 PyTorch Lightning 構(gòu)建,為研究人員開發(fā)和集成他們已習(xí)慣使用的模組提供了便捷的途徑。PyTorch 和 PyTorch Lightning 是開源 Python 庫,可提供用于合成模型的模組。

NeMo 集成了 Hydra 框架,助力研究人員輕松靈活地自定義模型/模組。Hydra 是一款熱門框架,可簡化復(fù)雜的對話式 AI 模型的開發(fā)。

NeMo 是一款開源框架,研究人員可為其獻(xiàn)言獻(xiàn)策,也可在此基礎(chǔ)上進(jìn)行構(gòu)建。

部署到生產(chǎn)環(huán)境中

要在使用 NVIDIA Riva 的生產(chǎn)環(huán)境中部署 NeMo 語音模型,開發(fā)者應(yīng)使用與 Riva 兼容的格式導(dǎo)出 NeMo 模型,然后執(zhí)行 Riva 構(gòu)建和部署命令,以創(chuàng)建可實(shí)時運(yùn)行的優(yōu)化技能。

審核編輯:湯梓紅

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • NVIDIA
    +關(guān)注

    關(guān)注

    14

    文章

    5013

    瀏覽量

    103244
  • gpu
    gpu
    +關(guān)注

    關(guān)注

    28

    文章

    4752

    瀏覽量

    129055
  • AI
    AI
    +關(guān)注

    關(guān)注

    87

    文章

    31097

    瀏覽量

    269428
  • 開源框架
    +關(guān)注

    關(guān)注

    0

    文章

    32

    瀏覽量

    9422

原文標(biāo)題:DevZone | NVIDIA NeMo

文章出處:【微信號:NVIDIA-Enterprise,微信公眾號:NVIDIA英偉達(dá)企業(yè)解決方案】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏

    評論

    相關(guān)推薦

    開源鴻蒙5.0 Release版本關(guān)鍵特性解讀

    概述 開源鴻蒙 5.0 Release版本是開源鴻蒙操作系統(tǒng)的一個里程碑,在系統(tǒng)能力、性能優(yōu)化等多個方面進(jìn)一步增強(qiáng)。本文將從系統(tǒng)功能、性能優(yōu)化,安全和隱私保護(hù)以及分布式能力等角度,解讀
    的頭像 發(fā)表于 12-23 13:58 ?456次閱讀

    AUTOSAR通信框架優(yōu)勢 AUTOSAR通信實(shí)例與應(yīng)用場景

    AUTOSAR通信框架優(yōu)勢 AUTOSAR(AUTomotive Open System ARchitecture)是一個全球性的汽車軟件架構(gòu)合作伙伴計劃,旨在創(chuàng)建并建立一個開放的標(biāo)準(zhǔn)化軟件架構(gòu)
    的頭像 發(fā)表于 12-17 14:58 ?315次閱讀

    NVIDIA助力企業(yè)創(chuàng)建定制AI應(yīng)用

    NVIDIA 近日宣布與眾多技術(shù)領(lǐng)導(dǎo)者一同使用最新NVIDIA NIM Agent Blueprint以及NVIDIA NeMoNVIDIA
    的頭像 發(fā)表于 11-20 09:12 ?358次閱讀

    日本企業(yè)借助NVIDIA產(chǎn)品加速AI創(chuàng)新

    日本領(lǐng)先企業(yè)和大學(xué)正在使用 NVIDIA NeMo、NIM 微服務(wù)和 NVIDIA Isaac 加速 AI 創(chuàng)新。
    的頭像 發(fā)表于 11-19 14:34 ?333次閱讀

    HarmonyOS NEXT應(yīng)用元服務(wù)開發(fā)Intents Kit(意圖框架服務(wù))本地搜索方案概述

    一、概述 本地搜索是在HarmonyOS歸一化搜索特性,開發(fā)者將應(yīng)用/元服務(wù)內(nèi)的功能和內(nèi)容通過意圖框架共享到HarmonyOS,即可實(shí)現(xiàn)“一步搜索,內(nèi)容直達(dá)”。 二、典型場景 以“音樂
    發(fā)表于 11-06 10:59

    TAS2563設(shè)備特性和控制概述

    電子發(fā)燒友網(wǎng)站提供《TAS2563設(shè)備特性和控制概述.pdf》資料免費(fèi)下載
    發(fā)表于 10-08 11:49 ?0次下載
    TAS2563設(shè)備<b class='flag-5'>特性</b>和控制<b class='flag-5'>概述</b>

    NVIDIA Nemotron-4 340B模型幫助開發(fā)者生成合成訓(xùn)練數(shù)據(jù)

    Nemotron-4 340B 是針對 NVIDIA NeMoNVIDIA TensorRT-LLM 優(yōu)化的模型系列,該系列包含最先進(jìn)的指導(dǎo)和獎勵模型,以及一個用于生成式 AI 訓(xùn)練的數(shù)據(jù)集。
    的頭像 發(fā)表于 09-06 14:59 ?337次閱讀
    <b class='flag-5'>NVIDIA</b> Nemotron-4 340B模型幫助開發(fā)者生成合成訓(xùn)練數(shù)據(jù)

    Mistral AI與NVIDIA推出全新語言模型Mistral NeMo 12B

    Mistral AI 和 NVIDIA 于近日共同發(fā)布了一款全新的領(lǐng)先語言模型Mistral NeMo 12B。開發(fā)者可以輕松定制和部署該模型,令其適用于支持聊天機(jī)器人、多語言任務(wù)、編碼和摘要的企業(yè)應(yīng)用。
    的頭像 發(fā)表于 07-27 11:04 ?676次閱讀

    bootstrap框架介紹

    Bootstrap概述 Bootstrap是一個開源的前端框架,由Twitter公司開發(fā)。它基于HTML、CSS和JavaScript,提供了一套響應(yīng)式、移動優(yōu)先的組件和樣式,可以幫助開發(fā)者快速構(gòu)建網(wǎng)頁。 1.2
    的頭像 發(fā)表于 07-11 09:53 ?582次閱讀

    借助NVIDIA DOCA 2.7增強(qiáng)AI 云數(shù)據(jù)中心和NVIDIA Spectrum-X

    NVIDIA DOCA 加速框架為開發(fā)者提供了豐富的庫、驅(qū)動和 API,以便為 NVIDIA BlueField DPU 和 SuperNIC 創(chuàng)建高性能的應(yīng)用程序和服務(wù)。
    的頭像 發(fā)表于 05-29 09:22 ?510次閱讀

    螞蟻集團(tuán)發(fā)布首個開源金融場景多智能體框架

    在第七屆數(shù)字中國建設(shè)峰會上,螞蟻集團(tuán)宣布了一項(xiàng)引人注目的舉措:正式開源其多智能體框架agentUniverse。這一框架不僅是金融領(lǐng)域的首個開源多智能體技術(shù)
    的頭像 發(fā)表于 05-28 09:25 ?726次閱讀

    NVIDIA加速微軟最新的Phi-3 Mini開源語言模型

    NVIDIA 宣布使用 NVIDIA TensorRT-LLM 加速微軟最新的 Phi-3 Mini 開源語言模型。TensorRT-LLM 是一個開源庫,用于優(yōu)化從 PC 到云端的
    的頭像 發(fā)表于 04-28 10:36 ?588次閱讀

    NVIDIA宣布推出基于Omniverse Cloud API構(gòu)建的全新軟件框架

    NVIDIA 在 GTC 大會上宣布推出基于 Omniverse Cloud API(應(yīng)用編程接口)構(gòu)建的全新軟件框架。
    的頭像 發(fā)表于 03-25 09:09 ?551次閱讀

    星動紀(jì)元開源人形機(jī)器人訓(xùn)練框架Humanoid-Gym

    星動紀(jì)元,這家專注于人形機(jī)器人技術(shù)的創(chuàng)新公司,近日宣布計劃將其訓(xùn)練框架Humanoid-Gym進(jìn)行開源。Humanoid-Gym是一個為人形機(jī)器人設(shè)計的訓(xùn)練框架,其開源將極大地推動人形
    的頭像 發(fā)表于 03-06 18:13 ?2106次閱讀

    基于NVIDIA DOCA 2.6實(shí)現(xiàn)高性能和安全的AI云設(shè)計

    作為專為 NVIDIA? BlueField? 網(wǎng)絡(luò)平臺而設(shè)計的數(shù)據(jù)中心基礎(chǔ)設(shè)施軟件框架NVIDIA? DOCA? 使廣大開發(fā)者能夠利用其行業(yè)標(biāo)準(zhǔn) API 在 NVIDIA Blue
    的頭像 發(fā)表于 02-23 10:02 ?484次閱讀