0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
电子发烧友
开通电子发烧友VIP会员 尊享10大特权
海量资料免费下载
精品直播免费看
优质内容免费畅学
课程9折专享价
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內(nèi)不再提示

NVIDIA NeMo加速并簡化自定義模型開發(fā)

NVIDIA英偉達企業(yè)解決方案 ? 來源:NVIDIA英偉達企業(yè)解決方案 ? 2024-07-26 11:17 ? 次閱讀

如果企業(yè)希望充分發(fā)揮出 AI 的力量,就需要根據(jù)其行業(yè)需求量身定制的自定義模型。

NVIDIA AI Foundry 是一項使企業(yè)能夠使用數(shù)據(jù)、加速計算和軟件工具創(chuàng)建并部署自定義模型的服務,這些模型將為企業(yè)的生成式 AI 項目提供強力支持。

就像臺積電制造其他公司設計的芯片一樣,NVIDIA AI Foundry 為其他公司提供基礎設施和工具,使他們能夠使用 DGX Cloud、基礎模型、NVIDIA NeMo 軟件、NVIDIA 專業(yè)知識以及各種生態(tài)系統(tǒng)工具和支持,開發(fā)和自定義 AI 模型。

關鍵的區(qū)別在于產(chǎn)品:臺積電生產(chǎn)實體半導體芯片,而 NVIDIA AI Foundry 則幫助創(chuàng)建自定義模型。兩者都在推動創(chuàng)新,并與龐大的工具和合作伙伴生態(tài)系統(tǒng)相連接。

企業(yè)可以使用 AI Foundry 自定義 NVIDIA 模型和開放社區(qū)模型,包括新推出的 Llama 3.1 系列以及 NVIDIA Nemotron、Google DeepMind 的 CodeGemma、CodeLlama、Google DeepMind 的 Gemma、Mistral、Mixtral、Phi-3 和 StarCoder2 等。

行業(yè)領導者推動 AI 創(chuàng)新

行業(yè)領導者 Amdocs、Capital One、Getty Images、KT、現(xiàn)代汽車公司、SAP、ServiceNow 和 Snowflake 是 NVIDIA AI Foundry 的首批企業(yè)用戶。這些領軍企業(yè)正在企業(yè)軟件、技術、通信和媒體領域開辟一個由 AI 驅動創(chuàng)新的新時代。

ServiceNow AI 產(chǎn)品副總裁 Jeremy Barnes 表示:“部署 AI 的企業(yè)可以通過融合了行業(yè)和業(yè)務知識的自定義模型獲得競爭優(yōu)勢。ServiceNow 正在使用 NVIDIA AI Foundry 微調(diào)和部署可以輕松集成到客戶現(xiàn)有的工作流中的模型?!?/p>

NVIDIA AI Foundry 的關鍵支柱

NVIDIA AI Foundry 的關鍵支柱包括基礎模型、企業(yè)軟件、加速計算、專家支持和龐大的合作伙伴生態(tài)系統(tǒng)。

這項服務的軟件包括來自 NVIDIA 和 AI 社區(qū)的 AI 基礎模型,以及能夠加速模型開發(fā)的完整 NVIDIA NeMo 軟件平臺。

NVIDIA AI Foundry 的計算核心是 NVIDIA DGX Cloud,該加速計算資源網(wǎng)絡由 NVIDIA 與全球公有云領軍企業(yè)亞馬遜科技、谷歌云和 Oracle Cloud Infrastructure 共同設計。通過 DGX Cloud,AI Foundry 客戶能夠以前所未有的便捷和效率開發(fā)和微調(diào)自定義生成式 AI 應用,并根據(jù)需要擴展他們的 AI 項目,而無需在前期進行大量硬件方面的投入。這種靈活性對于希望在瞬息萬變的市場中保持靈活性的企業(yè)來說至關重要。

NVIDIA AI Enterprise 專家會在 AI Foundry 客戶需要時提供幫助。NVIDIA 專家可以指導客戶完成使用專有數(shù)據(jù)構建、微調(diào)和部署模型所需的各個步驟,確保模型貼合客戶的業(yè)務需求。

NVIDIA AI Foundry 客戶可以進入到一個全球合作伙伴生態(tài)系統(tǒng),以獲得全方位的支持。埃森哲、德勤、Infosys、Wipro 等 NVIDIA 合作伙伴將為他們提供 AI Foundry 咨詢服務,涵蓋設計、實施和管理 AI 驅動的數(shù)字化轉型項目。埃森哲率先推出了基于 AI Foundry 的自定義模型開發(fā)產(chǎn)品——Accenture AI Refinery 框架。

另外,Data Monsters、Quantiphi、Slalom 和 SoftServe 等服務交付合作伙伴幫助企業(yè)解決將 AI 集成到現(xiàn)有 IT 環(huán)境中所遇到的復雜問題,確保 AI 應用的可擴展性、安全性和與業(yè)務目標的吻合性。

Cleanlab、DataDog、Dataiku、Dataloop、DataRobot、Domino Data Lab、Fiddler AI、New Relic、Scale、Weights & Biases 等 NVIDIA 合作伙伴還為客戶提供用于開發(fā)生產(chǎn)級 NVIDIA AI Foundry 模型的 AIOps 和 MLOps 平臺。

客戶可以將其 AI Foundry 模型導出為 NVIDIA NIM 推理微服務(包括自定義模型、優(yōu)化引擎和標準 API),以便在其選擇的加速基礎設施上運行。

NVIDIA TensorRT-LLM 這樣的推理解決方案為 Llama 3.1 模型提供了更高的效率,以最大限度地減少延遲和最大限度地提高吞吐量。這使企業(yè)能夠更快地生成 token,同時降低在生產(chǎn)中運行模型的總成本。企業(yè)級的支持和安全性由 NVIDIA AI Enterprise 軟件套件提供。

275062d8-4a67-11ef-b8af-92fbcf53809c.png

NVIDIA NIM 和 TensorRT-LLM 最大限度地減少了 Llama 3.1 模型的推理延遲并最大限度地提高了吞吐量,從而更快地生成 token。

它們可部署在多種基礎設施上,包括思科、戴爾科技、慧與、聯(lián)想、超微等全球服務器制造合作伙伴的 NVIDIA 認證系統(tǒng)以及亞馬遜云科技、谷歌云和 Oracle Cloud 的云實例。

此外,領先的 AI 加速云平臺 Together AI 宣布,將讓其擁有超過 10 萬名開發(fā)者和企業(yè)的生態(tài)系統(tǒng)能夠使用 NVIDIA GPU 加速推理堆棧,在 DGX Cloud 上部署 Llama 3.1 端點和其他開放模型。Together AI 創(chuàng)始人兼首席執(zhí)行官 Vipul Ved Prakash 表示:“每個運行生成式 AI 應用程序的企業(yè)都希望獲得更快的用戶體驗,使效率更高,成本更低?,F(xiàn)在,使用 Together Inference Engine 的開發(fā)者和企業(yè)可以在 NVIDIA DGX Cloud 上最大化其性能、可擴展性和安全性?!?/p>

NVIDIA NeMo 加速并簡化

自定義模型開發(fā)

通過集成在 AI Foundry 中的 NVIDIA NeMo,開發(fā)者可以隨時使用所需的工具來整理數(shù)據(jù)、自定義基礎模型和評估性能。NeMo 將提供以下技術:

NeMo Curator:一個由 GPU 提供加速的數(shù)據(jù)管理庫,通過為預訓練和微調(diào)準備大規(guī)模、高質(zhì)量的數(shù)據(jù)集,提高生成式 AI 模型的性能。

NeMo Customizer:一項高性能且可擴展的微服務,可簡化針對特定領域用例的 LLM 微調(diào)和對齊。

NeMo Evaluator:可在任何加速云或數(shù)據(jù)中心上,使用各種學術和自定義基準測試對生成式 AI 模型進行自動評估。

NeMo Guardrails:能夠編排對話管理,通過大語言模型提高智能應用的準確性、適當性和安全性,為生成式 AI 應用提供保障。

借助 NVIDIA AI Foundry 中的 NeMo 平臺,企業(yè)能夠創(chuàng)建出精準滿足其需求的自定義 AI 模型。這種定制化與戰(zhàn)略目標更加吻合,提高了決策的準確性以及運營的效率。例如企業(yè)可以開發(fā)出理解行業(yè)術語、符合監(jiān)管要求并與現(xiàn)有工作流無縫集成的模型。

SAP 首席人工智能官 Philipp Herzig 表示:“作為我們合作的下一步,SAP 計劃使用 NVIDIA 的 NeMo 平臺,來幫助企業(yè)去加速由 SAP Business AI 驅動的 AI 生產(chǎn)力?!?/p>

企業(yè)可以通過 NVIDIA NeMo Retriever NIM 推理微服務將其自定義 AI 模型部署到生產(chǎn)中。它們可以幫助開發(fā)者獲取專有數(shù)據(jù),然后通過檢索增強生成(RAG)為其 AI 應用生成知識淵博的回答。

Snowflake AI 主管 Baris Gultekin 表示:“安全、可信的 AI 是企業(yè)充分利用生成式 AI 的必要前提,而檢索的準確性直接影響到 RAG 系統(tǒng)中生成的回答的相關性和質(zhì)量。通過 NVIDIA AI Foundry 中的 NeMo Retriever 組件,Snowflake Cortex AI 可以使用企業(yè)的自定義數(shù)據(jù),進一步為企業(yè)提供簡單、高效和可信的回答?!?/p>

自定義模型為企業(yè)帶來競爭優(yōu)勢

NVIDIA AI Foundry 的一大優(yōu)勢是能夠解決企業(yè)在采用 AI 時所面臨的獨特挑戰(zhàn)。通用 AI 模型可能無法滿足特定的業(yè)務需求和數(shù)據(jù)安全要求,而自定義 AI 模型則具有出色的靈活性、適應性和性能,是企業(yè)獲得競爭優(yōu)勢的理想途徑。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • NVIDIA
    +關注

    關注

    14

    文章

    5187

    瀏覽量

    105384
  • AI
    AI
    +關注

    關注

    87

    文章

    33475

    瀏覽量

    274045
  • 模型
    +關注

    關注

    1

    文章

    3462

    瀏覽量

    49782

原文標題:NVIDIA AI Foundry 如何幫助企業(yè)打造自定義生成式 AI 模型

文章出處:【微信號:NVIDIA-Enterprise,微信公眾號:NVIDIA英偉達企業(yè)解決方案】歡迎添加關注!文章轉載請注明出處。

收藏 0人收藏

    評論

    相關推薦

    如何添加自定義單板

    開發(fā)過程中,用戶有時需要創(chuàng)建自定義板配置。本節(jié)將通過一個實例講解用戶如何創(chuàng)建屬于自己的machine,下面以g2l-test.conf為例進行說明。
    的頭像 發(fā)表于 03-12 14:43 ?398次閱讀

    為什么無法將自定義EfficientDet模型從TensorFlow 2轉換為中間表示(IR)?

    自定義 EfficientDet 模型從 TensorFlow* 2 轉換 為 IR 時遇到錯誤: [ ERROR ] Exception occurred during running replacer \"REPLACEMENT_ID\" ()
    發(fā)表于 03-05 06:29

    如何快速創(chuàng)建用戶自定義Board和App工程

    可將該文件夾復制到用戶自定義的工作目錄(workspace)中,基于此模板進行開發(fā)。本模板主要牽涉到的用戶自定義的文件有:用戶板級文件Board用戶應用程序App用
    的頭像 發(fā)表于 02-08 13:38 ?314次閱讀
    如何快速創(chuàng)建用戶<b class='flag-5'>自定義</b>Board和App工程

    Altium Designer 15.0自定義元件設計

    電子發(fā)燒友網(wǎng)站提供《Altium Designer 15.0自定義元件設計.pdf》資料免費下載
    發(fā)表于 01-21 15:04 ?0次下載
    Altium Designer 15.0<b class='flag-5'>自定義</b>元件設計

    think-cell:自定義think-cell(四)

    C.5 設置默認議程幻燈片布局 think-cell 議程可以在演示文稿中使用特定的自定義布局來定義議程、位置和議程幻燈片上的其他形狀,例如標題或圖片。通過將此自定義布局添加到模板,您可以為整個組織
    的頭像 發(fā)表于 01-13 10:37 ?347次閱讀
    think-cell:<b class='flag-5'>自定義</b>think-cell(四)

    think-cell;自定義think-cell(一)

    本章介紹如何自定義 think-cell,即如何更改默認顏色和其他默認屬性;這是通過 think-cell 的樣式文件完成的,這些文件將在前四個部分中進行討論。 第五部分 C.5 設置默認議程幻燈片
    的頭像 發(fā)表于 01-08 11:31 ?494次閱讀
    think-cell;<b class='flag-5'>自定義</b>think-cell(一)

    創(chuàng)建自定義的基于閃存的引導加載程序(BSL)

    電子發(fā)燒友網(wǎng)站提供《創(chuàng)建自定義的基于閃存的引導加載程序(BSL).pdf》資料免費下載
    發(fā)表于 09-19 10:50 ?0次下載
    創(chuàng)建<b class='flag-5'>自定義</b>的基于閃存的引導加載程序(BSL)

    請問multisim怎么自定義元器件?

    為什么我在multisim中自定義元器件始終出不了想要的波形效果呢?同一個pspice模型我同學之前都定義正確了,現(xiàn)在我想再來試一下結果一直失敗
    發(fā)表于 09-10 06:16

    NVIDIA AI Foundry 為全球企業(yè)打造自定義 Llama 3.1 生成式 AI 模型

    Foundry 提供從數(shù)據(jù)策管、合成數(shù)據(jù)生成、微調(diào)、檢索、防護到評估的全方位生成式 AI 模型服務,以便部署自定義 Llama 3.1 NVIDIA NIM 微服務和新的 NVIDIA
    發(fā)表于 07-24 09:39 ?815次閱讀
    <b class='flag-5'>NVIDIA</b> AI Foundry 為全球企業(yè)打造<b class='flag-5'>自定義</b> Llama 3.1 生成式 AI <b class='flag-5'>模型</b>

    揭秘NVIDIA AI Workbench 如何助力應用開發(fā)

    者能夠根據(jù)其具體需求調(diào)整 AI 模型。 此類工作在過去可能需要復雜的設置,而新工具使這項工作變得空前簡單。 NVIDIA AI Workbench 可協(xié)助 AI 開發(fā)者構建自己的 RAG 項目、
    發(fā)表于 07-10 18:51 ?781次閱讀
    揭秘<b class='flag-5'>NVIDIA</b> AI Workbench 如何助力應用<b class='flag-5'>開發(fā)</b>

    如何為ESP8266構建自定義盾牌?

    我正在尋找某種如何為ESP8266構建自定義盾牌的指南。 到目前為止,我已經(jīng)使用 NODEMCU 構建了功能原型,但我現(xiàn)在想簡化事情使其更小。 1. 是否有一些書面的、開放的硬件指南 (很好
    發(fā)表于 07-08 07:17

    HarmonyOS開發(fā)案例:【 自定義彈窗】

    基于ArkTS的聲明式開發(fā)范式實現(xiàn)了三種不同的彈窗,第一種直接使用公共組件,后兩種使用CustomDialogController實現(xiàn)自定義彈窗
    的頭像 發(fā)表于 05-16 18:18 ?1703次閱讀
    HarmonyOS<b class='flag-5'>開發(fā)</b>案例:【 <b class='flag-5'>自定義</b>彈窗】

    AWTK 開源串口屏開發(fā)(18) - 用 C 語言自定義命令

    編寫代碼即可實現(xiàn)常見的應用。但是,有時候我們需要自定義一些命令,以實現(xiàn)一些特殊的功能。本文檔介紹如何使用C語言自定義命令。1.實現(xiàn)hmi_model_cmd_t接口
    的頭像 發(fā)表于 05-11 08:24 ?609次閱讀
    AWTK 開源串口屏<b class='flag-5'>開發(fā)</b>(18) - 用 C 語言<b class='flag-5'>自定義</b>命令

    TSMaster 自定義 LIN 調(diào)度表編程指導

    LIN(LocalInterconnectNetwork)協(xié)議調(diào)度表是用于LIN總線通信中的消息調(diào)度的一種機制,我們收到越來越多來自不同用戶希望能夠通過接口實現(xiàn)自定義LIN調(diào)度表的需求。所以在
    的頭像 發(fā)表于 05-11 08:21 ?948次閱讀
    TSMaster <b class='flag-5'>自定義</b> LIN 調(diào)度表編程指導

    HarmonyOS開發(fā)案例:【UIAbility和自定義組件生命周期】

    本文檔主要描述了應用運行過程中UIAbility和自定義組件的生命周期。對于UIAbility,描述了Create、Foreground、Background、Destroy四種生命周期。對于頁面
    的頭像 發(fā)表于 05-10 15:31 ?1694次閱讀
    HarmonyOS<b class='flag-5'>開發(fā)</b>案例:【UIAbility和<b class='flag-5'>自定義</b>組件生命周期】

    電子發(fā)燒友

    中國電子工程師最喜歡的網(wǎng)站

    • 2931785位工程師會員交流學習
    • 獲取您個性化的科技前沿技術信息
    • 參加活動獲取豐厚的禮品