0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

NVIDIA NIM微服務(wù)帶來巨大優(yōu)勢

NVIDIA英偉達(dá)企業(yè)解決方案 ? 來源:NVIDIA英偉達(dá)企業(yè)解決方案 ? 2024-08-23 15:20 ? 次閱讀

新服務(wù)通過熱門 AI 模型為數(shù)百萬開發(fā)者帶來高達(dá) 5 倍的 token 效率提升,使他們能夠立即訪問在 NVIDIA DGX Cloud 上運(yùn)行的 NIM 微服務(wù)。

全球最大人工智能社區(qū)之一 Hugging Face 平臺上的 400 萬開發(fā)者在一些最熱門的 AI 模型上可輕松獲得 NVIDIA 加速推理。

借助新的推理即服務(wù)能力,開發(fā)者將能夠快速部署 Llama 3 系列和 Mistral AI 模型等領(lǐng)先的大語言模型,并使用運(yùn)行在NVIDIA DGX Cloud上的NVIDIA NIM微服務(wù)進(jìn)行優(yōu)化。

這項(xiàng)服務(wù)在 SIGGRAPH 大會上發(fā)布,它將幫助開發(fā)者利用托管在 Hugging Face Hub 上的開源 AI 模型快速建立原型并將其部署在生產(chǎn)中。Enterprise Hub 用戶可以利用 NVIDIA NIM 進(jìn)行無服務(wù)器推理,以提高靈活性,盡可能降低基礎(chǔ)設(shè)施用度并優(yōu)化性能。

推理服務(wù)補(bǔ)充了在 DGX Cloud 端的訓(xùn)練(Train on DGX Cloud),一種已在 Hugging Face 上提供的 AI 訓(xùn)練服務(wù)。

由于開發(fā)者面對著越來越多的開源模型,可供其輕松比較各種選項(xiàng)的資源中心會非常有幫助。這些訓(xùn)練和推理工具為 Hugging Face 開發(fā)者提供了在 NVIDIA 加速基礎(chǔ)設(shè)施上試驗(yàn)、測試和部署先進(jìn)模型的新方法。它們可以通過 Hugging Face 模型卡上的“訓(xùn)練”和“部署”下拉菜單輕松訪問,用戶只需點(diǎn)擊幾下就能輕松使用這些功能。

不僅限于 Token 層面的提升

— NVIDIA NIM 帶來巨大優(yōu)勢

NVIDIA NIM 是一系列 AI 微服務(wù)(包括 NVIDIA AI 基礎(chǔ)模型和開源社區(qū)模型)的集合,而且已使用行業(yè)標(biāo)準(zhǔn)應(yīng)用編程接口(API)針對推理進(jìn)行了優(yōu)化。

NIM 為用戶帶來更高的 token 處理效率 — token 是語言模型使用和生成的數(shù)據(jù)單位。經(jīng)優(yōu)化的微服務(wù)還能改善底層 NVIDIA DGX Cloud 基礎(chǔ)架構(gòu)的效率,從而提高關(guān)鍵 AI 應(yīng)用的速度。

這意味著,與模型的其他版本相比,開發(fā)者可以通過訪問 NIM AI 模型,更快、更可靠地得到結(jié)果。例如,與 NVIDIA Tensor Core GPU 驅(qū)動系統(tǒng)上的現(xiàn)成部署相比,通過 NIM 訪問 Llama 3 的 700 億參數(shù)版本時(shí),可實(shí)現(xiàn)最高達(dá) 5 倍的吞吐量提升。

近乎即時(shí)的 DGX Cloud

訪問讓 AI 加速觸手可及

NVIDIA DGX Cloud 平臺專為生成式 AI 打造,為開發(fā)者提供輕松訪問可靠加速計(jì)算基礎(chǔ)設(shè)施的途徑,幫助他們更快地將生產(chǎn)就緒型應(yīng)用推向市場。

該平臺提供可擴(kuò)展的 GPU 資源,可為從原型設(shè)計(jì)到生產(chǎn)的每一步 AI 開發(fā)提供支持,同時(shí)無需開發(fā)者做出長期的 AI 基礎(chǔ)設(shè)施承諾。

借助由 NIM 微服務(wù)提供支持、在 NVIDIA DGX Cloud 上運(yùn)行的 Hugging Face 推理即服務(wù),用戶可輕松訪問針對 AI 部署進(jìn)行優(yōu)化的計(jì)算資源,在企業(yè)級環(huán)境中實(shí)驗(yàn)最新的 AI 模型。

詳細(xì)了解在 SIGGRAPH 大會上

發(fā)布的 NVIDIA NIM 相關(guān)信息

在 SIGGRAPH 大會上,NVIDIA 還推出了面向 OpenUSD 框架的生成式 AI 模型和 NIM 微服務(wù),以加速開發(fā)者構(gòu)建高精度虛擬世界的能力,推動 AI 再次演進(jìn)。

體驗(yàn)超過 100 種 NVIDIA NIM 微服務(wù)在各行各業(yè)的應(yīng)用。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報(bào)投訴
  • NVIDIA
    +關(guān)注

    關(guān)注

    14

    文章

    5187

    瀏覽量

    105384
  • AI
    AI
    +關(guān)注

    關(guān)注

    87

    文章

    33475

    瀏覽量

    274041
  • 人工智能
    +關(guān)注

    關(guān)注

    1804

    文章

    48418

    瀏覽量

    244685
  • 微服務(wù)
    +關(guān)注

    關(guān)注

    0

    文章

    145

    瀏覽量

    7619

原文標(biāo)題:SIGGRAPH 2024 | Hugging Face 為開發(fā)者帶來由 NVIDIA NIM 提供支持的推理即服務(wù)

文章出處:【微信號:NVIDIA-Enterprise,微信公眾號:NVIDIA英偉達(dá)企業(yè)解決方案】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 0人收藏

    評論

    相關(guān)推薦

    NVIDIA發(fā)布全新NIM AI Guardrail微服務(wù)

    NVIDIA近期推出了一項(xiàng)旨在保障代理式AI應(yīng)用安全性的重要技術(shù)——NIM AI Guardrail微服務(wù)。這一全新微服務(wù)NVIDIA N
    的頭像 發(fā)表于 01-18 11:48 ?648次閱讀

    NVIDIA NeMo Guardrails引入三項(xiàng)全新NIM微服務(wù)

    NVIDIA NeMo Guardrails 包含全新 NVIDIA NIM 微服務(wù),能夠?yàn)楦餍袠I(yè)構(gòu)建 AI 的企業(yè)提高 AI 的準(zhǔn)確性、安全性和可控性。
    的頭像 發(fā)表于 01-18 09:39 ?502次閱讀

    NVIDIA 發(fā)布保障代理式 AI 應(yīng)用安全的 NIM 微服務(wù)

    NVIDIA NeMo Guardrails 包含全新 NVIDIA NIM 微服務(wù),能夠?yàn)楦餍袠I(yè)構(gòu)建 AI 的企業(yè)提高 AI 的準(zhǔn)確性、安全性和可控性。 ? AI 智能體有望成為能夠
    發(fā)表于 01-17 16:29 ?125次閱讀

    NVIDIA NIM微服務(wù)登陸亞馬遜云科技

    經(jīng)過優(yōu)化的 NIM 微服務(wù)現(xiàn)可在 Amazon Bedrock Marketplace、SageMaker JumpStart 和 AWS Marketplace 上獲取,用于各種 NVIDIA 和生態(tài)系統(tǒng)模型。
    的頭像 發(fā)表于 12-06 13:33 ?532次閱讀

    全新NVIDIA NIM微服務(wù)實(shí)現(xiàn)突破性進(jìn)展

    全新 NVIDIA NIM 微服務(wù)實(shí)現(xiàn)突破性進(jìn)展,可助力氣象技術(shù)公司開發(fā)和部署 AI 模型,實(shí)現(xiàn)對降雪、結(jié)冰和冰雹的預(yù)測。
    的頭像 發(fā)表于 11-21 10:07 ?526次閱讀

    NVIDIA助力企業(yè)創(chuàng)建定制AI應(yīng)用

    NVIDIA 近日宣布與眾多技術(shù)領(lǐng)導(dǎo)者一同使用最新NVIDIA NIM Agent Blueprint以及NVIDIA NeMo和NVIDIA
    的頭像 發(fā)表于 11-20 09:12 ?596次閱讀

    日本企業(yè)借助NVIDIA產(chǎn)品加速AI創(chuàng)新

    日本領(lǐng)先企業(yè)和大學(xué)正在使用 NVIDIA NeMo、NIM 微服務(wù)NVIDIA Isaac 加速 AI 創(chuàng)新。
    的頭像 發(fā)表于 11-19 14:34 ?706次閱讀

    金融科技公司利用NVIDIA技術(shù)加強(qiáng)金融服務(wù)應(yīng)用

    通過 NVIDIA NIM 微服務(wù)和加速計(jì)算,Ntropy、Contextual AI、NayaOne 和 Securiti 增強(qiáng)了用于欺詐檢測、財(cái)務(wù)規(guī)劃等領(lǐng)域的 AI 應(yīng)用。
    的頭像 發(fā)表于 10-31 15:20 ?1870次閱讀

    NVIDIA 攜手全球合作伙伴推出 NIM Agent Blueprints,助力企業(yè)打造屬于自己的 AI

    NVIDIA AI Enterprise 平臺中的 NIM 微服務(wù)與 NeMo 框架構(gòu)建和運(yùn)行他們的 AI 應(yīng)用,創(chuàng)建數(shù)據(jù)驅(qū)動型 AI 飛輪 埃森哲、思科、戴爾科技、德勤、慧與、聯(lián)想、SoftServe
    發(fā)表于 08-28 10:10 ?305次閱讀
    <b class='flag-5'>NVIDIA</b> 攜手全球合作伙伴推出 <b class='flag-5'>NIM</b> Agent Blueprints,助力企業(yè)打造屬于自己的 AI

    借助NVIDIA NIM微服務(wù)助力可口可樂公司擴(kuò)展生成式AI內(nèi)容

    借助 NVIDIA NIM 微服務(wù) USD Search 和 USD Code,市場營銷領(lǐng)導(dǎo)者 WPP 幫助飲料公司在全球范圍內(nèi)加速創(chuàng)意活動的迭代。
    的頭像 發(fā)表于 08-13 16:16 ?740次閱讀

    全新NVIDIA NIM微服務(wù)將生成式AI引入數(shù)字環(huán)境

    生成式物理 AI NIM 微服務(wù)以及 NVIDIA Metropolis 參考工作流旨在協(xié)助創(chuàng)建智能的沉浸式工作環(huán)境。
    的頭像 發(fā)表于 08-02 15:20 ?757次閱讀

    采用OpenUSD和NVIDIA NIM微服務(wù)創(chuàng)建精準(zhǔn)品牌視覺

    全球領(lǐng)先的創(chuàng)意和制作服務(wù)機(jī)構(gòu)率先采用 OpenUSD 和 NVIDIA NIM 微服務(wù)來創(chuàng)建精準(zhǔn)的品牌視覺。
    的頭像 發(fā)表于 08-01 14:33 ?610次閱讀

    全新 NVIDIA NeMo Retriever微服務(wù)大幅提升LLM的準(zhǔn)確性和吞吐量

    企業(yè)能夠通過提供檢索增強(qiáng)生成功能的生產(chǎn)就緒型 NVIDIA NIM 推理微服務(wù),充分挖掘業(yè)務(wù)數(shù)據(jù)的價(jià)值。這些微服務(wù)現(xiàn)已集成到 Cohesity、DataStax、NetApp 和 Sn
    的頭像 發(fā)表于 07-26 11:13 ?1085次閱讀
    全新 <b class='flag-5'>NVIDIA</b> NeMo Retriever<b class='flag-5'>微服務(wù)</b>大幅提升LLM的準(zhǔn)確性和吞吐量

    英偉達(dá)推出全新NVIDIA AI Foundry服務(wù)NVIDIA NIM推理微服務(wù)

    NVIDIA 宣布推出全新 NVIDIA AI Foundry 服務(wù)NVIDIA NIM 推理微服務(wù)
    的頭像 發(fā)表于 07-25 09:48 ?926次閱讀

    NVIDIA與Google DeepMind合作推動大語言模型創(chuàng)新

    支持 NVIDIA NIM 推理微服務(wù)的谷歌最新開源模型 PaliGemma 首次亮相。
    的頭像 發(fā)表于 05-16 09:44 ?636次閱讀

    電子發(fā)燒友

    中國電子工程師最喜歡的網(wǎng)站

    • 2931785位工程師會員交流學(xué)習(xí)
    • 獲取您個(gè)性化的科技前沿技術(shù)信息
    • 參加活動獲取豐厚的禮品