0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

NVIDIA推出開放式Llama Nemotron系列模型

NVIDIA英偉達(dá)企業(yè)解決方案 ? 來源:NVIDIA英偉達(dá)企業(yè)解決方案 ? 2025-01-09 11:11 ? 次閱讀

作為 NVIDIA NIM 微服務(wù),開放式 Llama Nemotron 大語言模型和 Cosmos Nemotron 視覺語言模型可在任何加速系統(tǒng)上為 AI 智能體提供強(qiáng)效助力。

人工智能正在進(jìn)入一個(gè)全新的時(shí)代——代理式 AI。在這個(gè)時(shí)代,專業(yè)智能體團(tuán)隊(duì)可以幫助人們解決復(fù)雜的問題并自動(dòng)執(zhí)行重復(fù)任務(wù)。

借助定制 AI 智能體,各行各業(yè)的企業(yè)可以構(gòu)建智能解決方案,從而獲得前所未有的生產(chǎn)力。這些先進(jìn)的 AI 智能體需要一個(gè)多樣化生成式 AI 模型系統(tǒng),并且這些模型要針對(duì)代理式 AI 功能和能力進(jìn)行優(yōu)化。這樣的復(fù)雜程度意味著企業(yè)對(duì)強(qiáng)大、高效的企業(yè)級(jí)模型產(chǎn)生了極大的需求。

為了給企業(yè)代理式 AI 奠定基礎(chǔ),NVIDIA 宣布推出開放式大語言模型 (LLM) 的 Llama Nemotron 系列。該模型基于 Llama 構(gòu)建,可以幫助開發(fā)者在一系列應(yīng)用中創(chuàng)建和部署 AI 智能體,包括客戶支持、欺詐檢測(cè)、產(chǎn)品供應(yīng)鏈和庫存管理優(yōu)化。

許多 AI 智能體不僅需要語言技能,還需要感知世界并采取適當(dāng)行動(dòng)的能力,以更有效地發(fā)揮其作用。

借助全新的NVIDIA Cosmos Nemotron視覺語言模型 (VLM) 以及面向視頻搜索和摘要的NVIDIA NIM微服務(wù),開發(fā)者可以構(gòu)建智能體,分析來自自主機(jī)器、醫(yī)院、商店和倉庫的圖像和視頻以及體育賽事、電影和新聞,并對(duì)其做出響應(yīng)。針對(duì)希望為機(jī)器人自動(dòng)駕駛汽車領(lǐng)域生成物理感知視頻的開發(fā)者,NVIDIA 還宣布推出 NVIDIA Cosmos世界基礎(chǔ)模型。

開放式 Llama Nemotron 模型

優(yōu)化了 AI 智能體的計(jì)算效率和精度

NVIDIA Llama Nemotron模型基于 Llama 基礎(chǔ)模型而構(gòu)建,為 AI 智能體開發(fā)提供經(jīng)過優(yōu)化的基礎(chǔ)模組。Llama 基礎(chǔ)模型是最熱門的商用開源模型集合之一,下載次數(shù)超過 6.5 億次。這一成果建立在 NVIDIA 致力于開發(fā)前沿模型的基礎(chǔ)之上,例如 Llama 3.1 Nemotron 70B,現(xiàn)在可通過 NVIDIA API 目錄獲取。

Llama Nemotron 模型使用 NVIDIA 最新技術(shù)和高質(zhì)量數(shù)據(jù)集進(jìn)行剪枝和訓(xùn)練,可增強(qiáng)代理式 AI 功能。它們?cè)谥噶钭裱⒘奶?、函?shù)調(diào)用、編碼和數(shù)學(xué)方面表現(xiàn)出色,同時(shí)經(jīng)過尺寸優(yōu)化,可在廣泛的 NVIDIA 加速計(jì)算資源上運(yùn)行。

Meta 副總裁兼 GenAI 負(fù)責(zé)人 Ahmad Al-Dahle 表示:“代理式 AI 是 AI 開發(fā)的下一個(gè)前沿,為了抓住這次機(jī)會(huì),需要在 LLM 系統(tǒng)中進(jìn)行全棧優(yōu)化,以提供高效、準(zhǔn)確的 AI 智能體。通過與 NVIDIA 的合作,以及我們對(duì)開放模型的共同承諾,基于 Llama 構(gòu)建的 NVIDIA Llama Nemotron 系列可以助力企業(yè)快速構(gòu)建自己的定制 AI 智能體。”

包括 SAP 和 ServiceNow 在內(nèi)的領(lǐng)先 AI 智能體平臺(tái)提供商,有望成為首批使用全新 Llama Nemotron 模型的企業(yè)。

SAP 首席人工智能官 Philipp Herzig 表示:“能夠跨多個(gè)業(yè)務(wù)線協(xié)作解決復(fù)雜任務(wù)的 AI 智能體將會(huì)超越當(dāng)今的生成式 AI 場(chǎng)景,將企業(yè)生產(chǎn)力提升到一個(gè)全新的水平。借助 SAP 的 Joule,數(shù)億企業(yè)用戶能夠與這些智能體進(jìn)行交互,以前所未有的速度實(shí)現(xiàn)他們的目標(biāo)。NVIDIA 的全新開放式 Llama Nemotron 模型系列將推動(dòng)多個(gè)專用 AI 智能體的開發(fā),助力業(yè)務(wù)流程轉(zhuǎn)型?!?/p>

ServiceNow 平臺(tái) AI 副總裁 Jeremy Barnes 表示:“AI 智能體使企業(yè)組織能夠事半功倍,為業(yè)務(wù)轉(zhuǎn)型樹立了新的標(biāo)準(zhǔn)。NVIDIA 開放式 Llama Nemotron 模型性能和精度的提升有助于構(gòu)建先進(jìn)的 AI 智能體服務(wù),以解決各行業(yè)中各種職能的復(fù)雜問題。”

NVIDIA Llama Nemotron 模型使用NVIDIA NeMo進(jìn)行蒸餾、剪枝和對(duì)齊。使用這些技術(shù)可以將這些模型保持較小的規(guī)模,以便在各種計(jì)算平臺(tái)上運(yùn)行,并在提供高精度的同時(shí)提高模型吞吐量。

Llama Nemotron 模型系列將以可下載模型和 NVIDIA NIM 微服務(wù)的形式提供,可輕松部署在云端、數(shù)據(jù)中心、PC 和工作站。它們可以為企業(yè)提供業(yè)界領(lǐng)先的性能,并且能夠可靠、安全且無縫地集成到其代理式 AI 應(yīng)用工作流中。

使用 NVIDIA NeMo 定制

并接入業(yè)務(wù)知識(shí)

Llama Nemotron 和 Cosmos Nemotron 模型系列將提供 Nano、Super 和 Ultra 三種規(guī)模,為部署各種規(guī)模的 AI 智能體提供廣泛選擇。

Nano:成本效益最高的模型,針對(duì)實(shí)時(shí)應(yīng)用進(jìn)行了優(yōu)化,延遲低,非常適合部署在 PC 和邊緣設(shè)備上。

Super:高精度模型,可在單個(gè) GPU 上提供卓越的吞吐量。

Ultra:精度最高的模型,專為需要超高性能的數(shù)據(jù)中心級(jí)應(yīng)用而設(shè)計(jì)。

企業(yè)還可以使用 NVIDIA NeMo 微服務(wù)為其特定用例和領(lǐng)域定制模型,以簡化數(shù)據(jù)管護(hù)、加速模型定制和評(píng)估,還可以應(yīng)用護(hù)欄,以確保響應(yīng)正常。

借助NVIDIA NeMo Retriever,開發(fā)者還可以集成檢索增強(qiáng)生成功能,將模型與企業(yè)數(shù)據(jù)連接起來。

使用面向代理式 AI 的NVIDIA Blueprint,企業(yè)可以利用 NVIDIA 先進(jìn)的 AI 工具和端到端開發(fā)專長,快速構(gòu)建自己的應(yīng)用。事實(shí)上,NVIDIA Cosmos Nemotron、NVIDIA Llama Nemotron 和 NeMo Retriever 將為今天發(fā)布的面向視頻搜索和摘要的全新 NVIDIA Blueprint 提供強(qiáng)效助力。

NeMo、NeMo Retriever 和 NVIDIA Blueprint 均可通過 NVIDIA AI Enterprise 軟件平臺(tái)使用。

可用性

Llama Nemotron 和 Cosmos Nemotron 模型將以托管應(yīng)用編程接口的形式提供,可通過NVIDIA 官網(wǎng)和 Hugging Face 下載。

NVIDIA 開發(fā)者計(jì)劃的成員均可免費(fèi)訪問開發(fā)、測(cè)試和研究資源。

在生產(chǎn)中,企業(yè)可以使用 NVIDIA AI Enterprise 軟件平臺(tái)在加速數(shù)據(jù)中心和云計(jì)算基礎(chǔ)設(shè)施上運(yùn)行 Llama Nemotron 和 Cosmos Nemotron NIM 微服務(wù)。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • NVIDIA
    +關(guān)注

    關(guān)注

    14

    文章

    5238

    瀏覽量

    105760
  • 人工智能
    +關(guān)注

    關(guān)注

    1804

    文章

    48691

    瀏覽量

    246416
  • 模型
    +關(guān)注

    關(guān)注

    1

    文章

    3483

    瀏覽量

    49987

原文標(biāo)題:CES 2025 | NVIDIA 宣布推出 Nemotron 模型系列,推動(dòng)代理式 AI 發(fā)展

文章出處:【微信號(hào):NVIDIA-Enterprise,微信公眾號(hào):NVIDIA英偉達(dá)企業(yè)解決方案】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    ServiceNow攜手NVIDIA構(gòu)建150億參數(shù)超級(jí)助手

    Apriel Nemotron 15B 開源大語言模型 (LLM) 使用 NVIDIA NeMo、NVIDIA Llama
    的頭像 發(fā)表于 05-12 15:37 ?222次閱讀

    企業(yè)使用NVIDIA NeMo微服務(wù)構(gòu)建AI智能體平臺(tái)

    已發(fā)布的 NeMo 微服務(wù)可與合作伙伴平臺(tái)集成,作為創(chuàng)建 AI 智能體的構(gòu)建模塊,使用商業(yè)智能與強(qiáng)大的邏輯推理模型 (包括 NVIDIA Llama Nemotron) 處理更多任務(wù)。
    的頭像 發(fā)表于 04-27 15:05 ?336次閱讀

    英偉達(dá)GTC2025亮點(diǎn) NVIDIA推出Cosmos世界基礎(chǔ)模型和物理AI數(shù)據(jù)工具的重大更新

    、Figure AI、Skild AI 是最早采用該技術(shù)的公司。 NVIDIA 宣布推出全新 NVIDIA Cosmos 世界基礎(chǔ)模型 (WFM) 的重大更新,該
    的頭像 發(fā)表于 03-20 19:01 ?794次閱讀

    NVIDIA 推出開放推理 AI 模型系列,助力開發(fā)者和企業(yè)構(gòu)建代理式 AI 平臺(tái)

    月 18 日 —— ?NVIDIA 今日發(fā)布具有推理功能的開源 Llama Nemotron 模型系列,旨在為開發(fā)者和企業(yè)提供業(yè)務(wù)就緒型基
    發(fā)表于 03-19 09:31 ?199次閱讀
    <b class='flag-5'>NVIDIA</b> <b class='flag-5'>推出</b><b class='flag-5'>開放</b>推理 AI <b class='flag-5'>模型</b><b class='flag-5'>系列</b>,助力開發(fā)者和企業(yè)構(gòu)建代理式 AI 平臺(tái)

    Ironwood開放式頂部BGA插座凸輪驅(qū)動(dòng)桿

    Ironwood開放式頂部BGA插座凸輪驅(qū)動(dòng)桿 Ironwood的BGA芯片壽命通??赏ㄟ^浴槽曲線來典型地展示。鑒于BGA制造工藝的固有屬性,極少數(shù)BGA在初期使用階段就可能失效,而在其正常使用期
    發(fā)表于 02-17 09:36

    VCE05系列封裝和開放式框架寬輸入AC-DC電源XP?POWER

    VCE05系列封裝和開放式框架寬輸入AC-DC電源XP?POWERVCE05是XP?POWER一系列開放式框架和封裝AC-DC單輸出電源,
    發(fā)表于 01-24 08:41

    Traco Power推出全新TXO系列開放式框架AC/DC電源

    在工業(yè)領(lǐng)域,電源設(shè)備的穩(wěn)定性和可靠性至關(guān)重要。Traco Power全新推出的TXO系列開放式框架AC/DC電源,以高效率、強(qiáng)化隔離和多功能性,為成本敏感型工業(yè)應(yīng)用提供了理想的解決方案。
    的頭像 發(fā)表于 01-15 16:12 ?920次閱讀
    Traco Power<b class='flag-5'>推出</b>全新TXO<b class='flag-5'>系列</b><b class='flag-5'>開放式</b>框架AC/DC電源

    使用NVIDIA TensorRT提升Llama 3.2性能

    Llama 3.2 模型集擴(kuò)展了 Meta Llama 開源模型集的模型陣容,包含視覺語言模型
    的頭像 發(fā)表于 11-20 09:59 ?681次閱讀

    英偉達(dá)發(fā)布AI模型 Llama-3.1-Nemotron-51B AI模型

    英偉達(dá)公司宣布推出 Llama-3.1-Nemotron-51B AI 模型,這個(gè)AI大模型是源自 Meta 公司的 Llama-3.1-7
    的頭像 發(fā)表于 09-26 17:30 ?830次閱讀

    NVIDIA Nemotron-4 340B模型幫助開發(fā)者生成合成訓(xùn)練數(shù)據(jù)

    Nemotron-4 340B 是針對(duì) NVIDIA NeMo 和 NVIDIA TensorRT-LLM 優(yōu)化的模型系列,該
    的頭像 發(fā)表于 09-06 14:59 ?614次閱讀
    <b class='flag-5'>NVIDIA</b> <b class='flag-5'>Nemotron</b>-4 340B<b class='flag-5'>模型</b>幫助開發(fā)者生成合成訓(xùn)練數(shù)據(jù)

    紫光同芯推出開放式架構(gòu)安全芯片E450R

    2024紫光同芯合作伙伴大會(huì)在北京璀璨啟幕,會(huì)上紫光同芯震撼發(fā)布了其最新技術(shù)結(jié)晶——全球首顆融合開放式硬件與軟件架構(gòu)的安全芯片E450R。這款芯片以其獨(dú)特的雙開放設(shè)計(jì),即開放式硬件架構(gòu)搭配開放
    的頭像 發(fā)表于 08-28 16:28 ?871次閱讀

    Meta Llama 3.1系列模型可在Google Cloud上使用

    我們很高興宣布,Llama 3.1 系列模型已添加到 Vertex AI Model Garden,這包括全新的 405B,即 Meta 迄今為止功能最強(qiáng)大、用途最廣泛的模型。這些
    的頭像 發(fā)表于 08-02 15:42 ?653次閱讀

    NVIDIA攜手Meta推出AI服務(wù),為企業(yè)提供生成AI服務(wù)

    NVIDIA近日宣布了一項(xiàng)重大舉措,正式推出NVIDIA AI Foundry服務(wù)與NVIDIA NIM(NVIDIA Inference
    的頭像 發(fā)表于 07-25 16:57 ?784次閱讀

    英偉達(dá)推出全新NVIDIA AI Foundry服務(wù)和NVIDIA NIM推理微服務(wù)

    NVIDIA 宣布推出全新 NVIDIA AI Foundry 服務(wù)和 NVIDIA NIM 推理微服務(wù),與同樣剛推出
    的頭像 發(fā)表于 07-25 09:48 ?990次閱讀

    NVIDIA AI Foundry 為全球企業(yè)打造自定義 Llama 3.1 生成 AI 模型

    借助 NVIDIA AI Foundry,企業(yè)和各國現(xiàn)在能夠使用自有數(shù)據(jù)與 Llama 3.1 405B 和 NVIDIA Nemotron 模型
    發(fā)表于 07-24 09:39 ?861次閱讀
    <b class='flag-5'>NVIDIA</b> AI Foundry 為全球企業(yè)打造自定義 <b class='flag-5'>Llama</b> 3.1 生成<b class='flag-5'>式</b> AI <b class='flag-5'>模型</b>

    電子發(fā)燒友

    中國電子工程師最喜歡的網(wǎng)站

    • 2931785位工程師會(huì)員交流學(xué)習(xí)
    • 獲取您個(gè)性化的科技前沿技術(shù)信息
    • 參加活動(dòng)獲取豐厚的禮品