0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

英偉達發(fā)布AI模型 Llama-3.1-Nemotron-51B AI模型

A面面觀 ? 2024-09-26 17:30 ? 次閱讀

英偉達公司宣布推出 Llama-3.1-Nemotron-51B AI 模型,這個AI大模型是源自 Meta 公司的 Llama-3.1-70B大模型,基于使用了神經架構搜索(NAS)方法,推理速度比原70B大模型提升2.2倍,具備更準確和更高效的運算效率;能夠大幅降低運行成本。

通過NAS技術微調;大幅降低了內存消耗、計算復雜性;Llama-3.1-Nemotron-51B AI 模型在單個H100 GPU上的表現(xiàn)非常優(yōu)秀,在推理過程中可以在單個 GPU 上運行 4 倍以上的工作負載。這使得單片H100 GPU即可處理更大型的推理任務;這無疑是顯著的降低了訓練成本。這為AI提供了高效、經濟的方案。



聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 英偉達
    +關注

    關注

    22

    文章

    3776

    瀏覽量

    91111
  • AI大模型
    +關注

    關注

    0

    文章

    316

    瀏覽量

    310
收藏 人收藏

    評論

    相關推薦

    AI模型不再依賴英偉GPU?蘋果揭秘自研大模型

    ? 電子發(fā)燒友網(wǎng)報道(文/梁浩斌)過去幾年中爆發(fā)的AI算力需求,英偉GPU成為了最大的贏家,無論是自動駕駛還是AI模型,比如特斯拉、小鵬
    的頭像 發(fā)表于 08-05 06:07 ?4001次閱讀
    <b class='flag-5'>AI</b>大<b class='flag-5'>模型</b>不再依賴<b class='flag-5'>英偉</b><b class='flag-5'>達</b>GPU?蘋果揭秘自研大<b class='flag-5'>模型</b>

    Meta重磅發(fā)布Llama 3.3 70B:開源AI模型的新里程碑

    新的高度。 一,技術突破:開源智能的新高度 Llama 3.3 70B 模型發(fā)布,標志著開源AI模型
    的頭像 發(fā)表于 12-18 16:46 ?127次閱讀
    Meta重磅<b class='flag-5'>發(fā)布</b><b class='flag-5'>Llama</b> 3.3 70<b class='flag-5'>B</b>:開源<b class='flag-5'>AI</b><b class='flag-5'>模型</b>的新里程碑

    Meta推出Llama 3.3 70B,AI模型競爭白熱化

    在今年的AI領域,Meta也不甘落后,推出了其壓軸之作——Llama 3.3 70B模型。與此同時,馬斯克的xAI也宣布其Grok模型從今
    的頭像 發(fā)表于 12-09 14:50 ?380次閱讀

    Llama 3 與開源AI模型的關系

    在人工智能(AI)的快速發(fā)展中,開源AI模型扮演著越來越重要的角色。它們不僅推動了技術的創(chuàng)新,還促進了全球開發(fā)者社區(qū)的合作。Llama 3,作為一個新興的
    的頭像 發(fā)表于 10-27 14:42 ?372次閱讀

    Llama 3 模型與其他AI工具對比

    Llama 3模型與其他AI工具的對比可以從多個維度進行,包括但不限于技術架構、性能表現(xiàn)、應用場景、定制化能力、開源與成本等方面。以下是對Llama 3
    的頭像 發(fā)表于 10-27 14:37 ?389次閱讀

    NVIDIA Nemotron-4 340B模型幫助開發(fā)者生成合成訓練數(shù)據(jù)

    Nemotron-4 340B 是針對 NVIDIA NeMo 和 NVIDIA TensorRT-LLM 優(yōu)化的模型系列,該系列包含最先進的指導和獎勵模型,以及一個用于生成式
    的頭像 發(fā)表于 09-06 14:59 ?316次閱讀
    NVIDIA <b class='flag-5'>Nemotron</b>-4 340<b class='flag-5'>B</b><b class='flag-5'>模型</b>幫助開發(fā)者生成合成訓練數(shù)據(jù)

    英偉震撼發(fā)布:全新AI模型參數(shù)規(guī)模躍升至80億量級

    8月23日,英偉宣布,其全新AI模型面世,該模型參數(shù)規(guī)模高達80億,具有精度高、計算效益大等優(yōu)勢,適用于GPU加速的數(shù)據(jù)中心、云及工作站環(huán)
    的頭像 發(fā)表于 08-23 16:08 ?740次閱讀

    Meta Llama 3.1系列模型可在Google Cloud上使用

    我們很高興宣布,Llama 3.1 系列模型已添加到 Vertex AI Model Garden,這包括全新的 405B,即 Meta 迄
    的頭像 發(fā)表于 08-02 15:42 ?397次閱讀

    Meta發(fā)布全新開源大模型Llama 3.1

    科技巨頭Meta近期震撼發(fā)布了其最新的開源人工智能(AI模型——Llama 3.1,這一舉措標志著Meta在
    的頭像 發(fā)表于 07-24 18:25 ?1442次閱讀

    NVIDIA AI Foundry 為全球企業(yè)打造自定義 Llama 3.1 生成式 AI 模型

    借助 NVIDIA AI Foundry,企業(yè)和各國現(xiàn)在能夠使用自有數(shù)據(jù)與 Llama 3.1 405B 和 NVIDIA Nemotron
    發(fā)表于 07-24 09:39 ?713次閱讀
    NVIDIA <b class='flag-5'>AI</b> Foundry 為全球企業(yè)打造自定義 <b class='flag-5'>Llama</b> <b class='flag-5'>3.1</b> 生成式 <b class='flag-5'>AI</b> <b class='flag-5'>模型</b>

    Meta即將發(fā)布超強開源AI模型Llama 3-405B

    在人工智能領域的激烈競爭中,Meta公司再次擲出重磅炸彈,宣布將于7月23日正式發(fā)布其最新力作——Llama 3-405B,一個擁有驚人4050億參數(shù)的開源大模型。這一舉措不僅標志著M
    的頭像 發(fā)表于 07-18 09:58 ?994次閱讀

    英偉開源Nemotron-4 340B系列模型,助力大型語言模型訓練

    近日,英偉宣布開源了一款名為Nemotron-4 340B的大型模型,這一壯舉為開發(fā)者們打開了通往高性能大型語言
    的頭像 發(fā)表于 06-17 14:53 ?568次閱讀

    英偉推出AI模型推理服務NVIDIA NIM

    英偉近日宣布推出一項革命性的AI模型推理服務——NVIDIA NIM。這項服務將極大地簡化AI模型
    的頭像 發(fā)表于 06-04 09:15 ?682次閱讀

    英偉首席執(zhí)行官黃仁勛:AI模型推動英偉AI芯片需求

    近來,以ChatGPT為代表的AI聊天機器人已經導致英偉AI芯片供應緊張。然而,隨著能夠創(chuàng)造視頻并進行近似人類交流的新型AI
    的頭像 發(fā)表于 05-24 10:04 ?505次閱讀

    Meta推出最新版AI代碼生成模型Code Llama70B

    Meta近日宣布了其最新版本的AI代碼生成模型Code Llama70B,并稱其為“目前最大、最優(yōu)秀的模型”。這一更新標志著Meta在AI
    的頭像 發(fā)表于 01-30 18:21 ?1450次閱讀