0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內(nèi)不再提示

英偉達發(fā)布Nemotron-CC大型AI訓練數(shù)據(jù)庫

科技綠洲 ? 來源:網(wǎng)絡整理 ? 作者:網(wǎng)絡整理 ? 2025-01-14 14:14 ? 次閱讀

近日,英偉達在其官方博客上宣布了一項重大進展,推出了一款名為Nemotron-CC的大型英文AI訓練數(shù)據(jù)庫。這一數(shù)據(jù)庫的發(fā)布,標志著英偉達在推動大語言模型訓練技術方面邁出了重要一步。

據(jù)英偉達介紹,Nemotron-CC數(shù)據(jù)庫總計包含了驚人的6.3萬億個Token,其中1.9萬億為精心合成的數(shù)據(jù)。這一龐大的數(shù)據(jù)量不僅為AI模型的訓練提供了豐富的素材,更為學術界和企業(yè)界在探索大語言模型領域時提供了強有力的支持。

英偉達聲稱,Nemotron-CC數(shù)據(jù)庫的設計初衷就是為了幫助學術界和企業(yè)界進一步推動大語言模型的訓練過程。通過提供如此大規(guī)模、高質量的訓練數(shù)據(jù),英偉達期望能夠加速AI技術的創(chuàng)新和應用,為各行各業(yè)帶來更多的智能化解決方案。

隨著人工智能技術的不斷發(fā)展,大語言模型已經(jīng)成為研究和實踐中的熱點。而英偉達此次推出的Nemotron-CC數(shù)據(jù)庫,無疑將為這一領域的研究和應用注入新的活力。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • AI
    AI
    +關注

    關注

    87

    文章

    31234

    瀏覽量

    269597
  • 數(shù)據(jù)庫

    關注

    7

    文章

    3834

    瀏覽量

    64539
  • 模型
    +關注

    關注

    1

    文章

    3277

    瀏覽量

    48963
  • 英偉達
    +關注

    關注

    22

    文章

    3811

    瀏覽量

    91469
收藏 人收藏

    評論

    相關推薦

    數(shù)據(jù)庫是哪種數(shù)據(jù)庫類型?

    數(shù)據(jù)庫是一種部署在虛擬計算環(huán)境中的數(shù)據(jù)庫,它融合了云計算的彈性和可擴展性,為用戶提供高效、靈活的數(shù)據(jù)庫服務。云數(shù)據(jù)庫主要分為兩大類:關系型數(shù)據(jù)庫
    的頭像 發(fā)表于 01-07 10:22 ?102次閱讀

    數(shù)據(jù)庫數(shù)據(jù)恢復—通過拼接數(shù)據(jù)庫碎片恢復SQLserver數(shù)據(jù)庫

    一個運行在存儲上的SQLServer數(shù)據(jù)庫,有1000多個文件,大小幾十TB。數(shù)據(jù)庫每10天生成一個NDF文件,每個NDF幾百GB大小。數(shù)據(jù)庫包含兩個LDF文件。 存儲損壞,數(shù)據(jù)庫
    的頭像 發(fā)表于 10-31 13:21 ?280次閱讀
    <b class='flag-5'>數(shù)據(jù)庫</b><b class='flag-5'>數(shù)據(jù)</b>恢復—通過拼接<b class='flag-5'>數(shù)據(jù)庫</b>碎片恢復SQLserver<b class='flag-5'>數(shù)據(jù)庫</b>

    英偉發(fā)布AI模型 Llama-3.1-Nemotron-51B AI模型

    英偉公司宣布推出 Llama-3.1-Nemotron-51B AI 模型,這個AI大模型是源自 Meta 公司的 Llama-3.1-7
    的頭像 發(fā)表于 09-26 17:30 ?635次閱讀

    NVIDIA Nemotron-4 340B模型幫助開發(fā)者生成合成訓練數(shù)據(jù)

    Nemotron-4 340B 是針對 NVIDIA NeMo 和 NVIDIA TensorRT-LLM 優(yōu)化的模型系列,該系列包含最先進的指導和獎勵模型,以及一個用于生成式 AI 訓練數(shù)
    的頭像 發(fā)表于 09-06 14:59 ?350次閱讀
    NVIDIA <b class='flag-5'>Nemotron</b>-4 340B模型幫助開發(fā)者生成合成<b class='flag-5'>訓練</b><b class='flag-5'>數(shù)據(jù)</b>

    英偉Blackwell可支持10萬億參數(shù)模型AI訓練,實時大語言模型推理

    、NVLink交換機、Spectrum以太網(wǎng)交換機和Quantum InfiniBand交換機。 ? 英偉稱,Blackwell擁有6項革命性技術,可支持多達10萬億參數(shù)的模型進行AI訓練
    的頭像 發(fā)表于 09-04 09:10 ?2961次閱讀

    英偉回應AI芯片推遲發(fā)布傳聞

    近日,英偉就外界廣泛關注的AI芯片Blackwell推遲發(fā)布傳聞作出正式回應。8月4日,英偉
    的頭像 發(fā)表于 08-05 17:34 ?702次閱讀

    英偉打造人形機器人訓練平臺,引領AI新紀元

    英偉近日宣布了一項重大舉措,為全球機器人制造業(yè)與AI領域注入強勁動力。公司推出了專為人形機器人設計的訓練平臺,旨在為行業(yè)領先的制造商、AI
    的頭像 發(fā)表于 08-05 11:45 ?767次閱讀

    蘋果AI模型訓練新動向:攜手谷歌,未選英偉

    近日,蘋果公司發(fā)布的最新研究報告揭示了其在人工智能領域的又一重要戰(zhàn)略選擇——采用谷歌設計的芯片來訓練AI模型,而非行業(yè)巨頭英偉的產(chǎn)品。這
    的頭像 發(fā)表于 08-01 18:11 ?937次閱讀

    蘋果承認使用谷歌芯片來訓練AI

    蘋果公司最近在一篇技術論文中披露,其先進的人工智能系統(tǒng)Apple Intelligence背后的兩個關鍵AI模型,是在谷歌設計的云端芯片上完成預訓練的。這一消息標志著在尖端AI訓練領域
    的頭像 發(fā)表于 07-30 17:03 ?752次閱讀

    大型數(shù)據(jù)庫可選擇WDS作為其數(shù)據(jù)庫一體機產(chǎn)品存儲底座

    大型數(shù)據(jù)庫可選擇WDS作為其數(shù)據(jù)庫一體機產(chǎn)品存儲底座
    的頭像 發(fā)表于 07-25 09:42 ?265次閱讀
    <b class='flag-5'>大型</b><b class='flag-5'>數(shù)據(jù)庫</b>可選擇WDS作為其<b class='flag-5'>數(shù)據(jù)庫</b>一體機產(chǎn)品存儲底座

    英偉TITAN AI顯卡曝光,性能狂超RTX 409063%!# 英偉# 顯卡

    顯卡英偉
    jf_02331860
    發(fā)布于 :2024年07月24日 17:18:28

    英偉開源Nemotron-4 340B系列模型,助力大型語言模型訓練

    近日,英偉宣布開源了一款名為Nemotron-4 340B的大型模型,這一壯舉為開發(fā)者們打開了通往高性能大型語言模型(LLM)
    的頭像 發(fā)表于 06-17 14:53 ?593次閱讀

    進一步解讀英偉 Blackwell 架構、NVlink及GB200 超級芯片

    、及優(yōu)化的AI模型和應用程序,為用戶提供全面的AI計算解決方案。 DGX SuperPOD - 專為人工智能設計的數(shù)據(jù)中心 NVIDIA 發(fā)布
    發(fā)表于 05-13 17:16

    搭載英偉GPU,全球領先的向量數(shù)據(jù)庫公司Zilliz發(fā)布Milvus2.4向量數(shù)據(jù)庫

    在美國硅谷圣何塞召開的 NVIDIA GTC 大會上,全球領先的向量數(shù)據(jù)庫公司 Zilliz 發(fā)布了 Milvus 2.4 版本。這是一款革命性的向量數(shù)據(jù)庫系統(tǒng),在業(yè)界首屈一指,它首次采用了
    的頭像 發(fā)表于 04-01 14:33 ?505次閱讀
    搭載<b class='flag-5'>英偉</b><b class='flag-5'>達</b>GPU,全球領先的向量<b class='flag-5'>數(shù)據(jù)庫</b>公司Zilliz<b class='flag-5'>發(fā)布</b>Milvus2.4向量<b class='flag-5'>數(shù)據(jù)庫</b>

    英偉擅用版權作品遭起訴 AI訓練數(shù)據(jù)和版權的矛盾凸顯

    英偉擅用版權作品遭起訴 AI訓練數(shù)據(jù)和版權的矛盾凸顯 據(jù)外媒路透社的報道,AI
    的頭像 發(fā)表于 03-11 14:17 ?570次閱讀