0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

富士通使用富岳超級(jí)計(jì)算機(jī)訓(xùn)練LLM

冬至配餃子 ? 來源:網(wǎng)絡(luò)整理 ? 作者:網(wǎng)絡(luò)整理 ? 2024-05-13 14:18 ? 次閱讀

盡管富士通的富岳超級(jí)計(jì)算機(jī)不再是超級(jí)計(jì)算機(jī)500強(qiáng)名單中最快的機(jī)器,但它仍然是一個(gè)非常強(qiáng)大的系統(tǒng),A64FX處理器的多功能性允許將其用于各種工作負(fù)載,例如AI。本周,富士通發(fā)布了Fugaku-LLM,這是一個(gè)具有高級(jí)日語處理能力的大型語言模型,專為研究和商業(yè)應(yīng)用而設(shè)計(jì)。

富士通的Fugaku-LLM在富岳超級(jí)計(jì)算機(jī)的13,824個(gè)節(jié)點(diǎn)上使用3800億個(gè)符記進(jìn)行訓(xùn)練,該超級(jí)計(jì)算機(jī)基于A64FX處理器,支持FP64、FP32、FP16和INT8模式,適用于各種AI和傳統(tǒng)超級(jí)計(jì)算機(jī)應(yīng)用。Fugaku-LLM的訓(xùn)練利用了針對(duì)超級(jí)計(jì)算機(jī)架構(gòu)和互連優(yōu)化的分布式并行學(xué)習(xí)技術(shù)。

Fugaku-LLM 有 130 億個(gè)參數(shù),與 GPT-4 的 1750 億個(gè)參數(shù)相比顯得蒼白無力,不過,F(xiàn)ugaku-LLM是日本有史以來訓(xùn)練量的最大 LLM。富士通表示,其130億參數(shù)的LLM不需要大量的計(jì)算資源來推理,這對(duì)日本的企業(yè)和研究人員來說是最佳選擇。大約 60% 的訓(xùn)練數(shù)據(jù)是日語,40% 的數(shù)據(jù)是英語、數(shù)學(xué)和代碼數(shù)據(jù)。

這種廣泛的以日語為中心的訓(xùn)練使其有別于其它主要在英語數(shù)據(jù)集上訓(xùn)練的日語模型。因此,F(xiàn)ugaku-LLM擁有卓越的日語水平,在日語MT-Bench上獲得了5.5的平均分,這是使用日本原始數(shù)據(jù)訓(xùn)練的公開可用模型中的最高分。根據(jù)富士通的數(shù)據(jù),它在人文和社會(huì)科學(xué)方面尤其出色,取得了令人印象深刻的 9.18 分的基準(zhǔn)分?jǐn)?shù)。

Fugaku-LLM計(jì)劃是由東京工業(yè)大學(xué)、東北大學(xué)、富士通株式會(huì)社、RIKEN、名古屋大學(xué)、CyberAgent和Kotoba Technologies等日本領(lǐng)先機(jī)構(gòu)之間的合作推動(dòng)的。他們合作的原因之一是通常用于訓(xùn)練和推理 AI 模型的 GPU 短缺。另一個(gè)原因是,該模型可以與富士通的下一代 150 核 Monaka 數(shù)據(jù)中心 CPU 一起使用,該 CPU 針對(duì) AI 和 HPC 工作負(fù)載進(jìn)行了優(yōu)化。

Fugaku-LLM現(xiàn)在可以在GitHub和Hugging Face的指定許可條款下用于學(xué)術(shù)和商業(yè)目的(盡管富士通沒有提供任何鏈接)。此外,它從2024年5月10日起通過富士通研究門戶網(wǎng)站提供。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 處理器
    +關(guān)注

    關(guān)注

    68

    文章

    19594

    瀏覽量

    232169
  • 超級(jí)計(jì)算機(jī)

    關(guān)注

    2

    文章

    465

    瀏覽量

    42193
  • 富士通
    +關(guān)注

    關(guān)注

    2

    文章

    199

    瀏覽量

    54865
  • LLM
    LLM
    +關(guān)注

    關(guān)注

    1

    文章

    315

    瀏覽量

    569
收藏 0人收藏

    評(píng)論

    相關(guān)推薦

    云端超級(jí)計(jì)算機(jī)使用教程

    云端超級(jí)計(jì)算機(jī)是一種基于云計(jì)算的高性能計(jì)算服務(wù),它將大量計(jì)算資源和存儲(chǔ)資源集中在一起,通過網(wǎng)絡(luò)向用戶提供按需的
    的頭像 發(fā)表于 12-17 10:19 ?353次閱讀

    富士通綜合報(bào)告(Fujitsu Integrated Report 2024)》帶你全面了解富士通

    ? 今年10月,富士通發(fā)布了 《富士通綜合報(bào)告(Fujitsu Integrated Report 2024)》 。這份報(bào)告詳細(xì)介紹了有關(guān)富士通的業(yè)務(wù)經(jīng)營(yíng)情況,以及創(chuàng)新的價(jià)值創(chuàng)造舉措,旨在與所有
    的頭像 發(fā)表于 12-11 17:31 ?864次閱讀
    《<b class='flag-5'>富士通</b>綜合報(bào)告(Fujitsu Integrated Report 2024)》帶你全面了解<b class='flag-5'>富士通</b>

    量子計(jì)算機(jī)與普通計(jì)算機(jī)工作原理的區(qū)別

    超越世界上最強(qiáng)大的超級(jí)計(jì)算機(jī),完成以前不可想象的任務(wù)!這意味著量子計(jì)算機(jī)可能會(huì)徹底改變我們的生活。 在本文中,我們將先了解普通計(jì)算機(jī)的工作原理,再深入探討量子
    的頭像 發(fā)表于 11-24 11:00 ?917次閱讀
    量子<b class='flag-5'>計(jì)算機(jī)</b>與普通<b class='flag-5'>計(jì)算機(jī)</b>工作原理的區(qū)別

    如何訓(xùn)練自己的LLM模型

    訓(xùn)練自己的大型語言模型(LLM)是一個(gè)復(fù)雜且資源密集的過程,涉及到大量的數(shù)據(jù)、計(jì)算資源和專業(yè)知識(shí)。以下是訓(xùn)練LLM模型的一般步驟,以及一些關(guān)
    的頭像 發(fā)表于 11-08 09:30 ?1213次閱讀

    NVIDIA 以太網(wǎng)加速 xAI 構(gòu)建的全球最大 AI 超級(jí)計(jì)算機(jī)

    、超大規(guī)模的 AI 工廠提供卓越性能而設(shè)計(jì)的 RDMA(Remote Direct Memory Access)網(wǎng)絡(luò)。 ? Colossus 是世界上最大的 AI 超級(jí)計(jì)算機(jī),目前正被用于訓(xùn)練 xAI 的 Grok 系列大語言模
    發(fā)表于 10-30 09:33 ?232次閱讀
    NVIDIA 以太網(wǎng)加速 xAI 構(gòu)建的全球最大 AI <b class='flag-5'>超級(jí)</b><b class='flag-5'>計(jì)算機(jī)</b>

    丹麥推出首臺(tái)AI超級(jí)計(jì)算機(jī)Gefion

    近日,丹麥正式推出了該國首臺(tái)人工智能超級(jí)計(jì)算機(jī),命名為Gefion,以紀(jì)念丹麥神話中的女神。此次揭幕儀式由英偉達(dá)首席執(zhí)行官黃仁勛與丹麥國王共同出席,彰顯了該項(xiàng)目的重要性和影響力。 Gefion AI
    的頭像 發(fā)表于 10-29 15:13 ?601次閱讀

    NVIDIA助力丹麥發(fā)布首臺(tái)AI超級(jí)計(jì)算機(jī)

    這臺(tái)丹麥最大的超級(jí)計(jì)算機(jī)由該國政府與丹麥 AI 創(chuàng)新中心共同建設(shè),是一臺(tái) NVIDIA DGX SuperPOD 超級(jí)計(jì)算機(jī)
    的頭像 發(fā)表于 10-27 09:42 ?670次閱讀

    云端超級(jí)計(jì)算機(jī)怎么用

    云端超級(jí)計(jì)算機(jī)是一種基于云計(jì)算的高性能計(jì)算服務(wù),它將大量計(jì)算資源和存儲(chǔ)資源集中在一起,通過網(wǎng)絡(luò)向用戶提供按需的
    的頭像 發(fā)表于 10-18 10:14 ?311次閱讀

    借助NVIDIA超級(jí)計(jì)算機(jī)加速量子計(jì)算發(fā)展

    科學(xué)期刊《自然》(Nature)本月早些時(shí)候發(fā)表了一項(xiàng)研究,通過使用 NVIDIA 驅(qū)動(dòng)的超級(jí)計(jì)算機(jī),驗(yàn)證了量子計(jì)算的商業(yè)化途徑。
    的頭像 發(fā)表于 07-25 09:55 ?686次閱讀

    富士通與Cohere合作,專注于開發(fā)和提供大型語言模型(LLM)

    富士通(Fujitsu)與總部位于多倫多與舊金山的頂尖安全及數(shù)據(jù)隱私人工智能企業(yè)Cohere Inc.攜手宣布建立深度戰(zhàn)略合作伙伴關(guān)系,共同致力于大型語言模型(LLM)的創(chuàng)新與開發(fā),旨在為企業(yè)界帶來前所未有的日語處理能力,進(jìn)而優(yōu)化客戶與員工體驗(yàn)。
    的頭像 發(fā)表于 07-16 16:55 ?623次閱讀

    工業(yè)計(jì)算機(jī)與普通計(jì)算機(jī)的區(qū)別

    在信息化和自動(dòng)化日益發(fā)展的今天,計(jì)算機(jī)已經(jīng)成為了我們?nèi)粘I詈凸ぷ髦胁豢苫蛉钡墓ぞ摺H欢?,?b class='flag-5'>計(jì)算機(jī)領(lǐng)域中,工業(yè)計(jì)算機(jī)和普通計(jì)算機(jī)雖然都具備基本的計(jì)算
    的頭像 發(fā)表于 06-06 16:45 ?1976次閱讀

    富士通發(fā)布《富士通技術(shù)與服務(wù)愿景2024》

    富士通近日發(fā)布了《富士通技術(shù)與服務(wù)愿景2024(Fujitsu Technology and Service Vision 2024,簡(jiǎn)稱FT&SV 2024)》,闡述了對(duì)未來商業(yè)和社會(huì)的愿景。
    的頭像 發(fā)表于 05-29 17:07 ?718次閱讀
    <b class='flag-5'>富士通</b>發(fā)布《<b class='flag-5'>富士通</b>技術(shù)與服務(wù)愿景2024》

    日本超算富岳助力構(gòu)建大規(guī)模語言模型Fugaku-LLM

    在昨日公布的新聞稿中,研究團(tuán)隊(duì)表示他們成功發(fā)掘了富岳超級(jí)計(jì)算機(jī)的潛能,使矩陣乘法運(yùn)算速度提升六倍,通信速度提高三倍,從而證實(shí)大型純CPU超級(jí)計(jì)算機(jī)
    的頭像 發(fā)表于 05-11 17:07 ?1019次閱讀

    日本團(tuán)隊(duì)發(fā)布在富岳超算上訓(xùn)練的Fugaku-LLM大模型

    自2023年5月起,F(xiàn)ugaku-LLM模型的開發(fā)工作開始展開,最初參與團(tuán)隊(duì)包括富士通、東京工業(yè)大學(xué)、日本東北大學(xué)以及日本理化學(xué)研究所(簡(jiǎn)稱理研)。
    的頭像 發(fā)表于 05-11 10:05 ?534次閱讀

    微軟和OpenAI計(jì)劃投資1000億美元建造“星際之門”AI超級(jí)計(jì)算機(jī)

    微軟和OpenAI計(jì)劃投資1000億美元建造“星際之門”AI超級(jí)計(jì)算機(jī)這一消息屬實(shí)。
    的頭像 發(fā)表于 04-11 10:14 ?768次閱讀

    電子發(fā)燒友

    中國電子工程師最喜歡的網(wǎng)站

    • 2931785位工程師會(huì)員交流學(xué)習(xí)
    • 獲取您個(gè)性化的科技前沿技術(shù)信息
    • 參加活動(dòng)獲取豐厚的禮品