0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

Google Gemma優(yōu)化后可在NVIDIA GPU上運(yùn)行

NVIDIA英偉達(dá) ? 來(lái)源:NVIDIA英偉達(dá) ? 2024-02-25 11:01 ? 次閱讀

借助 TensorRT-LLM,Google 全新開(kāi)放語(yǔ)言模型可在 NVIDIA AI 平臺(tái)(包括本地 RTX AI PC)上加速運(yùn)行。

2024 年 2 月 21 日,NVIDIA 攜手 Google 在所有 NVIDIA AI 平臺(tái)上發(fā)布面向 Gemma 的優(yōu)化功能,Gemma 是 Google 最先進(jìn)的新型輕量級(jí) 2B 和 7B 開(kāi)放語(yǔ)言模型,可在任何地方運(yùn)行,從而降低成本并加快特定領(lǐng)域用戶案例的創(chuàng)新工作。

NVIDIA 和 Google 的團(tuán)隊(duì)緊密合作,利用 NVIDIA TensorRT-LLM(用于優(yōu)化大語(yǔ)言模型推理性能的開(kāi)源庫(kù)),在數(shù)據(jù)中心的 NVIDIA GPU云計(jì)算和搭載 NVIDIA RTX GPU 的 PC 上運(yùn)行時(shí),加速 Gemma 性能(Gemma 由創(chuàng)建 Gemini 模型的相同研究和技術(shù)構(gòu)建)。

這使開(kāi)發(fā)者能將全球高性能 AI PC 中超過(guò) 1 億臺(tái)搭載 NVIDIA RTX GPU 的用戶作為潛在用戶進(jìn)行開(kāi)發(fā)。

開(kāi)發(fā)者還可在搭載 NVIDIA GPU 的云端運(yùn)行 Gemma,該實(shí)例擁有 141GB HBM3e 顯存,速度為 4.8TB/秒,Google 將于今年部署該實(shí)例。

此外,企業(yè)級(jí)開(kāi)發(fā)者還可利用 NVIDIA 豐富的工具生態(tài)系統(tǒng)(包括依托 NeMo 框架的 NVIDIA AI Enterprise 和 TensorRT-LLM),對(duì) Gemma 進(jìn)行微調(diào),并將優(yōu)化后的模型部署到生產(chǎn)應(yīng)用中。





審核編輯:劉清

聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • NVIDIA
    +關(guān)注

    關(guān)注

    14

    文章

    5055

    瀏覽量

    103372
  • 云計(jì)算
    +關(guān)注

    關(guān)注

    39

    文章

    7846

    瀏覽量

    137617
  • gpu
    gpu
    +關(guān)注

    關(guān)注

    28

    文章

    4761

    瀏覽量

    129138

原文標(biāo)題:共耀光芒:Google Gemma 優(yōu)化后可在 NVIDIA GPU 上運(yùn)行

文章出處:【微信號(hào):NVIDIA_China,微信公眾號(hào):NVIDIA英偉達(dá)】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏

    評(píng)論

    相關(guān)推薦

    NVIDIA和GeForce RTX GPU專為AI時(shí)代打造

    NVIDIA 和 GeForce RTX GPU 專為 AI 時(shí)代打造。
    的頭像 發(fā)表于 01-06 10:45 ?163次閱讀

    《CST Studio Suite 2024 GPU加速計(jì)算指南》

    。 2. 操作系統(tǒng)支持:CST Studio Suite在不同操作系統(tǒng)持續(xù)測(cè)試,可在支持的操作系統(tǒng)使用GPU計(jì)算,具體參考相關(guān)文檔。 3. 許可證:
    發(fā)表于 12-16 14:25

    NVIDIA NIM微服務(wù)登陸亞馬遜云科技

    經(jīng)過(guò)優(yōu)化的 NIM 微服務(wù)現(xiàn)可在 Amazon Bedrock Marketplace、SageMaker JumpStart 和 AWS Marketplace 獲取,用于各種 NVIDI
    的頭像 發(fā)表于 12-06 13:33 ?253次閱讀

    如何構(gòu)建及優(yōu)化GPU云網(wǎng)絡(luò)

    并從計(jì)算節(jié)點(diǎn)成本優(yōu)化、集群網(wǎng)絡(luò)與拓?fù)涞倪x擇等方面論述如何構(gòu)建及優(yōu)化GPU云網(wǎng)絡(luò)。
    的頭像 發(fā)表于 11-06 16:03 ?418次閱讀
    如何構(gòu)建及<b class='flag-5'>優(yōu)化</b><b class='flag-5'>GPU</b>云網(wǎng)絡(luò)

    AMD與NVIDIA GPU優(yōu)缺點(diǎn)

    NVIDIA的RTX系列顯卡以其強(qiáng)大的光線追蹤和DLSS技術(shù)領(lǐng)先于市場(chǎng)。例如,NVIDIA的RTX 3080在4K分辨率下提供了卓越的游戲體驗(yàn),而AMD的Radeon RX 6800 XT雖然在某些游戲中表現(xiàn)接近,但在光線追蹤技術(shù)
    的頭像 發(fā)表于 10-27 11:15 ?862次閱讀

    TI TDA2x SoC基于GPU的環(huán)視優(yōu)化

    電子發(fā)燒友網(wǎng)站提供《TI TDA2x SoC基于GPU的環(huán)視優(yōu)化.pdf》資料免費(fèi)下載
    發(fā)表于 10-10 09:14 ?0次下載
    TI TDA2x SoC<b class='flag-5'>上</b>基于<b class='flag-5'>GPU</b>的環(huán)視<b class='flag-5'>優(yōu)化</b>

    Google Gemma 2模型的部署和Fine-Tune演示

    Google 近期發(fā)布了最新開(kāi)放模型 Gemma 2,目前與同等規(guī)模的開(kāi)放模型相比,取得了明顯的優(yōu)勢(shì),同時(shí)在安全可控性上得到了顯著的增強(qiáng)。
    的頭像 發(fā)表于 08-09 17:04 ?588次閱讀
    <b class='flag-5'>Google</b> <b class='flag-5'>Gemma</b> 2模型的部署和Fine-Tune演示

    暴漲預(yù)警!NVIDIA GPU供應(yīng)大跳水

    gpu
    jf_02331860
    發(fā)布于 :2024年07月26日 09:41:42

    英國(guó)公司實(shí)現(xiàn)英偉達(dá)CUDA軟件在AMD GPU的無(wú)縫運(yùn)行

    7月18日最新資訊,英國(guó)創(chuàng)新科技企業(yè)Spectral Compute震撼發(fā)布了其革命性GPGPU編程工具包——“SCALE”,該工具包實(shí)現(xiàn)了英偉達(dá)CUDA軟件在AMD GPU的無(wú)縫遷移與運(yùn)行,標(biāo)志著在
    的頭像 發(fā)表于 07-18 14:40 ?685次閱讀

    使用google-translate和wwe合并無(wú)法使用google-tts怎么解決?

    ,在使用喚醒詞喚醒,我想讓他使用google-tts說(shuō)一句話,但是出現(xiàn)以下錯(cuò)誤Code: Select all I (16188) wwe_example: rec_engine_cb
    發(fā)表于 06-28 06:05

    NVIDIA加速微軟最新的Phi-3 Mini開(kāi)源語(yǔ)言模型

    NVIDIA 宣布使用 NVIDIA TensorRT-LLM 加速微軟最新的 Phi-3 Mini 開(kāi)源語(yǔ)言模型。TensorRT-LLM 是一個(gè)開(kāi)源庫(kù),用于優(yōu)化從 PC 到云端的 NVID
    的頭像 發(fā)表于 04-28 10:36 ?598次閱讀

    NVIDIA全面加快Meta Llama 3的推理速度

    Meta 最新開(kāi)源大語(yǔ)言模型采用 NVIDIA 技術(shù)構(gòu)建,其經(jīng)過(guò)優(yōu)化可在云、數(shù)據(jù)中心、邊緣和 PC 的 NVIDIA
    的頭像 發(fā)表于 04-23 09:52 ?487次閱讀

    利用NVIDIA組件提升GPU推理的吞吐

    本實(shí)踐中,唯品會(huì) AI 平臺(tái)與 NVIDIA 團(tuán)隊(duì)合作,結(jié)合 NVIDIA TensorRT 和 NVIDIA Merlin HierarchicalKV(HKV)將推理的稠密網(wǎng)絡(luò)和熱 Embedding 全置于
    的頭像 發(fā)表于 04-20 09:39 ?777次閱讀

    NVIDIA 發(fā)布全新交換機(jī),全面優(yōu)化萬(wàn)億參數(shù)級(jí) GPU 計(jì)算和 AI 基礎(chǔ)設(shè)施

    NVIDIA Quantum-X800 InfiniBand 網(wǎng)絡(luò),打造性能最強(qiáng)大的 AI 專用基礎(chǔ)設(shè)施 NVIDIA Spectrum-X800 以太網(wǎng)絡(luò),數(shù)據(jù)中心必備的優(yōu)化 AI 網(wǎng)絡(luò)
    發(fā)表于 03-19 10:05 ?376次閱讀
    <b class='flag-5'>NVIDIA</b> 發(fā)布全新交換機(jī),全面<b class='flag-5'>優(yōu)化</b>萬(wàn)億參數(shù)級(jí) <b class='flag-5'>GPU</b> 計(jì)算和 AI 基礎(chǔ)設(shè)施

    TensorRT LLM加速Gemma!NVIDIA與谷歌牽手,RTX助推AI聊天

    NVIDIA今天在其官方博客中表示,今天與谷歌合作,在所有NVIDIA AI平臺(tái)上為Gemma推出了優(yōu)化。
    的頭像 發(fā)表于 02-23 09:42 ?639次閱讀
    TensorRT LLM加速<b class='flag-5'>Gemma</b>!<b class='flag-5'>NVIDIA</b>與谷歌牽手,RTX助推AI聊天