精品国产AV色欲果冻传媒,99精品66AV99精品

Google Gemma優(yōu)化后可在NVIDIA GPU上運(yùn)行

借助 TensorRT-LLM，Google 全新開(kāi)放語(yǔ)言模型可在 NVIDIA AI 平臺(tái)（包括本地 RTX AI PC）上加速運(yùn)行。

2024 年 2 月 21 日，NVIDIA 攜手 Google 在所有 NVIDIA AI 平臺(tái)上發(fā)布面向 Gemma 的優(yōu)化功能，Gemma 是 Google 最先進(jìn)的新型輕量級(jí) 2B 和 7B 開(kāi)放語(yǔ)言模型，可在任何地方運(yùn)行，從而降低成本并加快特定領(lǐng)域用戶案例的創(chuàng)新工作。

NVIDIA 和 Google 的團(tuán)隊(duì)緊密合作，利用 NVIDIA TensorRT-LLM（用于優(yōu)化大語(yǔ)言模型推理性能的開(kāi)源庫(kù)），在數(shù)據(jù)中心的 NVIDIA GPU、云計(jì)算和搭載 NVIDIA RTX GPU 的 PC 上運(yùn)行時(shí)，加速 Gemma 性能（Gemma 由創(chuàng)建 Gemini 模型的相同研究和技術(shù)構(gòu)建）。

這使開(kāi)發(fā)者能將全球高性能 AI PC 中超過(guò) 1 億臺(tái)搭載 NVIDIA RTX GPU 的用戶作為潛在用戶進(jìn)行開(kāi)發(fā)。

開(kāi)發(fā)者還可在搭載 NVIDIA GPU 的云端運(yùn)行 Gemma，該實(shí)例擁有 141GB HBM3e 顯存，速度為 4.8TB/秒，Google 將于今年部署該實(shí)例。

此外，企業(yè)級(jí)開(kāi)發(fā)者還可利用 NVIDIA 豐富的工具生態(tài)系統(tǒng)（包括依托 NeMo 框架的 NVIDIA AI Enterprise 和 TensorRT-LLM），對(duì) Gemma 進(jìn)行微調(diào)，并將優(yōu)化后的模型部署到生產(chǎn)應(yīng)用中。

審核編輯：劉清

聲明：本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人，不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用，如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題，請(qǐng)聯(lián)系本站處理。舉報(bào)投訴

NVIDIA

NVIDIA

+關(guān)注

關(guān)注
14

文章
5055

瀏覽量
103372
云計(jì)算

云計(jì)算

+關(guān)注

關(guān)注
39

文章
7846

瀏覽量
137617
gpu

gpu

+關(guān)注

關(guān)注
28

文章
4761

瀏覽量
129138

原文標(biāo)題：共耀光芒：Google Gemma 優(yōu)化后可在 NVIDIA GPU 上運(yùn)行

文章出處：【微信號(hào)：NVIDIA_China，微信公眾號(hào)：NVIDIA英偉達(dá)】歡迎添加關(guān)注！文章轉(zhuǎn)載請(qǐng)注明出處。

評(píng)論

相關(guān)推薦

NVIDIA和GeForce RTX GPU專為AI時(shí)代打造

NVIDIA 和 GeForce RTX GPU 專為 AI 時(shí)代打造。

發(fā)表于 01-06 10:45 ?163次閱讀

《CST Studio Suite 2024 GPU加速計(jì)算指南》

。 2. 操作系統(tǒng)支持：CST Studio Suite在不同操作系統(tǒng)上持續(xù)測(cè)試，可在支持的操作系統(tǒng)上使用GPU計(jì)算，具體參考相關(guān)文檔。 3. 許可證：

發(fā)表于 12-16 14:25

NVIDIA NIM微服務(wù)登陸亞馬遜云科技

經(jīng)過(guò)優(yōu)化的 NIM 微服務(wù)現(xiàn)可在 Amazon Bedrock Marketplace、SageMaker JumpStart 和 AWS Marketplace 上獲取，用于各種 NVIDI

發(fā)表于 12-06 13:33 ?253次閱讀

如何構(gòu)建及優(yōu)化GPU云網(wǎng)絡(luò)

并從計(jì)算節(jié)點(diǎn)成本優(yōu)化、集群網(wǎng)絡(luò)與拓?fù)涞倪x擇等方面論述如何構(gòu)建及優(yōu)化GPU云網(wǎng)絡(luò)。

發(fā)表于 11-06 16:03 ?418次閱讀

AMD與NVIDIA GPU優(yōu)缺點(diǎn)

，NVIDIA的RTX系列顯卡以其強(qiáng)大的光線追蹤和DLSS技術(shù)領(lǐng)先于市場(chǎng)。例如，NVIDIA的RTX 3080在4K分辨率下提供了卓越的游戲體驗(yàn)，而AMD的Radeon RX 6800 XT雖然在某些游戲中表現(xiàn)接近，但在光線追蹤技術(shù)上

發(fā)表于 10-27 11:15 ?862次閱讀

TI TDA2x SoC上基于GPU的環(huán)視優(yōu)化

電子發(fā)燒友網(wǎng)站提供《TI TDA2x SoC上基于GPU的環(huán)視優(yōu)化.pdf》資料免費(fèi)下載

發(fā)表于 10-10 09:14 ?0次下載

Google Gemma 2模型的部署和Fine-Tune演示

Google 近期發(fā)布了最新開(kāi)放模型 Gemma 2，目前與同等規(guī)模的開(kāi)放模型相比，取得了明顯的優(yōu)勢(shì)，同時(shí)在安全可控性上得到了顯著的增強(qiáng)。

發(fā)表于 08-09 17:04 ?588次閱讀

暴漲預(yù)警！NVIDIA GPU供應(yīng)大跳水

gpu

jf_02331860
發(fā)布于 :2024年07月26日 09:41:42

英國(guó)公司實(shí)現(xiàn)英偉達(dá)CUDA軟件在AMD GPU上的無(wú)縫運(yùn)行

7月18日最新資訊，英國(guó)創(chuàng)新科技企業(yè)Spectral Compute震撼發(fā)布了其革命性GPGPU編程工具包——“SCALE”，該工具包實(shí)現(xiàn)了英偉達(dá)CUDA軟件在AMD GPU上的無(wú)縫遷移與運(yùn)行，標(biāo)志著在

發(fā)表于 07-18 14:40 ?685次閱讀

使用google-translate和wwe合并后無(wú)法使用google-tts怎么解決？

，在使用喚醒詞喚醒后，我想讓他使用google-tts說(shuō)一句話，但是出現(xiàn)以下錯(cuò)誤Code: Select all I (16188) wwe_example: rec_engine_cb

發(fā)表于 06-28 06:05

NVIDIA加速微軟最新的Phi-3 Mini開(kāi)源語(yǔ)言模型

NVIDIA 宣布使用 NVIDIA TensorRT-LLM 加速微軟最新的 Phi-3 Mini 開(kāi)源語(yǔ)言模型。TensorRT-LLM 是一個(gè)開(kāi)源庫(kù)，用于優(yōu)化從 PC 到云端的 NVID

發(fā)表于 04-28 10:36 ?598次閱讀

NVIDIA全面加快Meta Llama 3的推理速度

Meta 最新開(kāi)源大語(yǔ)言模型采用 NVIDIA 技術(shù)構(gòu)建，其經(jīng)過(guò)優(yōu)化后可在云、數(shù)據(jù)中心、邊緣和 PC 的 NVIDIA

發(fā)表于 04-23 09:52 ?487次閱讀

利用NVIDIA組件提升GPU推理的吞吐

本實(shí)踐中，唯品會(huì) AI 平臺(tái)與 NVIDIA 團(tuán)隊(duì)合作，結(jié)合 NVIDIA TensorRT 和 NVIDIA Merlin HierarchicalKV（HKV）將推理的稠密網(wǎng)絡(luò)和熱 Embedding 全置于

發(fā)表于 04-20 09:39 ?777次閱讀

NVIDIA 發(fā)布全新交換機(jī)，全面優(yōu)化萬(wàn)億參數(shù)級(jí) GPU 計(jì)算和 AI 基礎(chǔ)設(shè)施

NVIDIA Quantum-X800 InfiniBand 網(wǎng)絡(luò)，打造性能最強(qiáng)大的 AI 專用基礎(chǔ)設(shè)施 NVIDIA Spectrum-X800 以太網(wǎng)絡(luò)，數(shù)據(jù)中心必備的優(yōu)化 AI 網(wǎng)絡(luò)

發(fā)表于 03-19 10:05 ?376次閱讀

TensorRT LLM加速Gemma！NVIDIA與谷歌牽手，RTX助推AI聊天

NVIDIA今天在其官方博客中表示，今天與谷歌合作，在所有NVIDIA AI平臺(tái)上為Gemma推出了優(yōu)化。

發(fā)表于 02-23 09:42 ?639次閱讀