作者 / Clement Farabet, VP of Research, Google DeepMind; Tris Warkentin, Director, Google DeepMind
Gemma 開放模型系列是 Google 推動實用 AI 技術(shù)普惠大眾的重要基石。上個月,Gemma 迎來了首個生日。回望過去一年,其成果斐然:全球下載量突破 1 億,社區(qū)欣欣向榮,衍生模型超過 6 萬個1。Gemma 生態(tài)的蓬勃發(fā)展,不斷激發(fā)我們的創(chuàng)新熱情。
Gemma 生態(tài)
我們在全球推出 Gemma 3,一系列基于 Gemini 2.0 模型同源技術(shù)打造的輕量級、先進開放模型。它們是 Google 迄今為止在性能、可移植性和社會責(zé)任方面表現(xiàn)最出色的開放模型。Gemma 3 專為設(shè)備端高效運行而設(shè)計,讓手機、筆記本或工作站都能輕松駕馭,助力開發(fā)者隨心打造 AI 應(yīng)用。Gemma 3 提供 1B、4B、12B 和 27B 等多種規(guī)格,適合不同的硬件和性能需求。
接下來,我們將深入剖析 Gemma 3 的強大之處,為你介紹全新的 ShieldGemma 2,并引導(dǎo)你融入日益壯大的 Gemma 生態(tài)。
Gemma 3 為開發(fā)者解鎖更多創(chuàng)新可能
領(lǐng)先的單加速器模型:Gemma 3 以小巧的體積,實現(xiàn)頂尖的性能。它超越了 Llama-405B、DeepSeek-V3 和 o3-mini,在 LMArena 的初步人類偏好評估中名列前茅,可助力你在單 GPU 或 TPU 環(huán)境下,打造令人驚艷的用戶體驗。
140 種語言,全球暢行:打造能與你的用戶無礙溝通的應(yīng)用。Gemma 3 開箱即支持超過 35 種語言,并針對 140 多種語言進行了預(yù)訓(xùn)練。
強大的文本和視覺推理能力:輕松打造能深度解析圖片、文本和短視頻的應(yīng)用,開啟智能交互的無限潛能。
更大上下文窗口,駕馭復(fù)雜任務(wù):Gemma 3 支持 128k token 的上下文窗口,助力你的應(yīng)用深度理解和處理大量信息。
支持函數(shù)調(diào)用,構(gòu)建智能 AI 工作流:Gemma 3 支持函數(shù)調(diào)用和結(jié)構(gòu)化輸出,助你實現(xiàn)任務(wù)自動化,構(gòu)建智能 "代理"。
量化模型,更快實現(xiàn)卓越性能:Gemma 3 提供官方量化版本,在保證精度的前提下,有效降低模型體積和計算資源消耗。
此圖展示了多款 AI 模型在 Chatbot Arena Elo 評分體系中的排名,分?jǐn)?shù) (頂部數(shù)值) 越高,代表用戶偏好度越高。底部的圓點代表預(yù)估的 NVIDIA H1 00 GPU 需求量。Gemma 3 27B 模型表現(xiàn)優(yōu)異,僅需單個 GPU 即可運行,而其他模型最多需要 32 個。
若想深入了解這些強大功能背后的技術(shù)細(xì)節(jié),以及對我們所用的負(fù)責(zé)任開發(fā)方法的全面解讀,請參閱 Gemma 3 技術(shù)報告。
以嚴(yán)格的安全規(guī)范,負(fù)責(zé)任地打造 Gemma 3
我們堅信,開放模型必須經(jīng)過嚴(yán)密的風(fēng)險評估。我們的策略是在創(chuàng)新與安全之間取得平衡,并依據(jù)模型性能調(diào)整測試力度。Gemma 3 的研發(fā)過程融入了完善的數(shù)據(jù)治理,通過精細(xì)調(diào)校和嚴(yán)謹(jǐn)?shù)幕鶞?zhǔn)測試,確保其與我們的安全準(zhǔn)則高度契合。盡管對更強大模型的深入測試,往往能為我們評估較弱模型提供參考,但鑒于 Gemma 3 在 STEM 領(lǐng)域的顯著提升,我們特別針對其在有害內(nèi)容生成方面的潛在濫用風(fēng)險,進行了專項評估。結(jié)果顯示,該風(fēng)險處于較低水平。
隨著業(yè)界不斷涌現(xiàn)更強大的模型,我們亟需共同探索與風(fēng)險相匹配的安全策略。我們將持續(xù)學(xué)習(xí),并不斷優(yōu)化開放模型的安全實踐。
ShieldGemma 2:圖像應(yīng)用的內(nèi)置安全屏障
在 Gemma 3 發(fā)布之際,我們還同步推出了 ShieldGemma 2,一款基于 Gemma 3 架構(gòu)的強大 4B 圖像安全檢測工具。ShieldGemma 2 提供開箱即用的圖像安全解決方案,針對危險內(nèi)容、色情內(nèi)容和暴力內(nèi)容三大類別,輸出安全標(biāo)簽。開發(fā)者可根據(jù)自身需求和用戶偏好,對 ShieldGemma 進行深度定制。ShieldGemma 2 秉承開放理念,賦予開發(fā)者充分的靈活性和掌控力,并依托 Gemma 3 架構(gòu)的高效性能,推動負(fù)責(zé)任的 AI 開發(fā)。
與你熟悉的工具無縫集成
Gemma 3 和 ShieldGemma 2 能夠無縫集成到你現(xiàn)有的工作流程中:
使用喜愛的工具進行開發(fā):Gemma 3 和 ShieldGemma 2 全面支持 Hugging Face Transformers、Ollama、JAX、Keras、PyTorch、Google AI Edge、UnSloth、vLLM 和 Gemma.cpp,讓你隨心選擇最適合項目需求的開發(fā)工具。
秒速上手,即刻開始試驗:立即體驗 Gemma 3,開啟開發(fā)進程。你可以在 Google AI Studio 中盡情探索其強大功能,或通過 Kaggle 或 Hugging Face 下載模型。
個性定制,滿足獨特需求:Gemma 3 的代碼庫重構(gòu)升級,提供高效微調(diào)和推理的實用方案。你可以在 Google Colab、Vertex AI,甚至游戲顯卡等你偏好的平臺上,對模型進行訓(xùn)練和適配。
靈活部署,方案隨心選擇:Gemma 3 支持多種部署方式,涵蓋 Vertex AI、Cloud Run、Google GenAI API、本地環(huán)境及其他平臺,讓你根據(jù)應(yīng)用和架構(gòu)需求,自由選擇最佳部署方案。
NVIDIA GPU 優(yōu)化,盡享卓越性能:NVIDIA 直接對 Gemma 3 模型進行了深度優(yōu)化,確保你在從 Jetson Nano 到最新 Blackwell 芯片的各類 GPU 上,都能獲得最佳性能。
Gemma 3 現(xiàn)已入駐 NVIDIA API Catalog,只需一次 API 調(diào)用,即可快速構(gòu)建原型。
跨越多種硬件平臺,加速 AI 開發(fā)進程:Gemma 3 不僅針對 Google Cloud TPU 做了深度優(yōu)化,還通過開源 ROCm 堆棧與 AMD GPU 實現(xiàn)了集成。對于 CPU 環(huán)境,Gemma.cpp 提供了直接高效的解決方案。
模型與工具構(gòu)筑的 "Gemma 宇宙"
Gemma 生態(tài)是一個由社區(qū)共建的龐大體系,匯聚了眾多 Gemma 模型與工具,為創(chuàng)新提供源源不斷的動力。例如,AI Singapore 的 SEA-LION v3 致力于消除語言隔閡,促進東南亞地區(qū)的交流;INSAIT 的 BgGPT 是首款以保加利亞語為核心的大語言模型,充分展現(xiàn)了 Gemma 卓越的多語言能力;Nexa AI 的 OmniAudio 則揭示了設(shè)備端 AI 的無限潛力,將先進的音頻處理能力帶入人們的日常生活。
為助力學(xué)術(shù)研究的創(chuàng)新突破,我們正式啟動了 Gemma 3 學(xué)術(shù)計劃。學(xué)術(shù)研究人員可申請價值 1 萬美元的 Google Cloud 抵用金,加速基于 Gemma 3 的研究進程。申請通道即日開啟,持續(xù)四周。歡迎訪問我們的網(wǎng)站提交申請。
即刻開啟 Gemma 3 探索之旅
秉承我們對普及優(yōu)質(zhì) AI 的不懈追求,Gemma 3 應(yīng)運而生,開啟全新篇章。準(zhǔn)備好探索 Gemma 3 的強大功能了嗎?請參考以下入門指南:
去上手探索
通過 Google AI Studio,無需任何設(shè)置,即可在瀏覽器中直接體驗全精度的 Gemma 3。
在 Google AI Studio 中獲取 API 密鑰,然后通過 Google GenAI SDK 輕松調(diào)用 Gemma 3。
https://ai.google.dev/gemini-api/docs/sdks
定制和開發(fā)
從 Hugging Face、Ollama 或 Kaggle 下載 Gemma 3 模型。
利用 Hugging Face 的 Transformers 庫,或使用你偏好的開發(fā)環(huán)境,輕松對模型進行微調(diào)和適配,使其滿足你的獨特需求。
部署和拓展
利用 Vertex AI,將你的 Gemma 3 定制成果大規(guī)模推向商業(yè)應(yīng)用。
使用 Ollama,在 Cloud Run 上進行推理運算。
通過 NVIDIA API Catalog 上手使用 NVIDIA NIM 推理微服務(wù)。
-
Google
+關(guān)注
關(guān)注
5文章
1776瀏覽量
58225 -
AI
+關(guān)注
關(guān)注
87文章
32686瀏覽量
272093 -
模型
+關(guān)注
關(guān)注
1文章
3428瀏覽量
49529
原文標(biāo)題:Gemma 3 發(fā)布:巔峰性能,單 GPU/TPU 即可運行
文章出處:【微信號:Google_Developers,微信公眾號:谷歌開發(fā)者】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
相關(guān)推薦
Banana Pi 發(fā)布 BPI-AI2N & BPI-AI2N Carrier,助力 AI 計算與嵌入式開發(fā)
在龍芯3a6000上部署DeepSeek 和 Gemma2大模型
定制本地的ChatFile的AI問答系統(tǒng)

Google兩款先進生成式AI模型登陸Vertex AI平臺
Google DeepMind發(fā)布Genie 2:打造交互式3D虛擬世界
Google AI Edge Torch的特性詳解

谷歌推出效率與性能躍階的全新開放模型標(biāo)準(zhǔn)

Google Gemma 2模型的部署和Fine-Tune演示

Meta Llama 3.1系列模型可在Google Cloud上使用
ai大模型和傳統(tǒng)ai的區(qū)別在哪?
谷歌Gemma 2大語言模型升級發(fā)布,性能與安全性雙重飛躍
谷歌發(fā)布新型大語言模型Gemma 2
谷歌發(fā)布用于輔助編程的代碼大模型CodeGemma

評論