0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

谷歌推出效率與性能躍階的全新開放模型標(biāo)準(zhǔn)

谷歌開發(fā)者 ? 來源:谷歌開發(fā)者 ? 2024-09-09 15:43 ? 次閱讀

作者 /Google DeepMind 研究副總裁 Clement Farabet 和Google DeepMind 總監(jiān) Tris Warkentin

AI 有可能解決人類面臨的一些最緊迫的問題,但前提是每個(gè)人都擁有構(gòu)建 AI 的工具。這就是我們?cè)诮衲暝缧r(shí)候推出 Gemma的原因,Gemma 是一系列輕量級(jí)開放模型系列,采用了與創(chuàng)建 Gemini 模型相同的研究和技術(shù)。我們還陸續(xù)推出了 CodeGemma、RecurrentGemma 和 PaliGemma,以此不斷發(fā)展我們的 Gemma 系列,上述每個(gè)模型都能為不同的 AI 任務(wù)提供獨(dú)特的功能,并且可以通過與 Hugging Face、NVIDIA 和 Ollama 等合作伙伴的集成輕松訪問。

現(xiàn)在,我們正式向全球研究人員和開發(fā)者發(fā)布 Gemma 2。Gemma 2 分為 90 億 (9B) 和 270 億 (27B) 兩種參數(shù)版本,與第一代相比,其性能更強(qiáng)、推理效率更高,并且在安全性方面也有顯著提升。事實(shí)上,作為一種有競(jìng)爭(zhēng)力的替代方案,Gemma 2 27B 的性能可以與規(guī)模是其兩倍的模型相媲美,截至去年 12 月,只有專有模型才能達(dá)到此性能水準(zhǔn)。如今,這可以在單個(gè) NVIDIA H100 Tensor Core GPU 或 TPU 的主機(jī)上實(shí)現(xiàn),從而顯著降低了部署成本。

效率與性能躍階的

全新開放模型標(biāo)準(zhǔn)

我們?cè)谥匦略O(shè)計(jì)的架構(gòu)上構(gòu)建了 Gemma 2,旨在提供卓越的性能和推理效率。以下是它脫穎而出的原因:

非凡性能:Gemma 2 27B 在同類規(guī)模的模型中性能最優(yōu),甚至比其規(guī)模大兩倍以上的模型更具競(jìng)爭(zhēng)力。而 Gemma 2 9B 模型也具有一流的性能,優(yōu)于 Llama 3 8B 以及其他相同規(guī)模類別的開放模型。如需了解詳細(xì)性能分析,請(qǐng)查閱技術(shù)報(bào)告。

立竿見影的降本增效:Gemma 2 27B 模型旨在助您使用單個(gè) Google Cloud TPU 主機(jī)、NVIDIA A100 80GB Tensor Core GPU 或 NVIDIA H100 Tensor Core GPU 以全精度高效運(yùn)行推理,從而顯著降低成本,同時(shí)保持高效性能。這使得 AI 部署更加易于訪問且經(jīng)濟(jì)實(shí)惠。

跨硬件的極速推理:Gemma 2 經(jīng)過優(yōu)化,可以在一系列硬件上以不可思議的速度運(yùn)行,包括強(qiáng)大的游戲本電腦、高端臺(tái)式機(jī)和云端配置等。您可以在 Google AI Studio 中以全精度體驗(yàn) Gemma 2,在 CPU 上使用 Gemma.cpp 量化版本解鎖本地性能,或者通過 Hugging Face Transformer 在配備 NVIDIA RTX 或 GeForce RTX 的家用電腦上試用。

wKgZombeqGGAMx_IAAHxD9e82Fk135.png

專為開發(fā)者和研究人員打造

Gemma 2 不僅功能更強(qiáng)大,并且還能夠更輕松地集成到您的工作流程中:

開放且易于訪問:就像最初的 Gemma 模型一樣,Gemma 2 可在我們商業(yè)友好型的 Gemma 許可下使用,支持開發(fā)者和研究人員分享和商業(yè)化他們的創(chuàng)新成果。

廣泛的框架兼容性:由于 Gemma 2 與 Hugging Face Transformer 等主要 AI 框架兼容,并且通過原生 Keras 3.0、vLLM、Gemma.cpp、Llama.cpp 和 Ollama 兼容 JAX、PyTorch 和 TensorFlow,因此您可以輕松地將其與您偏好的工具和工作流一起使用。此外,我們還通過 NVIDIA TensorRT-LLM 優(yōu)化了 Gemma,支持該模型在 NVIDIA 加速基礎(chǔ)架構(gòu)上運(yùn)行,或作為 NVIDIA NIM 推理微服務(wù)運(yùn)行,并將很快優(yōu)化支持 NVIDIA NeMo。您現(xiàn)在便可以使用 Keras 和 Hugging Face 進(jìn)行微調(diào)。我們正在積極努力,以提供更多參數(shù)高效的微調(diào)選項(xiàng)。

輕松部署:從七月開始,Google Cloud 客戶將能夠在 Vertex AI 上輕松部署和管理 Gemma 2。

探索新的 Gemma 手冊(cè),其中包含一系列實(shí)用示例和指南,幫助您構(gòu)建自己的應(yīng)用并針對(duì)特定任務(wù)微調(diào) Gemma 2 模型。還可了解如何輕松使用您的工具與 Gemma 集成,包括用于如檢索增強(qiáng)生成等常見任務(wù)。

負(fù)責(zé)任的 AI 開發(fā)

我們致力于為開發(fā)者和研究人員提供負(fù)責(zé)任地構(gòu)建和部署 AI 所需的資源,包括使用我們負(fù)責(zé)任的生成式 AI 工具包 (Responsible Generative AI Toolkit)。最近開源的 LLM Comparator 可幫助開發(fā)者和研究人員深入評(píng)估語言模型?,F(xiàn)在,您可以使用配套的 Python 庫對(duì)您的模型和數(shù)據(jù)進(jìn)行比較評(píng)估,并在應(yīng)用中可視化結(jié)果。此外,我們正在積極致力于為 Gemma 模型開源文本水印技術(shù) SynthID。

在訓(xùn)練 Gemma 2 時(shí),我們遵循穩(wěn)健的內(nèi)部安全流程和過濾預(yù)訓(xùn)練數(shù)據(jù),并根據(jù)一套全面的指標(biāo)開展嚴(yán)格的測(cè)試和評(píng)估,以識(shí)別和減輕潛在的偏見和風(fēng)險(xiǎn)。我們?cè)诖罅康呐c安全和代表性危害相關(guān)的公共基準(zhǔn)上發(fā)布我們的結(jié)果。

wKgaombeqJqAJUl_AAMZGB9ABWQ735.png

使用 Gemma 構(gòu)建的項(xiàng)目

我們首次推出 Gemma 時(shí)獲得了超過 1,000 萬次的下載量,并促成了無數(shù)鼓舞人心的項(xiàng)目。例如,Navarasa 利用 Gemma 創(chuàng)建了一個(gè)基于印度語言多樣性的模型。

如今,Gemma 2 將幫助開發(fā)者落地更具雄心的項(xiàng)目,在他們的 AI 創(chuàng)作中釋放全新的性能和潛力。我們將不懈地探索新的架構(gòu),并開發(fā)專門的 Gemma 變體,以應(yīng)對(duì)更廣泛的 AI 任務(wù)和挑戰(zhàn)。這包括即將推出的Gemma 2 2.6B 模型,旨在進(jìn)一步彌合輕量級(jí)可訪問性與強(qiáng)大性能之間的差距。您可以參閱技術(shù)報(bào)告以詳細(xì)了解。

開始構(gòu)建

Gemma 2 現(xiàn)已在 Google AI Studio 中推出,因此您可以在無需硬件要求的情況下測(cè)試 Gemma 2 27B 的全部性能。您還可以從 Kaggle 和 Hugging Face 模型下載 Gemma 2 的模型權(quán)重,Vertex AI Model Garden 中也即將推出。

為了方便研究和開發(fā),您還可通過 Kaggle 或 Colab notebook 免費(fèi)使用 Gemma 2。首次使用 Google Cloud 的用戶可能有資格獲得 300 美元積分。學(xué)術(shù)研究人員可以通過申請(qǐng) Gemma 2 學(xué)術(shù)研究計(jì)劃 (Gemma 2 Academic Research Program)獲取 Google Cloud 積分,從而加速 Gemma 2 的研究。申請(qǐng)現(xiàn)已開放,截止日期為 8 月 9 日。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • Google
    +關(guān)注

    關(guān)注

    5

    文章

    1765

    瀏覽量

    57560
  • AI
    AI
    +關(guān)注

    關(guān)注

    87

    文章

    30947

    瀏覽量

    269217
  • 模型
    +關(guān)注

    關(guān)注

    1

    文章

    3248

    瀏覽量

    48864

原文標(biāo)題:效率與性能提升 | 可供開發(fā)者和研究人員使用的 Gemma 2 現(xiàn)已發(fā)布

文章出處:【微信號(hào):Google_Developers,微信公眾號(hào):谷歌開發(fā)者】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏

    評(píng)論

    相關(guān)推薦

    谷歌全新推出開放式視覺語言模型PaliGemma

    這種熱烈的反響非常鼓舞人心,開發(fā)者們打造了一系列多樣的項(xiàng)目,例如用于印度語言的多語言變體 Navarasa,以及設(shè)備端側(cè)動(dòng)作模型 Octopus v2。開發(fā)者們展示了 Gemma 在打造極具影響力且易于使用的 AI 解決方案方面的巨大潛力。
    的頭像 發(fā)表于 10-15 17:37 ?406次閱讀

    谷歌Gemma 2大語言模型升級(jí)發(fā)布,性能與安全性雙重飛躍

    近日,谷歌面向全球科研界與開發(fā)者群體隆重推出全新升級(jí)的Gemma 2大語言模型,標(biāo)志著人工智能技術(shù)在語言處理領(lǐng)域的又一次重大進(jìn)步。此次發(fā)布的Gemma 2,以其卓越的
    的頭像 發(fā)表于 07-02 10:20 ?504次閱讀

    智譜AI發(fā)布全新多模態(tài)開源模型GLM-4-9B

    近日,智譜AI在人工智能領(lǐng)域取得重大突破,成功推出全新開模型GLM-4-9B。這款模型以其卓越的多模態(tài)能力,再次刷新了業(yè)界對(duì)于大型語言模型
    的頭像 發(fā)表于 06-07 09:17 ?752次閱讀

    谷歌發(fā)布全新AI基礎(chǔ)世界模型Genie

    谷歌近日宣布推出其最新研發(fā)的AI基礎(chǔ)世界模型——Genie。這款模型擁有驚人的110億參數(shù),其獨(dú)特之處在于,僅需一張圖片,便能生成一個(gè)充滿活力和交互性的虛擬世界。用戶可以在這個(gè)世界中逐
    的頭像 發(fā)表于 03-04 14:02 ?763次閱讀

    谷歌模型軟件有哪些功能

    谷歌模型軟件通常指的是谷歌推出的一系列人工智能模型和軟件工具,其中最具代表性的是Google Gemini。Google Gemini是
    的頭像 發(fā)表于 03-01 16:20 ?664次閱讀

    谷歌模型合成軟件有哪些

    谷歌模型合成軟件通常指的是谷歌提供的用于創(chuàng)建、修改和共享3D模型的軟件。目前,谷歌推出
    的頭像 發(fā)表于 02-29 18:20 ?1403次閱讀

    谷歌模型合成工具怎么用

    谷歌模型合成工具主要是指Dreamfusion,這是Google的大型AI圖像模型Imagen與NeRF的3D功能相結(jié)合的一種技術(shù)。Dreamfusion是Dream Fields的演變,Dream Fields是
    的頭像 發(fā)表于 02-29 17:33 ?804次閱讀

    谷歌發(fā)布全新AI模型Genie

    谷歌近日發(fā)布了其全新的AI模型Genie,這一模型徹底改變了我們與數(shù)字世界的互動(dòng)方式。Genie不僅可以接收文本提示、草圖或想法,還能將這些創(chuàng)意迅速轉(zhuǎn)化為一個(gè)可互動(dòng)和玩耍的虛擬世界。
    的頭像 發(fā)表于 02-28 18:25 ?1701次閱讀

    谷歌AI大模型Gemma全球開放使用

    谷歌公司近日宣布,其全新的AI大模型Gemma現(xiàn)已在全球范圍內(nèi)開放使用。這一重要舉措不僅彰顯了谷歌在AI領(lǐng)域的領(lǐng)先地位,還為其在全球范圍內(nèi)的
    的頭像 發(fā)表于 02-28 18:12 ?1155次閱讀

    谷歌交互世界模型重磅發(fā)布

    谷歌模型
    北京中科同志科技股份有限公司
    發(fā)布于 :2024年02月28日 09:13:06

    谷歌宣布Gemma大模型全球開放使用

    谷歌公司近日宣布,其先進(jìn)的AI大模型Gemma即日起在全球范圍內(nèi)開放使用。這一新模型谷歌DeepMind和其他團(tuán)隊(duì)合作開發(fā),并與其最大的A
    的頭像 發(fā)表于 02-23 10:41 ?784次閱讀

    谷歌發(fā)布最先進(jìn)的開放模型Gemma

    和 AlphaCode。今天,我們很高興地介紹 Google 的新一代開放模型,以協(xié)助開發(fā)者和研究人員負(fù)責(zé)任地構(gòu)建 AI。
    的頭像 發(fā)表于 02-23 10:12 ?625次閱讀
    <b class='flag-5'>谷歌</b>發(fā)布最先進(jìn)的<b class='flag-5'>開放</b><b class='flag-5'>模型</b>Gemma

    谷歌發(fā)布全球最強(qiáng)開源大模型Gemma

    谷歌近日宣布,其全新開源大模型Gemma正式亮相。Gemma被譽(yù)為全球性能最強(qiáng)大、同時(shí)也是最輕量級(jí)的模型系列,分為2B(20億參數(shù))和7B(
    的頭像 發(fā)表于 02-22 14:51 ?806次閱讀

    谷歌推出Gemma開放模型,靈感源自Gemini,性能更優(yōu)?

    此款模型支持Keras 3.0、PyTorch等工具進(jìn)行調(diào)試,適用于低性能設(shè)備如筆記本電腦和物聯(lián)網(wǎng),且被譽(yù)為相較同類產(chǎn)品性能更為優(yōu)越,關(guān)鍵基準(zhǔn)測(cè)試結(jié)果顯示其“超出Meta Llama-2模型
    的頭像 發(fā)表于 02-22 10:16 ?484次閱讀

    谷歌推出AI擴(kuò)散模型Lumiere

    近日,谷歌研究院重磅推出全新AI擴(kuò)散模型Lumiere,這款模型基于谷歌自主研發(fā)的“Space-
    的頭像 發(fā)表于 02-04 13:49 ?1043次閱讀