0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

谷歌全新推出開(kāi)放式視覺(jué)語(yǔ)言模型PaliGemma

谷歌開(kāi)發(fā)者 ? 來(lái)源:谷歌開(kāi)發(fā)者 ? 2024-10-15 17:37 ? 次閱讀

作者 / 產(chǎn)品管理總監(jiān) Tris Warkentin;高級(jí)研究員翟曉華;產(chǎn)品經(jīng)理 Ludovic Peran

在 Google,我們相信合作和開(kāi)放研究能夠推動(dòng)創(chuàng)新。我們非常感謝社區(qū)對(duì) Gemma 的支持,使其自發(fā)布短短幾個(gè)月以來(lái)就獲得了數(shù)百萬(wàn)的下載量。

這種熱烈的反響非常鼓舞人心,開(kāi)發(fā)者們打造了一系列多樣的項(xiàng)目,例如用于印度語(yǔ)言的多語(yǔ)言變體 Navarasa,以及設(shè)備端側(cè)動(dòng)作模型 Octopus v2。開(kāi)發(fā)者們展示了 Gemma 在打造極具影響力且易于使用的 AI 解決方案方面的巨大潛力。

這種探索和創(chuàng)造精神也促使我們開(kāi)發(fā)了 CodeGemma (具有強(qiáng)大的代碼補(bǔ)全和生成能力) 和 RecurrentGemma (在高效推理和研究領(lǐng)域極具潛力)。

Gemma 是先進(jìn)的輕量級(jí)開(kāi)放模型系列,采用了與創(chuàng)建 Gemini 模型相同的研究和技術(shù)。今天,我們非常高興地推出強(qiáng)大的開(kāi)放式視覺(jué)語(yǔ)言模型 (VLM) PaliGemma,進(jìn)一步擴(kuò)展 Gemma 系列。同時(shí)我們將介紹 Gemma 2 的相關(guān)信息,讓您搶先了解即將推出的全新功能。此外,我們通過(guò)更新 Responsible Generative AI 工具包,為開(kāi)發(fā)者提供用于評(píng)估模型安全性和過(guò)濾有害內(nèi)容的全新和增強(qiáng)型工具,進(jìn)一步落實(shí)在負(fù)責(zé)任 AI 方面的承諾。

PaliGemma: 全新推出的

開(kāi)放式視覺(jué)語(yǔ)言模型

PaliGemma 是一個(gè)強(qiáng)大的開(kāi)放式 VLM,其靈感源自 PaLI-3。PaliGemma 基于開(kāi)放式組件 (包括 SigLIP 視覺(jué)模型和 Gemma 語(yǔ)言模型) 構(gòu)建,可在廣泛的視覺(jué)語(yǔ)言任務(wù)中實(shí)現(xiàn)卓越的微調(diào)性能。這包括為圖片和短視頻描述生成、視覺(jué)問(wèn)答、理解圖像中的文本、對(duì)象檢測(cè)和對(duì)象分割。

我們將提供支持多種分辨率且經(jīng)過(guò)預(yù)訓(xùn)練和微調(diào)檢查點(diǎn),以及專(zhuān)門(mén)針對(duì)多種任務(wù)進(jìn)行微調(diào)的檢查點(diǎn),供您立即探索。

為了促進(jìn)開(kāi)放式探索和研究,PaliGemma 可通過(guò)多種平臺(tái)和資源使用。歡迎您立即通過(guò) Kaggle 和 Colab 筆記本等免費(fèi)方式開(kāi)始探索!在視覺(jué)語(yǔ)言研究領(lǐng)域?qū)で笸黄频膶W(xué)術(shù)研究人員還可以申請(qǐng) Google Cloud 積分,更好地開(kāi)展工作。

立即開(kāi)始使用 PaliGemma。您可以在 GitHub、Hugging Face 模型、Kaggle、Vertex AI Model Garden 和 ai.nvidia.com (通過(guò) TensoRT-LLM 加速) 中找到 PaliGemma,并可通過(guò) JAX 和 Hugging Face Transformers 輕松集成該模型。Keras 集成方式即將推出,您還可以通過(guò)此 Hugging Face Space 與該模型交互。

Gemma 2 推出:

性能和效率再上新臺(tái)階

我們非常高興地宣布,新一代 Gemma 模型 Gemma 2 即將發(fā)布。Gemma 2 將提供新的模型大小,以滿足廣泛的 AI 開(kāi)發(fā)者用例的需求;此外,它還將采用全新架構(gòu)來(lái)實(shí)現(xiàn)突破性的性能和效率,帶來(lái)以下優(yōu)勢(shì):

卓越性能: Gemma 2 具有 270 億個(gè)參數(shù),其性能可與 Llama 3 70B 相媲美,但大小卻不到 Llama 3 70B 的一半。這種突破性的效率為開(kāi)放模型領(lǐng)域樹(shù)立了新的標(biāo)桿。

更低部署成本: Gemma 2 采用高效設(shè)計(jì),最低所需的計(jì)算資源不到同級(jí)別模型的一半。27B 模型經(jīng)過(guò)專(zhuān)門(mén)優(yōu)化,可在 NVIDIA 的 GPU 上運(yùn)行,也可在 Vertex AI 中的單個(gè) TPU 主機(jī)上高效運(yùn)行,讓更多的用戶能夠更方便、更經(jīng)濟(jì)高效地部署該模型。

多元化調(diào)優(yōu)工具鏈: Gemma 2 提供多元化的平臺(tái)和工具生態(tài)系統(tǒng),讓開(kāi)發(fā)者可從中選用穩(wěn)健的調(diào)優(yōu)功能。從 Google Cloud 等云端解決方案到 Axolotl 等熱門(mén)社區(qū)工具,豐富多樣的選擇讓微調(diào) Gemma 2 變得更加簡(jiǎn)單。此外,Gemma 2 與 Hugging Face、NVIDIA TensorRT-LLM 等眾多合作伙伴實(shí)現(xiàn)了無(wú)縫整合,同時(shí)還集成了 Google JAX 和 Keras,讓您可以優(yōu)化性能,并在各種硬件配置中實(shí)現(xiàn)高效部署。

擴(kuò)展 Responsible Generative AI 工具包

為了迎接該模型的發(fā)布,我們將開(kāi)源發(fā)布 LLM Comparator 來(lái)擴(kuò)展 Responsible Generative AI 工具包,以便開(kāi)發(fā)者進(jìn)行更穩(wěn)健的模型評(píng)估。LLM Comparator 是一種新的交互式視覺(jué)工具,能夠進(jìn)行有效的并排評(píng)估,以評(píng)估模型響應(yīng)的質(zhì)量和安全性。您可以查看 LLM Comparator 的實(shí)際應(yīng)用演示,了解 Gemma 1.1 和 Gemma 1.0 的對(duì)比情況。

我們希望 LLM Comparator 可以進(jìn)一步推進(jìn)該工具包的使命,助力開(kāi)發(fā)者打造兼具創(chuàng)新性和安全性且負(fù)責(zé)任的 AI 應(yīng)用。

我們將不斷擴(kuò)展 Gemma 開(kāi)放模型系列,并一如既往地營(yíng)造協(xié)作環(huán)境,讓前沿 AI 技術(shù)與負(fù)責(zé)任的開(kāi)發(fā)齊頭并進(jìn)。我們對(duì)您將利用這些新工具打造的應(yīng)用充滿期待,與您共赴 AI 美好未來(lái)!

聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • Google
    +關(guān)注

    關(guān)注

    5

    文章

    1765

    瀏覽量

    57537
  • AI
    AI
    +關(guān)注

    關(guān)注

    87

    文章

    30898

    瀏覽量

    269134
  • 語(yǔ)言模型
    +關(guān)注

    關(guān)注

    0

    文章

    524

    瀏覽量

    10277

原文標(biāo)題:全新推出 PaliGemma、Gemma 2 和升級(jí)擴(kuò)展 Responsible AI 工具包

文章出處:【微信號(hào):Google_Developers,微信公眾號(hào):谷歌開(kāi)發(fā)者】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏

    評(píng)論

    相關(guān)推薦

    NaVILA:加州大學(xué)與英偉達(dá)聯(lián)合發(fā)布新型視覺(jué)語(yǔ)言模型

    日前,加州大學(xué)的研究人員攜手英偉達(dá),共同推出了一款創(chuàng)新的視覺(jué)語(yǔ)言模型——NaVILA。該模型在機(jī)器人導(dǎo)航領(lǐng)域展現(xiàn)出了獨(dú)特的應(yīng)用潛力,為智能機(jī)
    的頭像 發(fā)表于 12-13 10:51 ?261次閱讀

    谷歌推出效率與性能躍階的全新開(kāi)放模型標(biāo)準(zhǔn)

    AI 有可能解決人類(lèi)面臨的一些最緊迫的問(wèn)題,但前提是每個(gè)人都擁有構(gòu)建 AI 的工具。這就是我們?cè)诮衲暝缧r(shí)候推出 Gemma 的原因,Gemma 是一系列輕量級(jí)開(kāi)放模型系列,采用了與創(chuàng)建
    的頭像 發(fā)表于 09-09 15:43 ?380次閱讀
    <b class='flag-5'>谷歌</b><b class='flag-5'>推出</b>效率與性能躍階的<b class='flag-5'>全新開(kāi)放</b><b class='flag-5'>模型</b>標(biāo)準(zhǔn)

    紫光同芯推出開(kāi)放式架構(gòu)安全芯片E450R

    2024紫光同芯合作伙伴大會(huì)在北京璀璨啟幕,會(huì)上紫光同芯震撼發(fā)布了其最新技術(shù)結(jié)晶——全球首顆融合開(kāi)放式硬件與軟件架構(gòu)的安全芯片E450R。這款芯片以其獨(dú)特的雙開(kāi)放設(shè)計(jì),即開(kāi)放式硬件架構(gòu)搭配開(kāi)放
    的頭像 發(fā)表于 08-28 16:28 ?622次閱讀

    機(jī)器視覺(jué)運(yùn)動(dòng)控制一體機(jī)VPLC532E在汽車(chē)膠帶纏繞的開(kāi)放式CNC應(yīng)用

    機(jī)器視覺(jué)運(yùn)動(dòng)控制一體機(jī)VPLC532E在汽車(chē)膠帶纏繞的開(kāi)放式CNC應(yīng)用
    的頭像 發(fā)表于 08-19 10:03 ?334次閱讀
    機(jī)器<b class='flag-5'>視覺(jué)</b>運(yùn)動(dòng)控制一體機(jī)VPLC532E在汽車(chē)膠帶纏繞的<b class='flag-5'>開(kāi)放式</b>CNC應(yīng)用

    NVIDIA與Google DeepMind合作推動(dòng)大語(yǔ)言模型創(chuàng)新

    支持 NVIDIA NIM 推理微服務(wù)的谷歌最新開(kāi)源模型 PaliGemma 首次亮相。
    的頭像 發(fā)表于 05-16 09:44 ?452次閱讀

    微軟準(zhǔn)備推出全新人工智能語(yǔ)言模型

    微軟近期傳出消息,正在秘密研發(fā)一款全新的人工智能語(yǔ)言模型,這款模型在規(guī)模上預(yù)計(jì)將具備與谷歌和OpenAI等業(yè)界巨頭相抗衡的實(shí)力。據(jù)悉,這款新
    的頭像 發(fā)表于 05-08 09:30 ?427次閱讀

    【大語(yǔ)言模型:原理與工程實(shí)踐】大語(yǔ)言模型的基礎(chǔ)技術(shù)

    下游任務(wù)提供豐富的文本表示,如谷歌公司推出的BERT。(2) Decoder-Only 預(yù)訓(xùn)練語(yǔ)言模型:這類(lèi)模型一般使用單向的 Decode
    發(fā)表于 05-05 12:17

    PLC以太網(wǎng)開(kāi)放式通信概述

    以太網(wǎng)開(kāi)放式通信概述:   1、以太網(wǎng)開(kāi)放式通信,即就是通信協(xié)議是由用戶自由定義的;   2、以太網(wǎng)開(kāi)放式通信是基于TCP、UDP運(yùn)輸層的一種軟件通信協(xié)議;   3、各個(gè)PLC可使
    發(fā)表于 04-16 12:06 ?1072次閱讀
    PLC以太網(wǎng)<b class='flag-5'>開(kāi)放式</b>通信概述

    小米新款開(kāi)放式耳機(jī)引領(lǐng)舒適潮流

    IDC報(bào)告指出,用戶對(duì)舒適度的追求推動(dòng)了開(kāi)放式耳機(jī)市場(chǎng)快速發(fā)展。今年,開(kāi)放式耳機(jī)銷(xiāo)量達(dá)652萬(wàn)臺(tái),同比增長(zhǎng)130.2%。這對(duì)于真無(wú)線及頸戴耳機(jī)領(lǐng)域具有一定的分流影響,并折射出用戶需求的轉(zhuǎn)變和技術(shù)創(chuàng)新帶來(lái)的發(fā)展空間。
    的頭像 發(fā)表于 04-08 10:09 ?1205次閱讀

    Bose推出全新Ultra開(kāi)放式耳機(jī),搭載第二代高通S5音頻平臺(tái)

    全球知名音頻品牌Bose近日宣布推出全新音頻可穿戴設(shè)備——Bose Ultra開(kāi)放式耳機(jī)。這款耳機(jī)采用第二代高通?S5音頻平臺(tái),并支持Snapdragon Sound驍龍暢聽(tīng)技術(shù),旨在為用戶帶來(lái)無(wú)與倫比的高清音頻體驗(yàn)、快速穩(wěn)健
    的頭像 發(fā)表于 03-11 10:30 ?1142次閱讀

    魅族推出全新開(kāi)放式AI終端魅族21 PRO

    近日,星紀(jì)魅族正式發(fā)布了備受矚目的魅族21 PRO開(kāi)放式AI終端。這款手機(jī)不僅標(biāo)志著魅族在智能手機(jī)時(shí)代的圓滿落幕,更是魅族邁向AI時(shí)代的重要里程碑。
    的頭像 發(fā)表于 03-04 11:01 ?888次閱讀

    谷歌模型軟件有哪些功能

    谷歌模型軟件通常指的是谷歌推出的一系列人工智能模型和軟件工具,其中最具代表性的是Google Gemini。Google Gemini是
    的頭像 發(fā)表于 03-01 16:20 ?657次閱讀

    谷歌AI大模型Gemma全球開(kāi)放使用

    谷歌公司近日宣布,其全新的AI大模型Gemma現(xiàn)已在全球范圍內(nèi)開(kāi)放使用。這一重要舉措不僅彰顯了谷歌在AI領(lǐng)域的領(lǐng)先地位,還為其在全球范圍內(nèi)的
    的頭像 發(fā)表于 02-28 18:12 ?1151次閱讀

    谷歌宣布Gemma大模型全球開(kāi)放使用

    谷歌公司近日宣布,其先進(jìn)的AI大模型Gemma即日起在全球范圍內(nèi)開(kāi)放使用。這一新模型谷歌DeepMind和其他團(tuán)隊(duì)合作開(kāi)發(fā),并與其最大的A
    的頭像 發(fā)表于 02-23 10:41 ?781次閱讀

    谷歌推出AI擴(kuò)散模型Lumiere

    近日,谷歌研究院重磅推出全新AI擴(kuò)散模型Lumiere,這款模型基于谷歌自主研發(fā)的“Space-
    的頭像 發(fā)表于 02-04 13:49 ?1039次閱讀