0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內(nèi)不再提示

谷歌推出Gemini 2.0 Flash體驗版

谷歌開發(fā)者 ? 來源:谷歌開發(fā)者 ? 2025-01-06 09:52 ? 次閱讀

作者 / Gemini API 小組產(chǎn)品經(jīng)理 Shrestha Basu Mallick 和 Google Labs 產(chǎn)品總監(jiān) Kathy Korevec

我們正賦予開發(fā)者構(gòu)建 AI 未來的能力,包括尖端模型、智能代碼編寫工具以及跨平臺和設備的無縫集成。自 2023 年 12 月我們推出 Gemini 1.0 以來,數(shù)百萬的開發(fā)者已經(jīng)使用 Google AI Studio 和 Vertex AI 在 109 種語言中使用 Gemini 進行構(gòu)建。

我們推出了 Gemini 2.0 Flash 體驗版,旨在支持更具沉浸感和交互性的應用。同時,我們還推出了能夠代開發(fā)者執(zhí)行任務、優(yōu)化開發(fā)流程的全新編碼智能體。

使用 Gemini 2.0 Flash 進行構(gòu)建

在 Gemini 1.5 Flash 成功的基礎上,F(xiàn)lash 2.0 的速度是 1.5 Pro 的兩倍,具有更優(yōu)越的性能,包括新的多模態(tài)輸出,并支持原生工具使用。我們還推出了 Multimodal Live API,用于構(gòu)建具有實時音頻視頻流的動態(tài)應用。

即日起,開發(fā)者可以通過 Google AI Studio 和 Vertex AI中的 Gemini API,測試和探索實驗階段的 Gemini 2.0 Flash,正式版預計將于 2025 年初全面推出。

借助 Gemini 2.0 Flash,開發(fā)者可以獲得:

1. 更佳性能

Gemini 2.0 Flash 比 1.5 Pro 更強大,同時在速度和效率上依然符合開發(fā)者對 Flash 的期望。它還在關鍵基準測試中展示了更優(yōu)越的多模態(tài)、文本、代碼、視頻、空間理解和推理性能。改進后的空間理解能力能夠在復雜圖像中為小對象生成更精確的邊界框,并實現(xiàn)更好的對象識別和圖像描述。如需了解詳情,您可以觀看空間理解視頻或閱讀 Gemini API 文檔。

2. 新的輸出模式

開發(fā)者將能夠使用 Gemini 2.0 Flash 通過單次 API 調(diào)用,生成包含文本、音頻和圖像的綜合響應。這些新的輸出模態(tài)已提供給早期測試人員使用,預計 2025 年將在更大范圍推廣。所有圖像和音頻輸出都將啟用 SynthID 隱形水印,這有助于減少錯誤信息和錯誤歸因問題。

多語言原生音頻輸出: Gemini 2.0 Flash 具有原生文本轉(zhuǎn)語音的音頻輸出功能,開發(fā)者不僅可以控制模型輸出的內(nèi)容,還可以精細控制說話方式,并提供 8 種高品質(zhì)的聲音以及各種語言和口音選擇。您可以聆聽原生音頻輸出的實際效果,或在開發(fā)者文檔中了解更多信息。

原生圖像輸出: Gemini 2.0 Flash 現(xiàn)在可以生成原生圖像,并支持對話式多輪編輯,因此您可以在此前的輸出基礎上進行構(gòu)建和完善。它可以輸出交錯的文本和圖像,使其在食譜等多模態(tài)內(nèi)容中非常實用。您可以觀看原生圖像輸出視頻以了解更多信息。

3. 原生工具使用

Gemini 2.0 已經(jīng)過訓練,能夠使用工具,這是構(gòu)建智能體體驗的基礎能力。除了通過函數(shù)調(diào)用自定義第三方函數(shù)之外,它還可以原生調(diào)用 Google Search 和代碼執(zhí)行等工具。使用原生 Google Search 作為工具,不僅能提供更真實、更全面的答案,還能為發(fā)行商帶來更多流量。它可以同時運行多項搜索,從多個來源找到更多相關事實并將其組合以提升準確率,從而改進信息檢索效率。您可以在原生工具使用視頻中了解詳情,或從 Notebook 上開始構(gòu)建。

4. Multimodal Live API

開發(fā)者現(xiàn)在可以使用來自攝像頭或屏幕的音頻和視頻流輸入,構(gòu)建實時多模態(tài)應用。同時,應用可以支持諸如中斷和語音活動檢測等自然對話模式。該 API 支持將多個工具集成在一起,通過單個 API 調(diào)用即可完成復雜的用例。您可以在多模態(tài)直播視頻中查看更多內(nèi)容,嘗試使用 Web console或入門代碼 (Python)。

我們很高興看到初創(chuàng)公司在使用 Gemini 2.0 Flash 方面取得了令人矚目的進展,他們正在研發(fā)各種新體驗的原型,例如 tldraw 的視覺游樂場、Viggle 的虛擬角色創(chuàng)建和音頻旁白、Toonsutra 的情景多語言翻譯以及 Rooms 正在實現(xiàn)的實時音頻功能等。

為了加速開發(fā),我們在 Google AI Studio 中發(fā)布了三個入門級應用體驗,并提供了空間理解、視頻分析和 Google 地圖探索的開源代碼,以便您可以開始使用 Gemini 2.0 Flash 進行構(gòu)建。

賦能 AI 代碼輔助的演進

隨著 AI 代碼輔助功能從簡單的代碼搜索迅速發(fā)展到嵌入開發(fā)者工作流程中的 AI 助手,我們希望分享使用 Gemini 2.0 的最新進展: 可以代表您執(zhí)行任務的編碼智能體。 在我們最新的研究中,我們已能夠使用配備代碼執(zhí)行工具的 2.0 Flash,在 SWE-bench Verified 基準測試中達到 51.8% 的成績,該基準測試用于評估智能體在實際軟件工程任務中的表現(xiàn)。Gemini 2.0 Flash 的尖端推理速度使智能體能夠采樣數(shù)百種潛在的解決方案,再根據(jù)現(xiàn)有的單元測試和 Gemini 自身的判斷來選擇最佳解決方案。我們正在將這項研究成果轉(zhuǎn)化為新的開發(fā)者產(chǎn)品。

認識您的 AI 編碼智能體 Jules

想象一下,您的團隊剛剛完成了一次 Bug Bash,現(xiàn)在有一長串的 Bug 等著您解決。現(xiàn)在,您可以將 Python 和 Javascript 編碼任務分配給 Jules,這是一個使用 Gemini 2.0 的實驗性 AI 編碼智能體。Jules 可以異步工作,并與您的 GitHub 工作流程集成,處理 Bug 修復和其他耗時任務,讓您可以專注于真正想要構(gòu)建的內(nèi)容。Jules 會創(chuàng)建全面的多步驟計劃來解決問題,高效地修改多個文件,甚至還會準備拉取請求,以便將修復直接提交回 GitHub。

Jules 還處于早期階段,但根據(jù)我們內(nèi)部使用 Jules 的經(jīng)驗,它可為開發(fā)者提供:

更高的生產(chǎn)力:將問題和編碼任務分配給 Jules,以提高異步編碼效率。

進度跟蹤:通過實時更新,隨時了解情況并優(yōu)先處理需要您關注的任務。

開發(fā)者全面掌控:隨時查看 Jules 制定的方案,并根據(jù)需要提出反饋或進行調(diào)整。輕松審查 Jules 編寫的代碼,并在適當?shù)臅r候?qū)⑵浜喜⒌侥捻椖恐小?/p>

我們目前將 Jules 提供給部分受信任的測試人員,并計劃將于 2025 年初為其他感興趣的開發(fā)者提供該功能。歡迎您在 labs.google.com/jules 上注冊,獲取有關 Jules 的最新進展。

Colab 的數(shù)據(jù)科學智能體

將為您創(chuàng)建 Notebook

在 2024 年的 I/O 大會上,我們在 labs.google/code 上推出了實驗性的數(shù)據(jù)科學智能體,任何用戶都可以上傳數(shù)據(jù)集,并在幾分鐘內(nèi)獲得洞察,所有這些都基于可運行的 Colab Notebook。我們收到了開發(fā)者社區(qū)的積極反饋,并見證了該功能的影響力,這令我們倍感欣喜。例如,在數(shù)據(jù)科學智能體的幫助下,Lawrence Berkeley 國家實驗室研究全球熱帶濕地甲烷排放項目的科學家估計,原本要花一周時間分析和處理的內(nèi)容,現(xiàn)在只需五分鐘。 Colab 已經(jīng)開始使用 Gemini 2.0 整合這些相同的智能體功能。只需用簡單的語言描述您的分析目標,就可以自動生成 Notebook,幫助您提升研究和數(shù)據(jù)分析的能力。開發(fā)者可以通過加入受信任的測試人員計劃來搶先體驗這項新功能,該功能將于 2025 年上半年更廣泛地面向 Colab 用戶推出。

開發(fā)者正在構(gòu)建未來

我們的 Gemini 2.0 模型可以讓您更快、更輕松地構(gòu)建更強大的 AI 應用,讓您可以專注于為用戶打造卓越的體驗。我們將在未來幾個月內(nèi)把 Gemini 2.0 引入 Android Studio、Chrome DevTools 和 Firebase 等平臺。開發(fā)者可以在 Gemini Code Assist中注冊以使用 Gemini 2.0 Flash,從而在 Visual Studio Code、IntelliJ、PyCharm 等流行 IDE 中體驗增強的代碼輔助功能。您可以訪問 ai.google.dev 開始使用,并關注 Google AI for Developers,獲取后續(xù)更新。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • Gemini
    +關注

    關注

    0

    文章

    55

    瀏覽量

    7605
  • API
    API
    +關注

    關注

    2

    文章

    1504

    瀏覽量

    62157
  • AI
    AI
    +關注

    關注

    87

    文章

    31054

    瀏覽量

    269406
  • 開發(fā)者
    +關注

    關注

    1

    文章

    580

    瀏覽量

    17034

原文標題:為開發(fā)者開啟 Gemini 時代新篇章

文章出處:【微信號:Google_Developers,微信公眾號:谷歌開發(fā)者】歡迎添加關注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏

    評論

    相關推薦

    谷歌Gemini 2.0 Flash體驗版發(fā)布

    信息是人類進步的基石。26 年來,我們始終專注于我們的使命——整合全球信息,供大眾使用,讓人人受益。這也是我們持續(xù)拓展人工智能前沿領域的原因。我們整合來自世界各地的信息,并通過多樣化的輸出方式,讓這些信息觸手可及,真正為您所用。
    的頭像 發(fā)表于 12-13 13:52 ?161次閱讀

    谷歌正式發(fā)布Gemini 2.0 性能提升近兩倍

    在智能體時代,谷歌再次引領技術(shù)潮流,正式發(fā)布了其最新力作——Gemini 2.0。這款AI模型不僅在性能上實現(xiàn)了顯著提升,更是在多模態(tài)表現(xiàn)和原生工具應用方面展現(xiàn)了前所未有的強大功能。 Gemi
    的頭像 發(fā)表于 12-12 14:22 ?316次閱讀

    谷歌發(fā)布Gemini 2.0 AI模型

    下文處理技術(shù),能夠更有效地支持用戶在學術(shù)及專業(yè)領域進行深入研究。這一新功能的推出,將為用戶在探索復雜問題時提供更為精準和全面的幫助。 目前,Gemini 2.0 Flash
    的頭像 發(fā)表于 12-12 10:13 ?251次閱讀

    谷歌計劃12月發(fā)布Gemini 2.0模型

    近日,有消息稱谷歌計劃在12月發(fā)布其下一代人工智能模型——Gemini 2.0。這一消息引發(fā)了業(yè)界的廣泛關注,因為谷歌在人工智能領域一直保持著領先地位,而
    的頭像 發(fā)表于 10-29 11:02 ?584次閱讀

    谷歌Gemini 1.5 Flash模型升級,AI聊天速度飆升50%

    谷歌近期對其Gemini AI系列進行了重大更新,推出Gemini 1.5 Flash模型。此次升級的核心亮點在于顯著提升了AI聊天的響應
    的頭像 發(fā)表于 09-06 18:06 ?775次閱讀

    谷歌推出Gemini Live,開啟AI語音聊天新紀元

    在萬眾矚目的Pixel 9系列手機發(fā)布會上,谷歌震撼宣布了一項創(chuàng)新服務——Gemini Live,該服務自今日起,率先向使用英語的Gemini Advanced訂閱用戶敞開大門。這一舉措標志著
    的頭像 發(fā)表于 08-15 17:29 ?730次閱讀

    谷歌Gemini新增旅行規(guī)劃功能,助用戶高效規(guī)劃度假行程

    谷歌方面稱,Gemini可依據(jù)用戶需求,快速挖掘航班時間與酒店預訂詳情,從而迅速制定出適宜的度假方案。谷歌副總裁兼Gemini總經(jīng)理Sissie Hsiao指出,傳統(tǒng)手動規(guī)劃旅行需耗費
    的頭像 發(fā)表于 05-15 11:18 ?401次閱讀

    谷歌Gmail將支持Gemini總結(jié)電子郵件內(nèi)容

    谷歌透露,Gemini 將協(xié)助 Workspace 和 Google One AI Premium 的用戶理解和處理電子郵件內(nèi)容。用戶可通過移動應用和網(wǎng)頁版 Gmail 使用 Gemini
    的頭像 發(fā)表于 05-15 11:11 ?921次閱讀

    蘋果擬將谷歌Gemini大模型植入iPhone

    近日,有消息人士透露,蘋果公司正與谷歌就一項具有里程碑意義的合作展開談判。據(jù)悉,蘋果公司有意將谷歌Gemini人工智能引擎集成至iPhone中,這一舉措將深刻影響人工智能行業(yè)的發(fā)展格局。
    的頭像 發(fā)表于 03-21 13:37 ?517次閱讀

    谷歌計劃重新推出改進后的Gemini AI模型人像生成功能

    谷歌DeepMind的首席執(zhí)行官德米斯·哈薩比斯在2月26日透露,公司計劃在接下來的幾周內(nèi)重新發(fā)布其備受關注的Gemini AI模型人像生成功能。此前,由于在某些歷史圖像生成描述中出現(xiàn)了不準確的問題,谷歌已暫停了這項功能。
    的頭像 發(fā)表于 02-28 10:17 ?614次閱讀

    谷歌推出Gemini for Workspace,提供AI輔助功能,定價信息頗受關注

    谷歌聲稱通過此篇博客文章詳盡地介紹了新的更新。最基礎的“Starter”套餐收費為每個月每人6美元,如果想使用“Gemini擴展”則需額外支付20美元(折合人民幣約為144元)。
    的頭像 發(fā)表于 02-22 10:38 ?723次閱讀

    谷歌推出新一代大模型Gemini 1.5

    近日,谷歌在無預警的情況下發(fā)布了其下一代大模型——Gemini 1.5,這款模型在性能上實現(xiàn)了顯著增強,并在長上下文理解方面取得了令人矚目的突破。更令人驚嘆的是,Gemini 1.5甚至能夠僅憑提示詞學會一門訓練數(shù)據(jù)中沒有的新語
    的頭像 發(fā)表于 02-20 13:55 ?908次閱讀

    谷歌發(fā)布AI新版本Gemini 1.5

    谷歌近日宣布推出其最新的人工智能(AI)版本——Gemini 1.5,這一新版本在文本處理能力上實現(xiàn)了重大突破。據(jù)了解,Gemini 1.5 Pro的上下文窗口長度已經(jīng)擴展到驚人的10
    的頭像 發(fā)表于 02-19 11:05 ?1158次閱讀

    谷歌AI聊天機器人改名為Gemini

    谷歌(Google)近日宣布,旗下備受矚目的AI聊天機器人Bard正式更名為Gemini,并推出了一款功能更加強大的付費版本——Gemini Advanced。這一戰(zhàn)略調(diào)整旨在與微軟、
    的頭像 發(fā)表于 02-18 11:28 ?1130次閱讀

    谷歌最新人工智能模型Gemini Pro已在歐洲上市

    近日,谷歌宣布其最新人工智能模型Gemini Pro已在歐洲市場上市,向歐洲用戶開放。Gemini Pro是谷歌最大的人工智能(AI)模型之一,被視為巴德(Bard)的升級版。
    的頭像 發(fā)表于 02-04 15:10 ?1224次閱讀