0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

谷歌Gemini 2.0 Flash體驗版發(fā)布

谷歌開發(fā)者 ? 來源:谷歌黑板報 ? 2024-12-13 13:52 ? 次閱讀

信息是人類進步的基石。26 年來,我們始終專注于我們的使命——整合全球信息,供大眾使用,讓人人受益。這也是我們持續(xù)拓展人工智能前沿領(lǐng)域的原因。我們整合來自世界各地的信息,并通過多樣化的輸出方式,讓這些信息觸手可及,真正為您所用。

正是基于這個愿景,我們在去年年底推出了 Gemini 1.0。作為首個原生多模態(tài)模型,Gemini 1.0 和 1.5 在多模態(tài)和長上下文處理方面取得了重大進展,能夠理解跨越文本、視頻、圖像、音頻和代碼等多種形式的信息,并處理更為龐大的信息。

現(xiàn)在,數(shù)百萬開發(fā)者正在基于 Gemini 進行開發(fā)。Gemini 也正在幫助我們自己重新構(gòu)想所有的產(chǎn)品——包括我們擁有 20 億用戶的 7 款產(chǎn)品——并打造新的產(chǎn)品。NotebookLM 就是個很好的例子,它展示了多模態(tài)和長上下文能夠為人們帶來什么,以及為什么如此受大家喜愛。

在過去一年里,我們在持續(xù)開發(fā)更多智能體模型,這也意味著它們可以更好地理解周圍的世界,提前思考多個步驟,并在您的監(jiān)督下代表您行動。

今天,我們很高興推出了為新智能體時代構(gòu)建的下一代模型: Gemini 2.0,這是我們迄今為止最強大的模型。憑借在多模態(tài)方面的新進展——例如原生圖像和原生音頻的輸出以及原生工具使用——Gemini 2.0 使我們能夠構(gòu)建新的 AI 智能體,從而讓我們離構(gòu)建通用助手的愿景更進一步。

今天,我們將 2.0 開放給開發(fā)者以及受信任的測試人員。我們也正在積極推進將其整合到我們的產(chǎn)品中,率先從 Gemini 和 Search 開始。從今天開始,Gemini 2.0 Flash 體驗版模型將對所有 Gemini 用戶開放。同時,我們還推出了 Deep Research 的新功能,它運用高級推理和長上下文處理能力,承擔研究助手的角色,幫助您探索復(fù)雜的主題并撰寫報告。該功能自今日起對 Gemini Advanced 用戶開放。

Search 無疑是受到人工智能影響最深遠、變革最顯著的產(chǎn)品。如今,AI Overviews 已觸達 10 億用戶,該功能使用戶能夠提出全新的問題類型,迅速成為 Search 有史以來最受歡迎的功能之一。接下來,我們會將 Gemini 2.0 的高級推理能力融入 AI Overviews,以攻克更復(fù)雜的主題和多步驟問題,包括高等數(shù)學方程、多模態(tài)查詢和編碼。我們本周已經(jīng)在小范圍進行了測試,并計劃于明年年初在更大范圍推出。同時,我們還計劃明年將 AI Overviews 功能面向更多國家開放,適配更多語言。

2.0 的進展得益于我們所特有的長達 10 年全棧式 AI 創(chuàng)新研究的投入。它基于我們定制的硬件第六代 TPU Trillium 構(gòu)建而成。TPU 為 Gemini 2.0 的訓練和推理提供 100% 算力支持,今天 Trillium 也全面向用戶開放,以便他們能夠基于此進行開發(fā)。

如果說 Gemini 1.0 是整合和理解信息,那么 Gemini 2.0 能夠讓信息更加有用。我非常期待 Gemini 2.0 時代的無限可能!

作者:

Demis Hassabis,Google DeepMind CEO

Koray Kavukcuoglu,Google DeepMind CTO

代表 Gemini 團隊

在過去一年中,我們在人工智能領(lǐng)域取得了巨大進步。今天,我們發(fā)布 Gemini 2.0 系列模型中的第一個模型: Gemini 2.0 Flash 的體驗版。這是我們的主力模型,具有低延遲特性,而且在我們大規(guī)模技術(shù)前沿中展現(xiàn)了卓越的性能。 同時,我們還通過展示基于 Gemini 2.0 原生多模態(tài)功能的原型來分享我們關(guān)于智能體的前沿研究。

Gemini 2.0 Flash

Gemini 2.0 Flash 是建立在 1.5 Flash 的成功基礎(chǔ)之上,而 1.5 Flash 是我們迄今為止最受開發(fā)者歡迎的版本。與 1.5 Flash 相比,Gemini 2.0 Flash 在同樣快速的響應(yīng)時間下性能進一步增強。值得一提的是,2.0 Flash 在關(guān)鍵基準測試中甚至超越了 1.5 Pro,其速度是 1.5 Pro 的兩倍。同時 2.0 Flash 還具有新功能,除了能夠支持圖片、視頻和音頻等多模態(tài)輸入,2.0 Flash 現(xiàn)在還可以支持多模態(tài)輸出,例如可以直接生成圖像與文本混合的內(nèi)容,以及原生生成可控的多語言文本轉(zhuǎn)語音 (TTS) 音頻。它還可以原生調(diào)用 Google Search、代碼執(zhí)行以及第三方用戶定義的函數(shù)等工具。

我們的目標是讓人們能夠更安全、快速地使用我們的模型。在過去一個月,我們分享了 Gemini 2.0 的早期體驗版,并得到了開發(fā)者的積極反饋。 作為提供給開發(fā)者的體驗版模型,Gemini 2.0 Flash 現(xiàn)在可以通過 Google AI Studio 和 Vertex AI 中的 Gemini API 獲取,所有開發(fā)者均可使用多模態(tài)輸入和文本輸出,搶先體驗的合作伙伴可使用原生文本轉(zhuǎn)語音和圖像生成功能。該產(chǎn)品將于 1 月份全面上市,屆時將推出更多型號。 為了幫助開發(fā)者構(gòu)建動態(tài)和交互式應(yīng)用程序,我們還發(fā)布了新的 Multimodal Live API,它具有實時音頻、視頻流輸入以及使用多個組合工具的能力。有關(guān) 2.0 Flash 和 Multimodal Live API 的更多信息,請參閱我們的開發(fā)者博客。

Gemini 2.0 應(yīng)用于

我們 AI 助手 Gemini app

同樣從今天開始,全球的 Gemini 用戶可以通過在電腦端和移動端網(wǎng)頁的模型下拉菜單中進行選擇,來開啟基于 2.0 Flash 體驗版優(yōu)化后的聊天對話,并且該版本將很快在 Gemini 移動應(yīng)用中推出。同時,基于這個新模型,用戶還可以體驗到更加有用的 Gemini 助手。

明年初,我們還會將 Gemini 2.0 擴展到更多 Google 產(chǎn)品中。

解鎖 Gemini 2.0 智能互動新體驗

Gemini 2.0 Flash 的原生用戶界面操作能力,以及多模態(tài)推理、長文本理解、復(fù)雜指令跟隨和規(guī)劃能力、組合函數(shù)的調(diào)用,原生工具使用以及延遲優(yōu)化等一系列優(yōu)化改進,共同促進了全新的、更智能化的交互體驗。

AI 智能體在現(xiàn)實中的應(yīng)用是一個令人振奮且充滿可能性的研究領(lǐng)域。我們正在探索這個全新的領(lǐng)域,開發(fā)出了一系列原型,這些原型能夠幫助人們完成任務(wù),達成相應(yīng)的目標。其中包括:

Project Astra 的升級版,用于探索未來通用 AI 助手能力的研究原型;

全新的 Project Mariner,從瀏覽器入手,探索人與智能體交互的未來發(fā)展;

Jules,能夠幫助開發(fā)者的 AI 驅(qū)動的編碼智能體。

目前,我們?nèi)蕴幱陂_發(fā)初期,但我們非常期待看到受信任的測試人員來使用這些新功能,并從他們的反饋中汲取經(jīng)驗,不斷完善,進而幫助我們在未來將新功能應(yīng)用到更廣泛的產(chǎn)品中。

Project Astra:使用多模態(tài)理解現(xiàn)實世界的智能體

自從在 Google I/O 大會上推出 Project Astra 以來,我們一直向那些在 Android 手機上使用它的受信任的測試人員收集反饋。這些大量且寶貴的意見幫助我們更深入地理解通用 AI 助手在現(xiàn)實應(yīng)用中的表現(xiàn),包括在安全和倫理方面可能面臨的挑戰(zhàn)?;?Gemini 2.0 版本,我們在以下方面進行了改進:

更流暢的對話:Project Astra 現(xiàn)在可以在多種語言和混合語言之間進行對話,并且能夠更好地理解不同口音和生僻單詞。

新工具的使用:借助 Gemini 2.0,Project Astra 可以使用 Google Search、Google Lens 和 Google Maps,從而在日常生活中更好地發(fā)揮助手作用。

更強的記憶力:我們增強了 Project Astra 的記憶能力,同時確保你可以掌控對話?,F(xiàn)在,它最多可以記住長達 10 分鐘的會話內(nèi)容,并且可以回憶起過去與它進行的更多對話,以便為您提供更好的個性化服務(wù)。

更低的延遲:借助新的流式處理技術(shù)和原生音頻理解能力,該智能體能夠以近于人類對話的延遲來理解語言。

我們正在將這些功能應(yīng)用于 Google 的產(chǎn)品中,例如我們的 AI 助手 Gemini app 以及智能眼鏡等其他設(shè)備。除此之外,我們將逐步擴大受信任的測試群體范圍,其中的一小部分受信任的測試人員將很快能夠開始測試 Project Astra 在原型智能眼鏡上的表現(xiàn)。

Project Mariner: 幫您完成

復(fù)雜任務(wù)的智能體

Project Mariner 是使用 Gemini 2.0 構(gòu)建的早期研究原型,旨在從您的瀏覽器開始,探索人機交互的未來。作為研究原型,它能夠理解和推理瀏覽器頁面中的信息,包括像素和文本、代碼、圖像和表單等網(wǎng)頁元素,然后通過實驗性的 Chrome 擴展程序使用這些信息為您完成任務(wù)。 在 WebVoyager 基準測試 (該測試針對智能體在端到端的真實世界網(wǎng)頁任務(wù)的性能) 中,Project Mariner 作為單個智能體設(shè)置實現(xiàn)了 83.5% 的工作效率,達到了最先進的水平。 雖然目前 Project Mariner 的運行并非總是準確,且完成任務(wù)的速度較慢,但它仍處于早期階段,并且隨著時間的推移將迅速改善。 為了安全、負責任地構(gòu)建這一系統(tǒng),我們正在積極研究新型風險和應(yīng)對措施,始終保持有人類的參與和監(jiān)督。例如,Project Mariner 只能在瀏覽器上的活動標簽頁中鍵入、滾動或單擊,而它在采取某些敏感操作 (如購買某物) 之前,會要求用戶進行最終確認。 受信任的測試人員現(xiàn)在正開始使用實驗性的 Chrome 擴展程序測試 Project Mariner,同時,我們正與網(wǎng)絡(luò)生態(tài)系統(tǒng)展開合作。

Jules: 面向開發(fā)者的智能體

接下來,我們會探索人工智能智能體如何通過 Jules (一種實驗性的 AI 代碼智能體,它可以直接集成到 GitHub 工作流程中) 來協(xié)助開發(fā)者。它可以解決問題、制定并執(zhí)行計劃,所有這些都在開發(fā)者指導和監(jiān)督下進行。這項工作是我們長期目標的一部分,即構(gòu)建可在所有領(lǐng)域 (包括編碼) 中提供幫助的 AI 智能體。 關(guān)于此實驗的更多信息,請參閱我們的開發(fā)者博客文章。

游戲和其他領(lǐng)域的智能體

Google DeepMind 一直以來都在利用游戲來幫助人工智能模型更好地遵守規(guī)則,進行規(guī)劃,并運用邏輯思維。比如就在上周,我們推出了 Genie 2,這是一個可以從單個圖像創(chuàng)建無限多種可玩 3D 世界的 AI 模型?;谶@一傳統(tǒng),我們使用 Gemini 2.0 構(gòu)建了智能體,它們可以幫助您在電子游戲中做出更明智的決策。這些智能體可以根據(jù)屏幕上的實時畫面,分析游戲情況,并為您提供下一步行動建議。 我們正在與 Supercell 等頂尖的游戲開發(fā)團隊合作,探索智能體在游戲領(lǐng)域的應(yīng)用。我們通過測試它們在《部落沖突》、《海島奇兵》等各種游戲中的表現(xiàn),來評估它們理解游戲規(guī)則、應(yīng)對挑戰(zhàn)的能力。 除了做虛擬游戲伙伴之外,這些智能體還可以通過 Google Search 讓您接觸到豐富的游戲相關(guān)的知識。 除了探索虛擬世界的智能體能力外,我們還將 Gemini 2.0 的空間推理能力應(yīng)用于機器人領(lǐng)域,嘗試讓智能體在現(xiàn)實世界中提供幫助。雖然這項研究仍處于初期階段,但我們對智能體在現(xiàn)實環(huán)境中的應(yīng)用前景感到非常興奮。 關(guān)于這些研究原型和實驗的更多信息,請您查閱 labs.google。

在智能體時代負責任地進行構(gòu)建

通過 Gemini 2.0 Flash 和我們的研究原型,我們能夠不斷測試和迭代 AI 研究的前沿新功能,這些新功能最終將提升 Google 產(chǎn)品的實用性。 在開發(fā)這些新技術(shù)的同時,我們深知其所帶來的責任,也意識到 AI 智能體在安全方面可能引發(fā)的諸多問題。正因如此,我們采取探索性和漸進式的開發(fā)方式。我們對多個原型進行深入研究,不斷迭代地實施安全培訓,與受信任的測試人員和外部專家合作,并進行全面的風險評估和安全性測評。

例如

作為我們安全管理流程的一部分,我們一直與內(nèi)部審查小組,責任與安全委員會 (RSC) 積極合作,以識別和評估潛在風險。

借助 Gemini 2.0 強大的推理能力,我們在 AI 輔助的紅隊測試中取得了重大進展。除了能檢測潛在風險,還能夠自動生成評估報告和訓練數(shù)據(jù)來幫助我們減少風險,從而讓我們可以更有效地大規(guī)模優(yōu)化模型,提升安全性。

隨著 Gemini 2.0 多模態(tài)能力的增強,潛在輸出的復(fù)雜性也隨之增加。為了應(yīng)對這種復(fù)雜性,我們將持續(xù)評估和訓練模型處理圖像和音頻的輸入輸出,提升模型的安全性。

通過 Project Astra,我們正在積極探索可能有效的措施,防止用戶無意中將敏感信息泄露給 AI 智能體,并且我們已經(jīng)內(nèi)置了隱私控制功能,用戶可以輕松刪除會話。我們還在繼續(xù)研究如何確保 AI 智能體作為可靠的信息來源,同時避免執(zhí)行未經(jīng)授權(quán)的操作。

通過 Project Mariner,我們嘗試確保模型能夠優(yōu)先處理用戶指令,并有效抵御外部嘗試輸入的提示詞,從而識別外部來源的潛在惡意指令并防止濫用。這有助于保護用戶免受隱藏在電子郵件、文檔或網(wǎng)站中的惡意指令的侵害,降低用戶遭受欺詐和網(wǎng)絡(luò)釣魚攻擊的風險。

我們深信,AI 的構(gòu)建必須從一開始就秉持高度的責任感。我們將始終將安全和責任置于模型開發(fā)過程的優(yōu)先位置,不斷完善我們的模型和智能體。

Gemini 2.0、AI 智能體以及更多

今天的發(fā)布標志著 Gemini 模型邁入了新的發(fā)展階段。隨著 Gemini 2.0 Flash 以及一系列探索 AI 智能體可能性的研究原型的推出,我們非常開心在 Gemini 時代達到了一個重要的里程碑。我們也期待著繼續(xù)安全地探索所有的可能性,向構(gòu)建通用人工智能 (AGI) 不斷邁進。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 谷歌
    +關(guān)注

    關(guān)注

    27

    文章

    6172

    瀏覽量

    105622
  • Gemini
    +關(guān)注

    關(guān)注

    0

    文章

    55

    瀏覽量

    7606
  • AI
    AI
    +關(guān)注

    關(guān)注

    87

    文章

    31097

    瀏覽量

    269423

原文標題:Gemini 2.0: 我們智能體時代的最新 AI 模型

文章出處:【微信號:Google_Developers,微信公眾號:谷歌開發(fā)者】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏

    評論

    相關(guān)推薦

    谷歌推出Gemini 2.0 Flash體驗版

    我們正賦予開發(fā)者構(gòu)建 AI 未來的能力,包括尖端模型、智能代碼編寫工具以及跨平臺和設(shè)備的無縫集成。自 2023 年 12 月我們推出 Gemini 1.0 以來,數(shù)百萬的開發(fā)者已經(jīng)使用 Google AI Studio 和 Vertex AI 在 109 種語言中使用 Gemin
    的頭像 發(fā)表于 01-06 09:52 ?103次閱讀

    谷歌發(fā)布“深度研究”AI工具,利用Gemini模型進行網(wǎng)絡(luò)信息檢索

    據(jù)外媒最新報道,谷歌近期發(fā)布了一款名為“深度研究”的先進AI工具。這款工具借助其內(nèi)部的Gemini大型語言模型,實現(xiàn)了對網(wǎng)絡(luò)信息的高效檢索與深度挖掘,進一步滿足了用戶對精準、詳盡信息的需求。 據(jù)悉
    的頭像 發(fā)表于 12-16 09:35 ?235次閱讀

    谷歌正式發(fā)布Gemini 2.0 性能提升近兩倍

    在智能體時代,谷歌再次引領(lǐng)技術(shù)潮流,正式發(fā)布了其最新力作——Gemini 2.0。這款A(yù)I模型不僅在性能上實現(xiàn)了顯著提升,更是在多模態(tài)表現(xiàn)和原生工具應(yīng)用方面展現(xiàn)了前所未有的強大功能。
    的頭像 發(fā)表于 12-12 14:22 ?319次閱讀

    谷歌發(fā)布Gemini 2.0 AI模型

    下文處理技術(shù),能夠更有效地支持用戶在學術(shù)及專業(yè)領(lǐng)域進行深入研究。這一新功能的推出,將為用戶在探索復(fù)雜問題時提供更為精準和全面的幫助。 目前,Gemini 2.0 Flash體驗版已經(jīng)對
    的頭像 發(fā)表于 12-12 10:13 ?254次閱讀

    谷歌計劃12月發(fā)布Gemini 2.0模型

    近日,有消息稱谷歌計劃在12月發(fā)布其下一代人工智能模型——Gemini 2.0。這一消息引發(fā)了業(yè)界的廣泛關(guān)注,因為谷歌在人工智能領(lǐng)域一直保持
    的頭像 發(fā)表于 10-29 11:02 ?597次閱讀

    谷歌Gemini 1.5 Flash模型升級,AI聊天速度飆升50%

    谷歌近期對其Gemini AI系列進行了重大更新,推出了Gemini 1.5 Flash模型。此次升級的核心亮點在于顯著提升了AI聊天的響應(yīng)速度,官方宣稱最高可達50%的增速,為用戶帶
    的頭像 發(fā)表于 09-06 18:06 ?779次閱讀

    谷歌推出Gemini Live,開啟AI語音聊天新紀元

    在萬眾矚目的Pixel 9系列手機發(fā)布會上,谷歌震撼宣布了一項創(chuàng)新服務(wù)——Gemini Live,該服務(wù)自今日起,率先向使用英語的Gemini Advanced訂閱用戶敞開大門。這一舉
    的頭像 發(fā)表于 08-15 17:29 ?731次閱讀

    谷歌借助Gemini AI系統(tǒng)深化對機器人的訓練

    7月12日,國際科技界傳來新動態(tài),谷歌正借助其先進的Gemini AI系統(tǒng),深化對旗下機器人的訓練,旨在顯著提升它們的導航能力和任務(wù)執(zhí)行能力。DeepMind機器人團隊最新發(fā)布的研究論文,詳細闡述
    的頭像 發(fā)表于 07-12 16:29 ?645次閱讀

    谷歌Gemini新增旅行規(guī)劃功能,助用戶高效規(guī)劃度假行程

    谷歌方面稱,Gemini可依據(jù)用戶需求,快速挖掘航班時間與酒店預(yù)訂詳情,從而迅速制定出適宜的度假方案。谷歌副總裁兼Gemini總經(jīng)理Sissie Hsiao指出,傳統(tǒng)手動規(guī)劃旅行需耗費
    的頭像 發(fā)表于 05-15 11:18 ?404次閱讀

    谷歌Gmail將支持Gemini總結(jié)電子郵件內(nèi)容

    谷歌透露,Gemini 將協(xié)助 Workspace 和 Google One AI Premium 的用戶理解和處理電子郵件內(nèi)容。用戶可通過移動應(yīng)用和網(wǎng)頁版 Gmail 使用 Gemini
    的頭像 發(fā)表于 05-15 11:11 ?925次閱讀

    谷歌Google Calendar、Tasks與Keep應(yīng)用中成功整合Gemini模型

    谷歌于今日發(fā)布的I/O 2024開發(fā)者大會新聞中展現(xiàn)了其在Google Calendar, Tasks以及Keep應(yīng)用中整合Gemini模型的最新進展,為用戶呈現(xiàn)出更為智能化的使用體驗。
    的頭像 發(fā)表于 05-15 11:10 ?373次閱讀

    蘋果擬將谷歌Gemini大模型植入iPhone

    近日,有消息人士透露,蘋果公司正與谷歌就一項具有里程碑意義的合作展開談判。據(jù)悉,蘋果公司有意將谷歌Gemini人工智能引擎集成至iPhone中,這一舉措將深刻影響人工智能行業(yè)的發(fā)展格局。
    的頭像 發(fā)表于 03-21 13:37 ?517次閱讀

    谷歌推出新一代大模型Gemini 1.5

    近日,谷歌在無預(yù)警的情況下發(fā)布了其下一代大模型——Gemini 1.5,這款模型在性能上實現(xiàn)了顯著增強,并在長上下文理解方面取得了令人矚目的突破。更令人驚嘆的是,Gemini 1.5甚
    的頭像 發(fā)表于 02-20 13:55 ?909次閱讀

    谷歌發(fā)布AI新版本Gemini 1.5

    谷歌近日宣布推出其最新的人工智能(AI)版本——Gemini 1.5,這一新版本在文本處理能力上實現(xiàn)了重大突破。據(jù)了解,Gemini 1.5 Pro的上下文窗口長度已經(jīng)擴展到驚人的100萬個
    的頭像 發(fā)表于 02-19 11:05 ?1160次閱讀

    谷歌最新人工智能模型Gemini Pro已在歐洲上市

    近日,谷歌宣布其最新人工智能模型Gemini Pro已在歐洲市場上市,向歐洲用戶開放。Gemini Pro是谷歌最大的人工智能(AI)模型之一,被視為巴德(Bard)的升級版。
    的頭像 發(fā)表于 02-04 15:10 ?1225次閱讀