0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

谷歌發(fā)布語言模型PaLM2,突破3.6萬億個(gè)令牌的訓(xùn)練數(shù)量

電子熱友 ? 2023-05-18 11:15 ? 次閱讀

人工智能AI技術(shù)的應(yīng)用,是目前很大領(lǐng)域比較重視的部分,而至這個(gè)領(lǐng)域的谷歌也擁有不小的實(shí)力,就在近日,谷歌最新發(fā)布的語言模型PaLM2就具備很強(qiáng)的競爭力。

據(jù)悉,令牌是指訓(xùn)練大語言模型所使用的單詞串,它們對(duì)于教導(dǎo)模型如何預(yù)測字符串中可能出現(xiàn)的下一個(gè)單詞至關(guān)重要。

而在去年發(fā)布的上一代模型PaLM僅使用了7800億個(gè)令牌,而PaLM2則提升到了3.6萬億個(gè)令牌。同時(shí)PaLM2在編程、數(shù)學(xué)和創(chuàng)意寫作方面表現(xiàn)更為優(yōu)秀,得益于其龐大的訓(xùn)練數(shù)據(jù)。而這些也將有效提升用戶的工作效率,減輕工作量。

另據(jù)報(bào)道,PaLM2是基于3400億個(gè)參數(shù)進(jìn)行訓(xùn)練的,而初始版本的PaLM則基于5400億個(gè)參數(shù),而這也造就PaLM2比現(xiàn)有的任何模型都更加強(qiáng)大。

該模型采用了一種名為“計(jì)算機(jī)優(yōu)化擴(kuò)張”的新技術(shù),使得大語言模型具備更高的效率和整體性能,包括加快推理速度、減少參數(shù)調(diào)用和降低服務(wù)成本。

相信隨著社會(huì)科技的進(jìn)步,Ai技術(shù)的應(yīng)用也將給我們的生活帶來諸多的變化。

以上源自互聯(lián)網(wǎng),版權(quán)歸原作所有

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 谷歌
    +關(guān)注

    關(guān)注

    27

    文章

    6168

    瀏覽量

    105397
  • 人工智能
    +關(guān)注

    關(guān)注

    1791

    文章

    47282

    瀏覽量

    238534
收藏 人收藏

    評(píng)論

    相關(guān)推薦

    從零開始訓(xùn)練個(gè)語言模型需要投資多少錢?

    一,前言 ? 在AI領(lǐng)域,訓(xùn)練個(gè)大型語言模型(LLM)是一個(gè)耗時(shí)且復(fù)雜的過程。幾乎每個(gè)做大型語言
    的頭像 發(fā)表于 11-08 14:15 ?215次閱讀
    從零開始<b class='flag-5'>訓(xùn)練</b>一<b class='flag-5'>個(gè)</b>大<b class='flag-5'>語言</b><b class='flag-5'>模型</b>需要投資多少錢?

    語言模型如何開發(fā)

    語言模型的開發(fā)是一個(gè)復(fù)雜且細(xì)致的過程,涵蓋了數(shù)據(jù)準(zhǔn)備、模型架構(gòu)設(shè)計(jì)、訓(xùn)練、微調(diào)和部署等多個(gè)階段。以下是對(duì)大
    的頭像 發(fā)表于 11-04 10:14 ?144次閱讀

    語言模型的預(yù)訓(xùn)練

    隨著人工智能技術(shù)的飛速發(fā)展,自然語言處理(NLP)作為人工智能領(lǐng)域的一個(gè)重要分支,取得了顯著的進(jìn)步。其中,大語言模型(Large Language Model, LLM)憑借其強(qiáng)大的
    的頭像 發(fā)表于 07-11 10:11 ?435次閱讀

    谷歌Gemma 2語言模型升級(jí)發(fā)布,性能與安全性雙重飛躍

    近日,谷歌面向全球科研界與開發(fā)者群體隆重推出了全新升級(jí)的Gemma 2語言模型,標(biāo)志著人工智能技術(shù)在語言處理領(lǐng)域的又一次重大進(jìn)步。此次
    的頭像 發(fā)表于 07-02 10:20 ?500次閱讀

    谷歌發(fā)布新型大語言模型Gemma 2

    在人工智能領(lǐng)域,大語言模型一直是研究的熱點(diǎn)。近日,全球科技巨頭谷歌宣布,面向全球研究人員和開發(fā)人員,正式發(fā)布了其最新研發(fā)的大語言
    的頭像 發(fā)表于 06-29 09:48 ?440次閱讀

    語言模型:原理與工程時(shí)間+小白初識(shí)大語言模型

    解鎖 我理解的是基于深度學(xué)習(xí),需要訓(xùn)練各種數(shù)據(jù)知識(shí)最后生成自己的的語言理解和能力的交互模型。 對(duì)于常說的RNN是處理短序列的數(shù)據(jù)時(shí)表現(xiàn)出色,耳真正厲害的是Transformer,此框架被推出后直接
    發(fā)表于 05-12 23:57

    【大語言模型:原理與工程實(shí)踐】大語言模型的應(yīng)用

    。 關(guān)于大語言模型是否具備與人類“系統(tǒng)2”相似的能力,存在廣泛的爭議。然而,隨著模型數(shù)量的增加和大規(guī)模預(yù)
    發(fā)表于 05-07 17:21

    【大語言模型:原理與工程實(shí)踐】大語言模型的預(yù)訓(xùn)練

    訓(xùn)練數(shù)據(jù)時(shí),數(shù)量、質(zhì)量和多樣性三者缺一不可。 數(shù)據(jù)的多樣性對(duì)于大語言模型至關(guān)重要,這主要體現(xiàn)在數(shù)據(jù)的類別和來源兩個(gè)方面。豐富的數(shù)據(jù)類別能夠
    發(fā)表于 05-07 17:10

    【大語言模型:原理與工程實(shí)踐】大語言模型的基礎(chǔ)技術(shù)

    特定任務(wù)對(duì)模型進(jìn)行微調(diào)。這種方法的成功不僅是自然語言處理發(fā)展的一個(gè)轉(zhuǎn)折點(diǎn),還為許多現(xiàn)實(shí)世界的應(yīng)用場帶來了前所未有的性能提升。從廣為人知的GPT到BERT,預(yù)訓(xùn)練
    發(fā)表于 05-05 12:17

    【大語言模型:原理與工程實(shí)踐】揭開大語言模型的面紗

    語言模型(LLM)是人工智能領(lǐng)域的尖端技術(shù),憑借龐大的參數(shù)量和卓越的語言理解能力贏得了廣泛關(guān)注。它基于深度學(xué)習(xí),利用神經(jīng)網(wǎng)絡(luò)框架來理解和生成自然
    發(fā)表于 05-04 23:55

    谷歌發(fā)布用于輔助編程的代碼大模型CodeGemma

    谷歌發(fā)布了用于輔助編程的代碼大模型 CodeGemma。CodeGemma 基于谷歌今年 2發(fā)布
    的頭像 發(fā)表于 04-17 16:07 ?689次閱讀
    <b class='flag-5'>谷歌</b><b class='flag-5'>發(fā)布</b>用于輔助編程的代碼大<b class='flag-5'>模型</b>CodeGemma

    名單公布!【書籍評(píng)測活動(dòng)NO.30】大規(guī)模語言模型:從理論到實(shí)踐

    榜銷售TOP1的桂冠,可想大家對(duì)本書的認(rèn)可和支持! 這本書為什么如此受歡迎?它究竟講了什么?下面就給大家詳細(xì)~~ 本書主要內(nèi)容 本書圍繞大語言模型構(gòu)建的四個(gè)主要階段——預(yù)訓(xùn)練、有監(jiān)督
    發(fā)表于 03-11 15:16

    谷歌模型訓(xùn)練軟件有哪些?谷歌模型訓(xùn)練軟件哪個(gè)好?

    谷歌模型訓(xùn)練方面提供了一些強(qiáng)大的軟件工具和平臺(tái)。以下是幾個(gè)常用的谷歌模型訓(xùn)練軟件及其特點(diǎn)。
    的頭像 發(fā)表于 03-01 16:24 ?892次閱讀

    谷歌模型訓(xùn)練軟件有哪些功能和作用

    谷歌模型訓(xùn)練軟件主要是指ELECTRA,這是一種新的預(yù)訓(xùn)練方法,源自谷歌AI。ELECTRA不僅擁有BERT的優(yōu)勢(shì),而且在效率上更勝一籌。
    的頭像 發(fā)表于 02-29 17:37 ?791次閱讀

    谷歌交互世界模型重磅發(fā)布

    谷歌模型
    北京中科同志科技股份有限公司
    發(fā)布于 :2024年02月28日 09:13:06