0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

谷歌的人工智能實現(xiàn)了最先進(jìn)的文本摘要性能

倩倩 ? 來源:網(wǎng)易智能 ? 2020-01-05 09:11 ? 次閱讀

自動文本摘要是機器學(xué)習(xí)算法正在努力的方向之一,微軟近期發(fā)布的相關(guān)論文也表明了這一趨勢。對于那些每天要閱讀大量文字信息的工作者們來說,這是一個值得慶賀的好消息。有調(diào)查顯示,這類工作者每天僅在閱讀信息上就要花費大約2.6小時。

相應(yīng)的,Google Brain和倫敦帝國理工學(xué)院的一個團(tuán)隊構(gòu)建了一個系統(tǒng)——Pegasus(Pre-training with Extracted Gap-sentences for Abstractive Summarization Sequence-to-sequence),它使用了谷歌的變形金剛架構(gòu),結(jié)合了針對文本摘要能力的預(yù)訓(xùn)練目標(biāo)。據(jù)稱,它在12種測試中均達(dá)到了達(dá)到最先進(jìn)的水平,這些測試包括了科學(xué)、故事、電子郵件、專利和立法法案等。不僅如此,它在材料缺乏的文本整合測試中也表現(xiàn)驚人。

正如研究人員指出的那樣,文本摘要的目的是總結(jié)輸入的文檔,生成其準(zhǔn)確和簡潔的摘要。

抽象的摘要也不是簡單地從輸入的文本中復(fù)制粘貼文字的片段,而是會產(chǎn)生新單詞或總結(jié)重要信息,從而使輸出的語言保持流暢。

變形金剛是Google Brain (谷歌的人工智能研究部門)的研究人員在介紹的一種神經(jīng)結(jié)構(gòu)。

它提取特征以及學(xué)習(xí)做出預(yù)測的方式和所有的深度神經(jīng)網(wǎng)絡(luò)一樣:神經(jīng)元被安排在相互連接的層中,這些層傳遞著輸入數(shù)據(jù)的信號,調(diào)整每個連接的權(quán)重。

但變形金剛架構(gòu)又有其獨特之處:每個輸出元素和每個輸入元素都有連接,并動態(tài)計算它們之間的權(quán)重。

在測試中,研究小組選擇了表現(xiàn)最佳的Pegasus模型,該模型包含了5.68億個參數(shù)。它有兩個訓(xùn)練材料。一個是從3.5億個網(wǎng)頁中提取出來的文本,有750GB。還有一個訓(xùn)練材料則覆蓋了15億篇新聞類型的文章,總計3.8TB。研究人員說,在后者的情況下,他們用白名單域來植入網(wǎng)絡(luò)爬蟲工具,覆蓋了質(zhì)量參差不齊的內(nèi)容。

根據(jù)研究員的說法,Pegasus生成的摘要語言非常優(yōu)秀,流暢性和連貫性都達(dá)到了高水準(zhǔn)。此外,在文本匱乏的環(huán)境中,即使只有100篇示例文章,它生成的摘要質(zhì)量與在20,000到200,000篇文章的完整數(shù)據(jù)集上訓(xùn)練過的模型相當(dāng)。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 谷歌
    +關(guān)注

    關(guān)注

    27

    文章

    6177

    瀏覽量

    105686
  • 算法
    +關(guān)注

    關(guān)注

    23

    文章

    4624

    瀏覽量

    93116
  • 機器學(xué)習(xí)
    +關(guān)注

    關(guān)注

    66

    文章

    8428

    瀏覽量

    132842
收藏 人收藏

    評論

    相關(guān)推薦

    Infosys與谷歌云加強合作,推動企業(yè)人工智能創(chuàng)新,建立卓越中心

    利用Infosys Topaz和谷歌云技術(shù),卓越中心將促進(jìn)共同創(chuàng)新,提供變革性的人工智能解決方案? 印度班加羅爾2024年12月19日 /美通社/ -- 下一代數(shù)字服務(wù)和咨詢領(lǐng)域的全球領(lǐng)軍者
    的頭像 發(fā)表于 12-19 15:33 ?167次閱讀

    嵌入式和人工智能究竟是什么關(guān)系?

    人工智能應(yīng)用的實時響應(yīng)。與此同時,嵌入式系統(tǒng)在邊緣計算和物聯(lián)網(wǎng)領(lǐng)域,也為人工智能的應(yīng)用提供廣闊的空間。 在邊緣計算中,嵌入式系統(tǒng)能夠?qū)?b class='flag-5'>人工智能算法部署到設(shè)備端,
    發(fā)表于 11-14 16:39

    《AI for Science:人工智能驅(qū)動科學(xué)創(chuàng)新》第6章人AI與能源科學(xué)讀后感

    、優(yōu)化等方面的應(yīng)用有更清晰的認(rèn)識。特別是書中提到的基于大數(shù)據(jù)和機器學(xué)習(xí)的能源管理系統(tǒng),通過實時監(jiān)測和分析能源數(shù)據(jù),實現(xiàn)能源的高效利用和智能化管理。 其次,第6章通過多個案例展示
    發(fā)表于 10-14 09:27

    《AI for Science:人工智能驅(qū)動科學(xué)創(chuàng)新》第一章人工智能驅(qū)動的科學(xué)創(chuàng)新學(xué)習(xí)心得

    人工智能:科學(xué)研究的加速器 第一章清晰地闡述人工智能作為科學(xué)研究工具的強大功能。通過機器學(xué)習(xí)、深度學(xué)習(xí)等先進(jìn)技術(shù),AI能夠處理和分析海量數(shù)據(jù),發(fā)現(xiàn)傳統(tǒng)方法難以捕捉的模式和規(guī)律。這不
    發(fā)表于 10-14 09:12

    risc-v在人工智能圖像處理應(yīng)用前景分析

    人工智能推薦系統(tǒng)中強大的圖形處理器(GPU)一爭高下。其獨特的設(shè)計使得該處理器在功耗受限的條件下仍能實現(xiàn)性能的圖像處理任務(wù)。 Ceremorphic公司 :該公司開發(fā)的分層學(xué)習(xí)處理器結(jié)合
    發(fā)表于 09-28 11:00

    名單公布!【書籍評測活動NO.44】AI for Science:人工智能驅(qū)動科學(xué)創(chuàng)新

    活的世界? 編輯推薦 《AI for Science:人工智能驅(qū)動科學(xué)創(chuàng)新》聚焦于人工智能與材料科學(xué)、生命科學(xué)、電子科學(xué)、能源科學(xué)、環(huán)境科學(xué)五大領(lǐng)域的交叉融合,通過深入淺出的語言和諸多實際應(yīng)用案例,介紹
    發(fā)表于 09-09 13:54

    FPGA在人工智能中的應(yīng)用有哪些?

    FPGA(現(xiàn)場可編程門陣列)在人工智能領(lǐng)域的應(yīng)用非常廣泛,主要體現(xiàn)在以下幾個方面: 一、深度學(xué)習(xí)加速 訓(xùn)練和推理過程加速:FPGA可以用來加速深度學(xué)習(xí)的訓(xùn)練和推理過程。由于其高并行性和低延遲特性
    發(fā)表于 07-29 17:05

    Python中的人工智能框架與實例

    人工智能(AI)領(lǐng)域,Python因其簡潔的語法、豐富的庫和強大的社區(qū)支持,成為了最受歡迎的編程語言之一。本文將詳細(xì)介紹Python中的人工智能框架,并通過具體實例展示如何使用這些框架來實現(xiàn)不同
    的頭像 發(fā)表于 07-15 14:54 ?1772次閱讀

    英業(yè)達(dá)推出 P8000IG6 - 為AI和HPC工作負(fù)載的最先進(jìn)平臺

    / --英業(yè)達(dá)(TPE:2356)是一家全球領(lǐng)先的高性能服務(wù)器制造商,總部位于臺灣, 其即將推出的?P8000IG6 服務(wù)器可快速、靈活地擴展數(shù)據(jù)中心的容量,從而輕松處理最先進(jìn)的人工智能和高
    的頭像 發(fā)表于 04-08 16:28 ?622次閱讀

    谷歌宣布在醫(yī)療保健領(lǐng)域推出人工智能計劃

    谷歌最近公布一系列激動人心的計劃,將先進(jìn)的人工智能模型引入醫(yī)療保健領(lǐng)域。據(jù)谷歌透露,其研究團(tuán)隊正聯(lián)手旗下Fitbit公司,共同研發(fā)一項創(chuàng)新
    的頭像 發(fā)表于 03-21 10:54 ?674次閱讀

    蘋果公司計劃將谷歌的Gemini人工智能引擎集成到iPhone中

    據(jù)熟悉情況的人士向彭博透露,蘋果公司正在與谷歌進(jìn)行談判,計劃將谷歌的Gemini人工智能引擎集成到iPhone中,這為一項可能震撼AI行業(yè)的重大協(xié)議奠定
    的頭像 發(fā)表于 03-19 11:08 ?787次閱讀

    嵌入式人工智能的就業(yè)方向有哪些?

    。 國內(nèi)外科技巨頭紛紛爭先入局,在微軟、谷歌、蘋果、臉書等積極布局人工智能的同時,國內(nèi)的BAT、華為、小米等科技公司也相繼切入到嵌入式人工智能的賽道。那么嵌入式AI可就業(yè)的方向有哪些呢? 嵌入式AI開發(fā)
    發(fā)表于 02-26 10:17

    生成式人工智能和感知式人工智能的區(qū)別

    生成新的內(nèi)容和信息的人工智能系統(tǒng)。這些系統(tǒng)能夠利用已有的數(shù)據(jù)和知識來生成全新的內(nèi)容,如圖片、音樂、文本等。生成式人工智能通?;谏疃葘W(xué)習(xí)技術(shù),如生成對抗網(wǎng)絡(luò)(GANs)、變分自編碼器(VAEs)等。 生成式
    的頭像 發(fā)表于 02-19 16:43 ?1896次閱讀

    谷歌最新人工智能模型Gemini Pro已在歐洲上市

    近日,谷歌宣布其最新人工智能模型Gemini Pro已在歐洲市場上市,向歐洲用戶開放。Gemini Pro是谷歌最大的人工智能(AI)模型之一,被視為巴德(Bard)的升級版。
    的頭像 發(fā)表于 02-04 15:10 ?1242次閱讀

    人工智能引擎助力谷歌地圖提升旅行探索體驗

    為了提升旅行者的個人定制化體驗,谷歌地圖此次采用了先進(jìn)的人工智能技術(shù)。這一技術(shù)的原理在于對全球2.5億余處地理位置的深入理解以及谷歌地圖擁有的超過3億用戶的知識庫的整合應(yīng)用。
    的頭像 發(fā)表于 02-02 10:28 ?642次閱讀