0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

使用TensorFlow開發(fā)的一款通用深度學(xué)習(xí)框架,側(cè)重于針對(duì)語言相關(guān)任務(wù)的序列模型

Tensorflowers ? 來源:lp ? 2019-03-22 16:59 ? 次閱讀

Lingvo 是國(guó)際性語言世界語中的一個(gè)單詞,意為 “語言”。此名稱寓指 Lingvo 框架的根基,即它是使用 TensorFlow 開發(fā)的一款通用深度學(xué)習(xí)框架,側(cè)重于針對(duì)語言相關(guān)任務(wù)(例如機(jī)器翻譯、語音識(shí)別和語音合成)的序列模型。

此框架在 Google 內(nèi)部非常受歡迎,使用它的研究人員也越來越多。目前已發(fā)表 數(shù)十篇使用 Lingvo 獲得頂尖成果的論文,未來還會(huì)有更多論文面世。Lingvo 支持多種架構(gòu),從傳統(tǒng)的循環(huán)神經(jīng)網(wǎng)絡(luò) (RNN) 序列模型到 Transformer 模型,再到包含變分自編碼器 (VAE) 組件的模型,不一而足。為表示對(duì)研究社區(qū)的支持,同時(shí)鼓勵(lì)可復(fù)現(xiàn)的研究工作,我們開源了此框架,并開始發(fā)布論文中使用的模型。

圖 1:Lingvo 框架概覽,簡(jiǎn)要展示了如何實(shí)例化和訓(xùn)練模型,以及如何將模型導(dǎo)出以進(jìn)行評(píng)估和部署

在構(gòu)建 Lingvo 時(shí),我們秉持著協(xié)作研究的理念,通過在不同任務(wù)之間共享公共層的實(shí)現(xiàn)來提升代碼復(fù)用率。此外,所有層都采用相同的公共界面,并且以相同的方式布局。這不僅可以產(chǎn)生更簡(jiǎn)潔易懂的代碼,還能讓您非常輕松地將其他開發(fā)者為其他任務(wù)所做的改進(jìn)應(yīng)用到您自己的任務(wù)上。執(zhí)行這種一致性的確成本不菲,需要更多的規(guī)則和樣板文件,但 Lingvo 會(huì)努力將成本降至最低,以確保在研究過程中更快地進(jìn)行迭代。

協(xié)作的另一個(gè)方面是共享可復(fù)現(xiàn)的成果。Lingvo 提供一個(gè)集中的位置,用于存儲(chǔ)檢入的模型超參數(shù)配置。這不僅可以用來記錄重要的實(shí)驗(yàn),還能讓其他研究者通過訓(xùn)練相同的模型,輕松復(fù)現(xiàn)您的成果。

雖然 Lingvo 最初的關(guān)注重點(diǎn)是 NLP,但它其實(shí)非常靈活,研究人員已經(jīng)使用此框架成功實(shí)現(xiàn)了圖像分割、點(diǎn)云分類等任務(wù)的模型。它還支持提煉、生成式對(duì)抗網(wǎng)絡(luò) (GAN) 和多任務(wù)模型。同時(shí),此框架的速度并未因此而受到影響,它具有經(jīng)優(yōu)化的輸入管道和快速分布式訓(xùn)練能力。最后,Lingvo 還將易于實(shí)現(xiàn)生產(chǎn)化也納入考慮,它甚至有一條明確定義的路徑,可以將模型移植到移動(dòng)推理。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴

原文標(biāo)題:Lingvo:TensorFlow 序列建模框架

文章出處:【微信號(hào):tensorflowers,微信公眾號(hào):Tensorflowers】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏

    評(píng)論

    相關(guān)推薦

    【「基于大模型的RAG應(yīng)用開發(fā)與優(yōu)化」閱讀體驗(yàn)】+大模型微調(diào)技術(shù)解讀

    今天學(xué)習(xí)<基于大模型的RAG應(yīng)用開發(fā)與優(yōu)化>這本書。大模型微調(diào)是深度學(xué)習(xí)領(lǐng)域中的
    發(fā)表于 01-14 16:51

    語言模型開發(fā)框架是什么

    語言模型開發(fā)框架是指用于訓(xùn)練、推理和部署大型語言模型的軟件工具和庫(kù)。下面,AI部落小編為您介紹
    的頭像 發(fā)表于 12-06 10:28 ?157次閱讀

    卷積神經(jīng)網(wǎng)絡(luò)的實(shí)現(xiàn)工具與框架

    卷積神經(jīng)網(wǎng)絡(luò)因其在圖像和視頻處理任務(wù)中的卓越性能而廣受歡迎。隨著深度學(xué)習(xí)技術(shù)的快速發(fā)展,多種實(shí)現(xiàn)工具和框架應(yīng)運(yùn)而生,為研究人員和開發(fā)者提供了
    的頭像 發(fā)表于 11-15 15:20 ?293次閱讀

    【《大語言模型應(yīng)用指南》閱讀體驗(yàn)】+ 基礎(chǔ)知識(shí)學(xué)習(xí)

    些局限性。例如,模型可能無法完全理解文本中的深層含義和語境信息;同時(shí),由于訓(xùn)練數(shù)據(jù)可能存在偏差和噪聲,生成的答案也可能存在不準(zhǔn)確或誤導(dǎo)性的情況。 總結(jié)以下,大語言模型通過
    發(fā)表于 08-02 11:03

    TensorFlow是什么?TensorFlow怎么用?

    TensorFlow是由Google開發(fā)個(gè)開源深度學(xué)習(xí)框架,它允許
    的頭像 發(fā)表于 07-12 16:38 ?749次閱讀

    深度學(xué)習(xí)中的時(shí)間序列分類方法

    時(shí)間序列分類(Time Series Classification, TSC)是機(jī)器學(xué)習(xí)深度學(xué)習(xí)領(lǐng)域的重要任務(wù)
    的頭像 發(fā)表于 07-09 15:54 ?1067次閱讀

    tensorflow簡(jiǎn)單的模型訓(xùn)練

    在本文中,我們將詳細(xì)介紹如何使用TensorFlow進(jìn)行簡(jiǎn)單的模型訓(xùn)練。TensorFlow個(gè)開源的機(jī)器學(xué)習(xí)庫(kù),廣泛用于各種機(jī)器
    的頭像 發(fā)表于 07-05 09:38 ?732次閱讀

    keras模型轉(zhuǎn)tensorflow session

    和訓(xùn)練深度學(xué)習(xí)模型。Keras是基于TensorFlow、Theano或CNTK等底層計(jì)算框架構(gòu)建的。T
    的頭像 發(fā)表于 07-05 09:36 ?570次閱讀

    TensorFlow與PyTorch深度學(xué)習(xí)框架的比較與選擇

    深度學(xué)習(xí)作為人工智能領(lǐng)域的個(gè)重要分支,在過去十年中取得了顯著的進(jìn)展。在構(gòu)建和訓(xùn)練深度學(xué)習(xí)模型
    的頭像 發(fā)表于 07-02 14:04 ?1006次閱讀

    語言模型:原理與工程時(shí)間+小白初識(shí)大語言模型

    解鎖 我理解的是基于深度學(xué)習(xí),需要訓(xùn)練各種數(shù)據(jù)知識(shí)最后生成自己的的語言理解和能力的交互模型。 對(duì)于常說的RNN是處理短序列的數(shù)據(jù)時(shí)表現(xiàn)出色,
    發(fā)表于 05-12 23:57

    【大語言模型:原理與工程實(shí)踐】大語言模型的評(píng)測(cè)

    安全性的評(píng)測(cè)則關(guān)注模型在強(qiáng)化學(xué)習(xí)階段的表現(xiàn)。行業(yè)模型的評(píng)測(cè)則針對(duì)特定行業(yè)的能力,如金融和法律等領(lǐng)域。整體能力的評(píng)測(cè)從宏觀角度評(píng)估模型作為
    發(fā)表于 05-07 17:12

    【大語言模型:原理與工程實(shí)踐】大語言模型的預(yù)訓(xùn)練

    語言模型的核心特點(diǎn)在于其龐大的參數(shù)量,這賦予了模型強(qiáng)大的學(xué)習(xí)容量,使其無需依賴微調(diào)即可適應(yīng)各種下游任務(wù),而更傾向于培養(yǎng)
    發(fā)表于 05-07 17:10

    【大語言模型:原理與工程實(shí)踐】大語言模型的基礎(chǔ)技術(shù)

    ,這也是如今生成式 AI 中大語言模型最流行訓(xùn)練架構(gòu)。(3) Encoder-Decoder預(yù)訓(xùn)練語言模型:這類模型旨在將各種自然
    發(fā)表于 05-05 12:17

    【大語言模型:原理與工程實(shí)踐】揭開大語言模型的面紗

    學(xué)習(xí)能力。這些模型以生成能力強(qiáng)和靈活性強(qiáng)為特點(diǎn),逐漸演變成通用計(jì)算平臺(tái)。其參數(shù)多樣性、生成能力和涌現(xiàn)性使其不僅在自然語言處理領(lǐng)域表現(xiàn)出色
    發(fā)表于 05-04 23:55

    谷歌模型框架是什么軟件?谷歌模型框架怎么用?

    谷歌模型框架通常指的是谷歌開發(fā)的用于機(jī)器學(xué)習(xí)和人工智能的軟件框架,其中最著名的是TensorFlow
    的頭像 發(fā)表于 03-01 16:25 ?920次閱讀