0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

一項(xiàng)Gmail新功能-智能撰寫,為電子郵件寫作提供了一種新的方式

Tensorflowers ? 來源:未知 ? 作者:李倩 ? 2018-05-31 10:18 ? 次閱讀

在 5 月初的 Google I/O 大會(huì)上,我們推出了一項(xiàng) Gmail 新功能 -智能撰寫,此功能利用機(jī)器學(xué)習(xí),以交互方式在用戶打字時(shí)給出建議,幫助用戶補(bǔ)全句子,從而提高電子郵件的寫作速度。智能撰寫基于為智能回復(fù)開發(fā)的技術(shù),為電子郵件寫作提供了一種新的方式。無論是回復(fù)收到的電子郵件,還是新寫郵件都能夠體驗(yàn)。

在開發(fā)智能撰寫的過程中,需要面對(duì)許多關(guān)鍵挑戰(zhàn),其中包括:

延遲時(shí)間:智能撰寫基于每次的按鍵操作提供預(yù)測(cè),因此它必須在 100 毫秒內(nèi)作出響應(yīng),用戶才不會(huì)注意到任何延遲。因此,如何平衡模型復(fù)雜度和推斷速度成為一個(gè)關(guān)鍵問題。

規(guī)模:Gmail 擁有超過 14 億用戶。要為所有 Gmail 用戶提供有效的自動(dòng)補(bǔ)全建議,模型必須具備足夠的建模能力,才能根據(jù)不同的語境給出相應(yīng)的建議。

公平性和隱私性:在開發(fā)智能撰寫時(shí),我們需要在訓(xùn)練過程中杜絕存在潛在偏見的數(shù)據(jù)源,同時(shí)必須遵守與智能回復(fù)相同的嚴(yán)格用戶隱私標(biāo)準(zhǔn),確保模型不會(huì)泄露用戶的隱私信息。此外,研究人員無法訪問電子郵件,這意味著他們必須開發(fā)并訓(xùn)練一個(gè)機(jī)器學(xué)習(xí)系統(tǒng)來處理他們無法讀取的數(shù)據(jù)集。

尋找合適的模型

ngram、神經(jīng)詞袋(BoW) 和RNN 語言(RNN-LM) 等典型的語言生成模型基于前面的單詞序列學(xué)習(xí)預(yù)測(cè)下個(gè)單詞。 然而,在電子郵件場(chǎng)景中,用戶在當(dāng)前電子郵件撰寫會(huì)話中所打出的單詞只是模型可用于預(yù)測(cè)下個(gè)單詞的提示之一。為了融入有關(guān)用戶想表達(dá)內(nèi)容的更多語境,我們的模型將電子郵件主題和之前的電子郵件正文(如果用戶要回復(fù)收到的郵件)也作為了一種預(yù)測(cè)條件。

要想包含這一額外語境,一種方法是將此問題看作序列到序列(seq2seq) 的機(jī)器翻譯任務(wù),其中源序列是主題和之前電子郵件正文(如果有)的結(jié)合,目標(biāo)序列是用戶當(dāng)前正在撰寫的電子郵件。盡管此方法在預(yù)測(cè)質(zhì)量方面表現(xiàn)良好,但它遠(yuǎn)遠(yuǎn)達(dá)不到我們嚴(yán)格的延遲時(shí)間約束標(biāo)準(zhǔn)。

為了改善這種情況,我們將 BoW 模型與 RNN-LM 結(jié)合起來,結(jié)果,速度快于 seq2seq 模型,且模型預(yù)測(cè)質(zhì)量損失微乎其微。在這種混合方法中,我們通過將每個(gè)字段中的詞嵌入取平均值,對(duì)主題和之前的電子郵件進(jìn)行編碼。然后在每個(gè)解碼步驟中,將這些平均嵌入連接起來并輸入到目標(biāo)序列 RNN-LM 中。模型架構(gòu)如下圖所示。

智能撰寫 RNN-LM 模型架構(gòu)。通過對(duì)每個(gè)字段中的詞嵌入取平均值,對(duì)主題和之前的電子郵件消息進(jìn)行編碼。然后在每個(gè)解碼步驟中將平均嵌入輸入到 RNN-LM 中。

加速模型訓(xùn)練與服務(wù)

當(dāng)然,確定使用這種建模方法后,我們?nèi)孕枰{(diào)整不同的模型超參數(shù),并在數(shù)十億個(gè)樣本上訓(xùn)練模型,這些加起來需要耗費(fèi)大量時(shí)間。為了加快速度,我們使用完整的 TPUv2 Pod 進(jìn)行實(shí)驗(yàn)。通過這種方式,不到一天的時(shí)間即可將模型訓(xùn)練至收斂。

即使在訓(xùn)練完較快的混合模型之后,最初版本的智能撰寫在標(biāo)準(zhǔn) CPU 上運(yùn)行時(shí)的平均服務(wù)延遲時(shí)間仍高達(dá)數(shù)百毫秒,這個(gè)值對(duì)于一個(gè)試圖節(jié)約用戶時(shí)間的功能來說仍然是不可接受的。幸運(yùn)的是,在推斷時(shí)還可以使用 TPU,從而極大地加速用戶體驗(yàn)。通過將大量計(jì)算轉(zhuǎn)移到 TPU 上,我們將平均延遲時(shí)間減少到幾十毫秒,同時(shí)極大地提高了單個(gè)機(jī)器可服務(wù)的請(qǐng)求數(shù)量。

公平性和隱私性

機(jī)器學(xué)習(xí)中的公平性非常重要,因?yàn)檎Z言理解模型可能反映人類的認(rèn)知偏見,產(chǎn)生一些不受歡迎的單詞和句子關(guān)聯(lián)。正如 Caliskan 等人在他們的近期論文"Semantics derived automatically from language corpora contain human-like biases"中所述,這些關(guān)聯(lián)與自然語言數(shù)據(jù)有著盤根錯(cuò)節(jié)的聯(lián)系,這對(duì)構(gòu)建語言模型提出了巨大挑戰(zhàn)。我們正在積極探索如何在訓(xùn)練過程中進(jìn)一步減少潛在偏見。同時(shí),由于智能撰寫與垃圾郵件機(jī)器學(xué)習(xí)模型的訓(xùn)練方式類似,基于數(shù)十億詞組和句子訓(xùn)練而成,因此,我們運(yùn)用此論文的研究成果,對(duì)模型進(jìn)行了大量測(cè)試,以便確保只有多個(gè)用戶使用的常見詞組才會(huì)被模型記住。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • cpu
    cpu
    +關(guān)注

    關(guān)注

    68

    文章

    10901

    瀏覽量

    212802
  • 電子郵件
    +關(guān)注

    關(guān)注

    0

    文章

    110

    瀏覽量

    15383
  • 機(jī)器學(xué)習(xí)

    關(guān)注

    66

    文章

    8438

    瀏覽量

    132989

原文標(biāo)題:基于機(jī)器學(xué)習(xí)的「智能撰寫」讓你的 Gmail 如開掛一般好用

文章出處:【微信號(hào):tensorflowers,微信公眾號(hào):Tensorflowers】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏

    評(píng)論

    相關(guān)推薦

    電子郵件的使用培圳教程

    當(dāng)天就能收到對(duì)方發(fā)來的郵件。 二、郵件的異步傳輸   電話通信是一種同步通信,即通話雙方必須同時(shí)在電話機(jī)旁且電話必須是空閑的。而電子郵件則是以一種
    發(fā)表于 03-10 17:55

    傳真百科:電子郵件能取代傳真嗎

    二十一世紀(jì)的今天傳真仍普遍使用在技術(shù)先進(jìn)的現(xiàn)代化辦公室中,全球范圍每年都有數(shù)億文件通過傳真方式進(jìn)行發(fā)送。傳真作為一種傳統(tǒng)的通信方式,為何不被電子郵件所取代?我們從傳真與
    發(fā)表于 01-14 11:32

    電子郵件的使用教程

    電子郵件的使用主要內(nèi)容認(rèn)識(shí)電子郵件通過POP3方式收發(fā)電子郵件申請(qǐng)個(gè)免費(fèi)的電子郵件信箱通過WW
    發(fā)表于 03-11 17:11 ?0次下載

    一種電子郵件網(wǎng)絡(luò)的加權(quán)演化模型與仿真

    本文中提出了一種電子郵件網(wǎng)絡(luò)加權(quán)動(dòng)態(tài)演化模型,它通過生成和刪除兩機(jī)制來模擬用戶定期整理其地址簿的行為,模擬了真實(shí)電子郵件網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)的動(dòng)態(tài)演化。并通過仿真實(shí)驗(yàn)
    發(fā)表于 07-16 08:49 ?15次下載

    基于數(shù)字簽名的安全電子郵件系統(tǒng)的研究

    本文以電子郵件系統(tǒng)研究背景,在數(shù)字簽名技術(shù)的基礎(chǔ)上,提出了一種基于數(shù)字簽名技術(shù)的安全電子郵件系統(tǒng)的設(shè)計(jì)方案,并給出了發(fā)送電子郵件模塊和接收
    發(fā)表于 08-04 08:07 ?27次下載

    怎樣通過Microsoft Exchange電子郵件使用Gmail或Google Apps for Business

     每當(dāng)有新郵件到達(dá)Exchange帳戶時(shí),如果Outlook正在運(yùn)行,它將被移至您的Gmail帳戶。 Gmail上此文件夾中的郵件將被標(biāo)記為未讀,但我想不出
    的頭像 發(fā)表于 12-13 10:27 ?7121次閱讀
    怎樣通過Microsoft Exchange<b class='flag-5'>電子郵件</b>使用<b class='flag-5'>Gmail</b>或Google Apps for Business

    如何獲取Gmail帳戶以通過txt將電子郵件發(fā)送到手機(jī)

     如果正確設(shè)置gmail現(xiàn)在應(yīng)該將所有傳入的電子郵件通過txt轉(zhuǎn)發(fā)到您的手機(jī)。
    的頭像 發(fā)表于 10-14 14:34 ?6445次閱讀

    谷歌Gmail新功能可引入多個(gè)郵件簽名

    谷歌剛剛宣布 Gmail 郵件服務(wù)的一項(xiàng)新功能,允許用戶在發(fā)件時(shí)從多個(gè)郵件簽名中挑選其中
    的頭像 發(fā)表于 03-11 15:21 ?1937次閱讀

    iOS 14中更改默認(rèn)電子郵件應(yīng)用的方法

    為了受益于此新功能,首先,電子郵件應(yīng)用程序的開發(fā)人員必須發(fā)布其應(yīng)用程序的更新。微軟很快為其 Outlook iOS應(yīng)用發(fā)布個(gè)更新,該更新現(xiàn)在支持此選項(xiàng)。
    的頭像 發(fā)表于 09-24 16:46 ?3252次閱讀

    Gmail電子郵件中添加了品牌徽標(biāo)

    聽起來很簡(jiǎn)單,但是要使品牌的徽標(biāo)獲得批準(zhǔn)在Gmail中使用,首先需要采取些增強(qiáng)的安全措施。正如Google在其Cloud博客上所解釋的那樣,Gmail添加了對(duì)郵件標(biāo)識(shí)的品牌指示器(B
    的頭像 發(fā)表于 10-27 16:56 ?2459次閱讀

    微軟新AI項(xiàng)目文檔和電子郵件的圖像添加字幕

    微軟的一項(xiàng)新AI項(xiàng)目旨在自動(dòng)文檔和電子郵件中的圖像添加字幕,以便視覺障礙軟件讀取圖像。
    的頭像 發(fā)表于 11-18 10:54 ?1764次閱讀

    谷歌Gmail現(xiàn)已支持蘋果iOS14小組件功能

    Gmail 應(yīng)用中搜索、編輯新電子郵件或查看未讀電子郵件。小組件僅提供這些任務(wù)的快捷方式,并不會(huì)列出敏感的
    的頭像 發(fā)表于 11-19 09:32 ?1761次閱讀

    如何有效防御接連不斷的電子郵件攻擊

    任何指定的目的地),與世界上任何個(gè)角落的網(wǎng)絡(luò)用戶聯(lián)系。 一種更輕(更弱)的電子郵件防御方法 假設(shè)電子郵件到達(dá)用戶的收件箱并包含
    的頭像 發(fā)表于 01-30 17:33 ?1721次閱讀

    Aryson--將電子郵件Gmail移動(dòng)到iCloud帳戶的最簡(jiǎn)單方法

    總的來說,除了這個(gè)原因之外,還有很多其他的原因?qū)?b class='flag-5'>郵件Gmail遷移到iCloud。進(jìn)步,讓我們討論一種有效和快速的方法來批量遷移Gmail
    的頭像 發(fā)表于 10-10 15:40 ?1847次閱讀

    谷歌Gmail將支持Gemini總結(jié)電子郵件內(nèi)容

    谷歌透露,Gemini 將協(xié)助 Workspace 和 Google One AI Premium 的用戶理解和處理電子郵件內(nèi)容。用戶可通過移動(dòng)應(yīng)用和網(wǎng)頁版 Gmail 使用 Gemini
    的頭像 發(fā)表于 05-15 11:11 ?1010次閱讀