0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

Facebook采用無(wú)監(jiān)督機(jī)器學(xué)習(xí)翻譯其平臺(tái)上內(nèi)容

EdXK_AI_News ? 來(lái)源:未知 ? 作者:工程師曾玲 ? 2018-10-02 17:36 ? 次閱讀

【概要】臉書(shū)公司開(kāi)始使用無(wú)監(jiān)督機(jī)器學(xué)習(xí)來(lái)為其用戶(hù)提供翻譯服務(wù)。

由于缺少?gòu)囊环N語(yǔ)言到另一種語(yǔ)言的很多翻譯示例——例如從英語(yǔ)到烏爾都語(yǔ)(Urdu),F(xiàn)acebook(臉書(shū))公司已經(jīng)開(kāi)始使用無(wú)監(jiān)督的機(jī)器學(xué)習(xí)來(lái)翻譯其平臺(tái)上的內(nèi)容。

Facebook人工智能研究院(FacebookAI Research,F(xiàn)AIR)巴黎實(shí)驗(yàn)室的主任Antoine Bordes表示:該方法由FAIR設(shè)計(jì),并由FAIR和Facebook的應(yīng)用機(jī)器學(xué)習(xí)部門(mén)合作用于其平臺(tái)。在實(shí)驗(yàn)中,該方法的表現(xiàn)與經(jīng)過(guò)10萬(wàn)次翻譯訓(xùn)練的有監(jiān)督模型相當(dāng),并且在翻譯示例很少的情況下,其表現(xiàn)優(yōu)于Facebook的語(yǔ)言匹配系統(tǒng)。Bordes說(shuō):“當(dāng)你處理像英語(yǔ)到烏爾都語(yǔ)這樣的案例很少的翻譯任務(wù)時(shí),我們系統(tǒng)的表現(xiàn)超過(guò)了有監(jiān)督的系統(tǒng)。因此,在沒(méi)有足夠數(shù)據(jù)的時(shí)候,訓(xùn)練無(wú)監(jiān)督系統(tǒng)比有監(jiān)督系統(tǒng)更好?!?/p>

由Facebook人工智能研究人員Guillaume Lample和Marc'Aurelio Ranzato領(lǐng)導(dǎo)的這項(xiàng)工作的成果將于今年秋季在EMNLP 2018上公布。作為FAIR的一名老員工,Bordes表示這項(xiàng)研究是他見(jiàn)過(guò)的最好的翻譯系統(tǒng)。Bordes說(shuō):“我們現(xiàn)在可以去一個(gè)使用未知語(yǔ)言的星球—或者說(shuō),跟外星人交談—你可以嘗試對(duì)他們所說(shuō)的內(nèi)容進(jìn)行合理的翻譯。你也可以從一本古老的手稿上找到尚未破譯的語(yǔ)言,你可以真正了解它的含義,因此這項(xiàng)工作真的在這些方面取得了突破,而這就是我如此興奮的原因。”

與FAIR的其他項(xiàng)目一樣,該AI系統(tǒng)將是開(kāi)源的,可以在GitHub上下載。今年早些時(shí)候,F(xiàn)acebook將Translate做了開(kāi)源,這是目前Facebook用來(lái)輔助翻譯的人工智能系統(tǒng)。Translate等系統(tǒng)需要大量的標(biāo)記數(shù)據(jù)。例如,完成從法語(yǔ)到英語(yǔ)的翻譯需要數(shù)百萬(wàn)個(gè)樣本句子來(lái)創(chuàng)建一個(gè)能夠理解這兩種語(yǔ)言的系統(tǒng)。因此,在缺少翻譯示例時(shí),翻譯工作是非常困難的。

當(dāng)前用于處理這種案例的人工智能系統(tǒng)結(jié)合了三個(gè)要素:逐字翻譯、語(yǔ)言模型和反向翻譯。逐字翻譯的訓(xùn)練原理為:根據(jù)一個(gè)句子中某個(gè)字的前面五個(gè)單詞和后面五個(gè)單詞來(lái)推測(cè)其上下文含義,然后對(duì)該單詞進(jìn)行預(yù)測(cè)。這個(gè)嵌入詞語(yǔ)的方法是在2017年秋天Lample和Ranzato共同撰寫(xiě)的一篇論文中提出的。然后,使用大量數(shù)據(jù)(如書(shū)籍或其他書(shū)面文本)訓(xùn)練的語(yǔ)言模型被用于按照英語(yǔ)或?yàn)鯛柖颊Z(yǔ)使用者能夠理解的結(jié)構(gòu)來(lái)安排句子。最后,使用反向翻譯來(lái)改進(jìn)通過(guò)逐字翻譯和語(yǔ)言模型獲得的翻譯結(jié)果。這些方法并不新鮮,但三者的結(jié)合的確是有效的。

Bordes稱(chēng):“使用這兩個(gè)系統(tǒng),并在兩種語(yǔ)言之間進(jìn)行雙向翻譯,我可以將它們進(jìn)行同時(shí)訓(xùn)練以獲得相互促進(jìn),所以真正核心思想是使用這些詞語(yǔ)(翻譯模型),利用該語(yǔ)言模型做第一次翻譯,然后用反向翻譯的方法嘗試進(jìn)行改進(jìn)。”

Facebook將在未來(lái)探索將這種人工智能系統(tǒng)用于其他形式的翻譯,但需要更多的數(shù)據(jù),并需要與專(zhuān)業(yè)翻譯人員合作來(lái)驗(yàn)證結(jié)果。

聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • Facebook
    +關(guān)注

    關(guān)注

    3

    文章

    1429

    瀏覽量

    54799
  • 機(jī)器學(xué)習(xí)

    關(guān)注

    66

    文章

    8423

    瀏覽量

    132746

原文標(biāo)題:臉書(shū)采用無(wú)監(jiān)督機(jī)器學(xué)習(xí)提供翻譯服務(wù)

文章出處:【微信號(hào):AI_News,微信公眾號(hào):人工智能快報(bào)】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏

    評(píng)論

    相關(guān)推薦

    如何選擇云原生機(jī)器學(xué)習(xí)平臺(tái)

    當(dāng)今,云原生機(jī)器學(xué)習(xí)平臺(tái)因其彈性擴(kuò)展、高效部署、低成本運(yùn)營(yíng)等優(yōu)勢(shì),逐漸成為企業(yè)構(gòu)建和部署機(jī)器學(xué)習(xí)應(yīng)用的首選。然而,市場(chǎng)上的云原生
    的頭像 發(fā)表于 12-25 11:54 ?117次閱讀

    構(gòu)建云原生機(jī)器學(xué)習(xí)平臺(tái)流程

    構(gòu)建云原生機(jī)器學(xué)習(xí)平臺(tái)是一個(gè)復(fù)雜而系統(tǒng)的過(guò)程,涉及數(shù)據(jù)收集、處理、特征提取、模型訓(xùn)練、評(píng)估、部署和監(jiān)控等多個(gè)環(huán)節(jié)。
    的頭像 發(fā)表于 12-14 10:34 ?142次閱讀

    HAL庫(kù)在Arduino平臺(tái)上的使用

    HAL庫(kù)在Arduino平臺(tái)上的使用 Arduino平臺(tái)是一個(gè)開(kāi)源的電子原型平臺(tái),它包括硬件(基于微控制器的電路板)和軟件(Arduino IDE)。Arduino平臺(tái)因其簡(jiǎn)單易用而受
    的頭像 發(fā)表于 12-02 14:04 ?336次閱讀

    什么是機(jī)器學(xué)習(xí)?通過(guò)機(jī)器學(xué)習(xí)方法能解決哪些問(wèn)題?

    來(lái)源:Master編程樹(shù)“機(jī)器學(xué)習(xí)”最初的研究動(dòng)機(jī)是讓計(jì)算機(jī)系統(tǒng)具有人的學(xué)習(xí)能力以便實(shí)現(xiàn)人工智能。因?yàn)闆](méi)有學(xué)習(xí)能力的系統(tǒng)很難被認(rèn)為是具有智能的。目前被廣泛
    的頭像 發(fā)表于 11-16 01:07 ?441次閱讀
    什么是<b class='flag-5'>機(jī)器</b><b class='flag-5'>學(xué)習(xí)</b>?通過(guò)<b class='flag-5'>機(jī)器</b><b class='flag-5'>學(xué)習(xí)</b>方法能解決哪些問(wèn)題?

    深度學(xué)習(xí)算法在嵌入式平臺(tái)上的部署

    隨著人工智能技術(shù)的飛速發(fā)展,深度學(xué)習(xí)算法在各個(gè)領(lǐng)域的應(yīng)用日益廣泛。然而,將深度學(xué)習(xí)算法部署到資源受限的嵌入式平臺(tái)上,仍然是一個(gè)具有挑戰(zhàn)性的任務(wù)。本文將從嵌入式平臺(tái)的特點(diǎn)、深度
    的頭像 發(fā)表于 07-15 10:03 ?1472次閱讀

    神經(jīng)網(wǎng)絡(luò)如何用無(wú)監(jiān)督算法訓(xùn)練

    神經(jīng)網(wǎng)絡(luò)作為深度學(xué)習(xí)的重要組成部分,訓(xùn)練方式多樣,其中無(wú)監(jiān)督學(xué)習(xí)是一種重要的訓(xùn)練策略。無(wú)監(jiān)督學(xué)習(xí)
    的頭像 發(fā)表于 07-09 18:06 ?833次閱讀

    深度學(xué)習(xí)中的無(wú)監(jiān)督學(xué)習(xí)方法綜述

    應(yīng)用中往往難以實(shí)現(xiàn)。因此,無(wú)監(jiān)督學(xué)習(xí)在深度學(xué)習(xí)中扮演著越來(lái)越重要的角色。本文旨在綜述深度學(xué)習(xí)中的無(wú)監(jiān)督學(xué)
    的頭像 發(fā)表于 07-09 10:50 ?803次閱讀

    機(jī)器學(xué)習(xí)算法原理詳解

    機(jī)器學(xué)習(xí)作為人工智能的一個(gè)重要分支,目標(biāo)是通過(guò)讓計(jì)算機(jī)自動(dòng)從數(shù)據(jù)中學(xué)習(xí)并改進(jìn)性能,而無(wú)需進(jìn)行明確的編程。本文將深入解讀幾種常見(jiàn)的
    的頭像 發(fā)表于 07-02 11:25 ?1117次閱讀

    基于FPGA的類(lèi)腦計(jì)算平臺(tái) —PYNQ 集群的無(wú)監(jiān)督圖像識(shí)別類(lèi)腦計(jì)算系統(tǒng)

    STDP 無(wú)監(jiān)督學(xué)習(xí)算法,可運(yùn)用于圖像的 無(wú)監(jiān)督分類(lèi)。 從平臺(tái)設(shè)計(jì)角度: (1)本設(shè)計(jì)搭建的基于 PYNQ 集群的通用低功耗的大規(guī)
    發(fā)表于 06-25 18:35

    開(kāi)源項(xiàng)目!設(shè)計(jì)一款智能手語(yǔ)翻譯眼鏡

    這個(gè)項(xiàng)目是一款創(chuàng)新的智能手語(yǔ)翻譯眼鏡,它能夠?qū)崟r(shí)地將手語(yǔ)轉(zhuǎn)換為聽(tīng)得見(jiàn)的語(yǔ)音。這款眼鏡采用了VIAM平臺(tái)和樹(shù)莓派Zero 2 W,能夠幫助聾人或聽(tīng)力受損的人士更自由、獨(dú)立地與他人交流,減少對(duì)第三方
    發(fā)表于 05-20 15:59

    機(jī)器學(xué)習(xí)怎么進(jìn)入人工智能

    ,人工智能已成為一個(gè)熱門(mén)領(lǐng)域,涉及到多個(gè)行業(yè)和領(lǐng)域,例如語(yǔ)音識(shí)別、機(jī)器翻譯、圖像識(shí)別等。 在編程中進(jìn)行人工智能的關(guān)鍵是使用機(jī)器學(xué)習(xí)算法,這是一類(lèi)基于樣本數(shù)據(jù)和模型訓(xùn)練來(lái)進(jìn)行預(yù)測(cè)和判斷的算法。下面將介紹使用
    的頭像 發(fā)表于 04-04 08:41 ?342次閱讀

    廣和通發(fā)布機(jī)器人開(kāi)發(fā)平臺(tái)

    廣和通近日隆重發(fā)布了全新研發(fā)的具身智能機(jī)器人開(kāi)發(fā)平臺(tái)——Fibot。該平臺(tái)旨在滿(mǎn)足客戶(hù)在驗(yàn)證Mobile ALOHA協(xié)同學(xué)習(xí)與簡(jiǎn)單示教操作
    的頭像 發(fā)表于 03-29 09:34 ?646次閱讀

    能在Meteor Lake平臺(tái)上使用SDK 3.5嗎?

    SDK 是 3.6 版,不支持 CYPD6127 部件。 那么,我能在 Meteor Lake 平臺(tái)上使用 SDK 3.5 嗎? SDK 3.5 - 平臺(tái)選擇有"MTL" 關(guān)鍵字 :
    發(fā)表于 03-04 06:32

    把CY8C4146平臺(tái)上工程移植到CY8C4147平臺(tái)上,用戶(hù)程序沒(méi)運(yùn)行的原因?

    客戶(hù)現(xiàn)在想把CY8C4146平臺(tái)上工程移植到CY8C4147平臺(tái)上,在topdesign重新選擇4147,管腳也調(diào)整了一下,編譯重新生成底層代碼,creator4.2IDE編譯沒(méi)報(bào)錯(cuò),同時(shí)同步更新
    發(fā)表于 02-21 06:04

    Meta發(fā)布新型無(wú)監(jiān)督視頻預(yù)測(cè)模型“V-JEPA”

    Meta,這家社交媒體和科技巨頭,近日宣布推出一種新型的無(wú)監(jiān)督視頻預(yù)測(cè)模型,名為“V-JEPA”。這一模型在視頻處理領(lǐng)域引起了廣泛關(guān)注,因?yàn)樗ㄟ^(guò)抽象性預(yù)測(cè)生成視頻中缺失或模糊的部分來(lái)進(jìn)行學(xué)習(xí),提供了一種全新的視頻處理方法。
    的頭像 發(fā)表于 02-19 11:19 ?1032次閱讀