0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

機器翻譯的真實水平如何,夢想與現(xiàn)實的距離到底有多遠?

mK5P_AItists ? 來源:lp ? 2019-03-22 14:08 ? 次閱讀

摘要:近年來,機器翻譯等語言智能技術(shù)迅猛發(fā)展,語言智能技術(shù)落地、機器翻譯替代人工、外語教育存廢、外語教學改革等,成為社會熱議話題。外語教育如何將語言智能的挑戰(zhàn)作為轉(zhuǎn)型的契機更好發(fā)展?怎樣理性認識語言智能技術(shù)的發(fā)展未來?聚焦"語言智能與外語教育協(xié)同發(fā)展",自動化所宗成慶研究員這樣說......

如何突破語言障礙,讓機器完成不同語言之間的自動翻譯,最終實現(xiàn)任意時間、任意地點、任意語言之間的無障礙自由通信,是人類長期以來的夢想。

近年來,隨著計算機性能的提高,云計算、大數(shù)據(jù)和機器學習等相關(guān)技術(shù)迅速發(fā)展,人工智能再度崛起,機器翻譯重新成為人們關(guān)注的焦點。一時間,機器翻譯系統(tǒng)如雨后春筍般涌現(xiàn),各種報道隨之呈井噴式爆發(fā),"機器翻譯將取代人類"的說法也時有耳聞。然而,機器翻譯的真實水平如何,夢想與現(xiàn)實的距離到底有多遠?

從低迷到興盛

機器翻譯概念于1947年被提出,隨后成為人工智能研究的核心問題。在70多年的發(fā)展歷程中,機器翻譯研究經(jīng)歷了幾個不同的歷史階段:

從概念提出到1954年美國喬治敦大學(GeorgetownUniversity)在IBM公司的幫助下實現(xiàn)第一個機器翻譯演示系統(tǒng),可以認為是機器翻譯的初創(chuàng)時期。

1966年,美國國家科學院語言自動處理咨詢委員會(AutomaticLanguageProcessingAdvisoryCommittee,ALPAC)發(fā)布題為《語言與機器》的報告,宣稱"目前給機器翻譯研究以大力支持沒有太多的理由","機器翻譯遇到了難以克服的語義障礙",從而導(dǎo)致機器翻譯研究在世界范圍內(nèi)走向低迷。

20世紀70年代中后期至80年代前期,部分機器翻譯系統(tǒng)在特定領(lǐng)域得到初步應(yīng)用(如加拿大蒙特利爾大學研制的天氣預(yù)報翻譯系統(tǒng)TAUM-METEO)。歐洲共同體實施的歐洲翻譯體系(EuropeanTranslationSystem,EUROTRA)計劃和日本對第五代計算機的研究都對機器翻譯研究給予了支持,機器翻譯研究開始復(fù)蘇。

20世紀80年代末期,IBM公司實現(xiàn)了基于噪聲信道模型的統(tǒng)計機器翻譯系統(tǒng),并在美國國防部高級研究計劃署(ARPA)組織的評測中取得了較好成績,推動了機器翻譯技術(shù)的快速發(fā)展。尤其進入2000年之后,GIZA++、Pharaoh、Moses等一批開源工具相繼發(fā)布,2006年谷歌翻譯正式上線運行,2011年百度翻譯上線,各大公司陸續(xù)推出了自己的翻譯系統(tǒng),整個機器翻譯領(lǐng)域呈現(xiàn)出蓬勃發(fā)展、遍地開花的大好局面。

2013年基于神經(jīng)網(wǎng)絡(luò)模型的機器翻譯(簡稱"神經(jīng)機器翻譯")方法被提出,機器譯文的質(zhì)量得到大幅提升,并且很多開源工具被相繼公布,機器翻譯技術(shù)研究和系統(tǒng)推廣應(yīng)用均出現(xiàn)前所未有的盛況。統(tǒng)計機器翻譯和神經(jīng)機器翻譯的基本原理都是基于已有的大規(guī)模句子級雙語對照語料進行模型訓(xùn)練,建立最優(yōu)的翻譯模型,最終實現(xiàn)從一種語言到另一種語言的翻譯。通常情況下,用于訓(xùn)練模型的語料規(guī)模越大,模型性能表現(xiàn)就越好。

被夸大的技術(shù)

機器翻譯技術(shù)的進步和系統(tǒng)性能的提升在為人們?nèi)粘I詈凸ぷ鲙砀啾憷耐瑫r,也為該技術(shù)的產(chǎn)業(yè)化發(fā)展帶來了更多商機。這種空前局面不僅讓人們看到了夢想成真的希望,也點燃了部分人心中按捺不住的欲望。從傳統(tǒng)媒體到新媒體,對機器翻譯技術(shù)夸大宣傳的聲音不絕于耳,但一個不可否認的事實卻是,目前的機器翻譯技術(shù)尚不成熟,無論是文本翻譯,還是口語翻譯,機器翻譯的質(zhì)量遠沒有達到令人滿意的水平。

當前所有的商用文本機器翻譯系統(tǒng)普遍存在的問題:

一是錯翻、漏翻和重復(fù)翻譯比比皆是,尤其對成語、縮略語、專業(yè)術(shù)語和人名、地名、組織機構(gòu)名稱等的翻譯更是招數(shù)無幾。

二是難以實現(xiàn)篇章范圍內(nèi)的指代消解,常常張冠李戴,例如,前面說的是美國與伊朗之間的事情,后面翻譯"美伊兩國"時卻譯成了美國與伊拉克。

三是缺乏足夠的在線優(yōu)化能力,無法從譯員修改譯文的過程中自動學習和更新翻譯知識,即使譯員對系統(tǒng)給出的某個錯誤譯文反復(fù)修改,系統(tǒng)依然照錯不誤。

四是對口語而言,說話人的語氣、重音、語調(diào),甚至肢體語言無法得到充分利用,尤其當說話人的口音較重、用詞過于生僻、話語主題超出先驗知識范圍時,譯文的質(zhì)量無法保障。

高端翻譯不可取代

我們并不否認機器翻譯技術(shù)的進步,正如前文所述,機器譯文的質(zhì)量已有顯著改善。在日常口語對話中,對于資源較為充分的語言(如英漢、日漢等),在說話場景不是非常復(fù)雜、口音基本標準、語速基本正常、使用詞匯和句型不是非常生僻的情況下,口語翻譯的性能基本可滿足正常交流的需要。專業(yè)領(lǐng)域的文本機器翻譯在訓(xùn)練語料較為充分時,譯文準確率可達到80%以上。而對于資源匱乏的語言之間的翻譯(如波斯語或達利語等與漢語之間的翻譯),譯文質(zhì)量還十分有限。

毋庸置疑,機器翻譯可能替代那些任務(wù)重復(fù)性較大、翻譯難度較低的低端翻譯人員,如天氣預(yù)報查詢、旅館預(yù)訂服務(wù)、交通信息咨詢等翻譯,但不可能取代高端翻譯(如重要文獻、偉人著作、文學名著等翻譯)人員,更不可能消除翻譯職業(yè)。"信、達、雅"是翻譯的終極目標,我們可以預(yù)期,未來的機器翻譯系統(tǒng)能夠輔助高端翻譯人員提高翻譯效率,但要實現(xiàn)無須人工干預(yù)的高質(zhì)量全自動翻譯恐怕還是一個愿望。

不得不說的是,任何負責任的科學家和企業(yè)界都有責任和義務(wù)把技術(shù)或產(chǎn)品的真實水平和性能告知公眾,而不是一味地宣揚,甚至為了利益而故弄玄虛。實事求是是一種態(tài)度,也是一種品格。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 自動化
    +關(guān)注

    關(guān)注

    29

    文章

    5585

    瀏覽量

    79323
  • 機器學習
    +關(guān)注

    關(guān)注

    66

    文章

    8420

    瀏覽量

    132687
  • 機器翻譯
    +關(guān)注

    關(guān)注

    0

    文章

    139

    瀏覽量

    14886

原文標題:機器翻譯技術(shù)現(xiàn)狀評述與展望 | 行業(yè)觀察

文章出處:【微信號:AItists,微信公眾號:人工智能學家】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏

    評論

    相關(guān)推薦

    差分輸入和和單端輸入在本質(zhì)上到底有什么區(qū)別?

    和和單端輸入在本質(zhì) 上到底有什么區(qū)別? 因為,ADC采集的信號說到底是AINP - AINN,不管單端還是差分,采集的信號都是這兩個pad的差值。 2:將單端信號接在ADC的差分輸入接口上可以用
    發(fā)表于 12-23 07:31

    TFP401APZP到底有沒有HSYNC輸出?

    請教下TI的大牛,TFP401APZP這顆IC到底有沒有HSYNC輸出?實測發(fā)現(xiàn)HSYNC無輸出,是要做什么設(shè)置么?!
    發(fā)表于 12-20 07:28

    RTOS與Linux到底有什么區(qū)別

    很多做嵌入式開發(fā)的小伙伴都存在這樣的疑惑:RTOS與Linux到底有什么區(qū)別?
    的頭像 發(fā)表于 10-29 09:53 ?460次閱讀

    CMOS運放的輸入阻抗到底有多高呢?

    都說CMOS運放輸入阻抗高,到底有多高呢?可有一個量化指標?
    發(fā)表于 09-06 06:59

    求助,這個電路U1A運放同相端的R1電阻到底有什么作用啊?

    想問下這個電路U1A運放同相端的R1電阻到底有什么作用?。亢苡魫?。
    發(fā)表于 08-27 07:09

    無人機智能巡檢系統(tǒng)到底有哪些作用

    無人機智能巡檢系統(tǒng)到底有哪些作用? 隨著科技的不斷發(fā)展,無人機已經(jīng)在光伏、風電、農(nóng)業(yè)、水利、城市管理、地質(zhì)等領(lǐng)域廣泛應(yīng)用,無人機智能巡檢系統(tǒng)的應(yīng)用,為巡檢工作帶來了革命行的變革,那么無人機智能巡檢
    的頭像 發(fā)表于 08-19 16:49 ?345次閱讀
    無人機智能巡檢系統(tǒng)<b class='flag-5'>到底有</b>哪些作用

    nlp自然語言處理的應(yīng)用哪些

    的應(yīng)用。以下是一些NLP的主要應(yīng)用領(lǐng)域,以及它們在各個領(lǐng)域的具體應(yīng)用。 機器翻譯 機器翻譯是NLP的一個重要應(yīng)用領(lǐng)域。它利用計算機自動將一種語言的文本翻譯成另一種語言。這在全球化的今天尤為重要,因為它可以幫助人們跨越語言障礙,進
    的頭像 發(fā)表于 07-05 09:55 ?2652次閱讀

    ESP32的BLE最大通信距離多遠

    ESP32-S3官方模塊的藍牙在PCB板載天線,外置天線的不同情況下,125K,500K,1M,2M的不同速率下,通信距離最大可達多遠? ESP32的BLE最大通信距離
    發(fā)表于 07-01 07:22

    EWSTM8-2201 or 3101安裝說明上有的說選“是”,有的說選“否”,二者到底有什么區(qū)別?對工程什么影響?

    the installation. ......... 安裝說明上有的說選“是”,有的說選“否”,二者到底有什么區(qū)別?對工程什么影響?
    發(fā)表于 04-28 08:08

    網(wǎng)橋傳輸距離多遠?

    網(wǎng)橋(Bridge)是一種早期的兩端口二層網(wǎng)絡(luò)設(shè)備,用來連接不同網(wǎng)段。網(wǎng)橋的兩個端口分別有一條獨立的交換信道,不是共享一條背板總線,可隔離沖突域。 網(wǎng)橋傳輸距離多遠? 網(wǎng)橋的傳輸距離因傳輸環(huán)境和設(shè)備
    的頭像 發(fā)表于 04-02 15:57 ?2043次閱讀

    ST60 GHz RF收發(fā)器能傳輸多遠距離?

    看了ST60 GHz RF收發(fā)器之后,同時集成發(fā)送和接收路徑,想知道ST60能傳輸多遠距離?哪位大神知道!
    發(fā)表于 04-02 06:59

    網(wǎng)線到底有多少種連接器

    我們在談?wù)摼W(wǎng)線的時候,聊得最多的,一定是它的連接器,它在連接過程中扮演著極為重要的角色。網(wǎng)線到底有多少種連接器?本期我們將從工業(yè)級使用出發(fā),來看看這根似乎普通的網(wǎng)線,在連接器上有多么努力。
    的頭像 發(fā)表于 01-26 10:06 ?622次閱讀

    NUC123的USB外設(shè)到底有沒有DMA功能?

    下載最新的TRM 1.07: 在最先前的描述以及USB的寄存器章節(jié)都有DMA相關(guān)的內(nèi)容。但是DMA那一章節(jié)里的框圖沒有USB外設(shè)。同時關(guān)于USB外設(shè)DMA的用法也沒具體說明。所以USB外設(shè)到底有沒DMA功能,若是該怎么用?
    發(fā)表于 01-16 08:26

    全固態(tài)電池到底有哪些閃光點?

    全固態(tài)電池到底有哪些閃光點? 全固態(tài)電池是一種新型的電池技術(shù),相比傳統(tǒng)液態(tài)電池,具有許多閃光點。下面我將詳細介紹這些閃光點。 首先,全固態(tài)電池具有更高的安全性。傳統(tǒng)液態(tài)電池中使用的有機電解液容易引發(fā)
    的頭像 發(fā)表于 01-09 17:09 ?771次閱讀

    AD7280AWBSTZ和AD7280ABSTZ之間到底有什么區(qū)別?

    替代嗎?在網(wǎng)上找到的兩個芯片的相關(guān)數(shù)據(jù)都是一樣的,AD7280AWBSTZ和AD7280ABSTZ之間到底有什么區(qū)別?
    發(fā)表于 01-08 06:36