0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

為了到2025年實(shí)現(xiàn)采用AI的實(shí)時(shí)同聲傳譯,日本正推進(jìn)研究

ss ? 來源:日經(jīng)中文網(wǎng) ? 作者:日經(jīng)中文網(wǎng) ? 2021-01-20 14:47 ? 次閱讀

為了到2025年實(shí)現(xiàn)采用人工智能AI)的實(shí)時(shí)同聲傳譯,日本正推進(jìn)研究。目前已完全可以實(shí)現(xiàn)語音識別,以后的目標(biāo)是提高翻譯準(zhǔn)確率和速度。世界上有很多和日語具有相同特征的語言,如果能實(shí)現(xiàn)日語的同聲傳譯,就有望推進(jìn)國際性普及。

演講者用英語做大約1分鐘的演講,背后的屏幕上顯示出基于AI的日語同聲傳譯。這是日本情報(bào)通信研究機(jī)構(gòu)(NICT,注:日語的“情報(bào)”有“信息”之意)2020年11月舉行的發(fā)布會上的一幕。從演講者發(fā)言到出現(xiàn)譯文大約需要10秒,但幾乎沒有翻譯錯誤。

同聲傳譯一般是對說話內(nèi)容進(jìn)行語音識別,然后由使用AI的翻譯軟件將其轉(zhuǎn)換成其他語言。現(xiàn)有的服務(wù)大多是從說完話才開始翻譯。因此,語速快的對話很難翻譯,表達(dá)相同的內(nèi)容時(shí),同聲傳譯所用時(shí)間是母語會話時(shí)間的2倍。按這樣的水平很難用于商務(wù)用途,亟需可以克服這一缺點(diǎn)的技術(shù)。

現(xiàn)在同聲傳譯的翻譯準(zhǔn)確率提高,但存在延時(shí)

日本情報(bào)通信研究機(jī)構(gòu)通過2019年度之前的日本國家研究項(xiàng)目,已在語音識別方面實(shí)現(xiàn)了充分的性能。該機(jī)構(gòu)的目標(biāo)是從2020年度開始兼顧翻譯準(zhǔn)確率和速度。發(fā)布會上有10秒的延時(shí),但今后有望縮小到跟同聲傳譯人員相當(dāng)?shù)?、3秒。

日本情報(bào)通信研究機(jī)構(gòu)開發(fā)的是在發(fā)言過程中就可以開始翻譯的AI。斷句的預(yù)處理技術(shù)是其中的關(guān)鍵。

翻譯軟件由斷句的預(yù)處理和對句子進(jìn)行翻譯的翻譯引擎構(gòu)成?,F(xiàn)有技術(shù)要想順暢翻譯,只能以句子單位進(jìn)行斷句,因此會有延時(shí)。如果在說完話之前就開始翻譯,則可以縮短時(shí)差。

日本情報(bào)通信研究機(jī)構(gòu)在預(yù)處理中采用按“語塊”(chunk,或稱:語義塊)斷句的方法,比以句子為單位斷句翻譯得更精準(zhǔn)。專業(yè)的同聲傳譯人員也使用這種方法。這樣可以保證翻譯準(zhǔn)確度,并減少延時(shí)。

日本情報(bào)通信研究機(jī)構(gòu)在開發(fā)中將使用大量的數(shù)據(jù)。該機(jī)構(gòu)在2021年度末之前,將從同聲傳譯人員等手中收集劃分語義的位置及其譯文的數(shù)據(jù)。2022年度將開發(fā)按照語義斷句并翻譯的AI。

與英譯日相比,日譯英的同聲傳譯難度更高。因?yàn)閿嗑涞念A(yù)處理比較難。

在日語中,動詞及表示否定等的重要詞語出現(xiàn)在句尾,因此需要預(yù)讀,然后進(jìn)行翻譯。而動詞等關(guān)鍵詞語在句子前半部分出現(xiàn)的英語等更好翻譯。在日語中,句子省略主語的情況也很多,AI要補(bǔ)充完整句子以后再翻譯,因此容易出錯。

為了防止誤譯,需要進(jìn)行修正的技術(shù)。比如提前給AI提供演講內(nèi)容相關(guān)數(shù)據(jù),讓它進(jìn)行學(xué)習(xí),它就能夠讀懂后面要說的話,從而更準(zhǔn)確地完成同聲傳譯。

日本情報(bào)通信研究機(jī)構(gòu)還將改進(jìn)翻譯引擎。通過日英、英日及所有語言翻譯都使用的技術(shù)來控制翻譯準(zhǔn)確度。如果這項(xiàng)性能不高,即使預(yù)處理速度再快、修正功能出色,也起不到作用。

日本情報(bào)通信研究機(jī)構(gòu)的翻譯引擎除了市售的便攜式翻譯機(jī)以外,還被松下、NTT docomo及NEC等的語音翻譯服務(wù)采用。該機(jī)構(gòu)的研究員隅田英一郎自信地說“英日翻譯準(zhǔn)確率換算成托業(yè)考試(TOEIC)分?jǐn)?shù)的話,相當(dāng)于900分左右”。

在提高翻譯準(zhǔn)確率方面值得期待的是,得到美國特斯拉首席執(zhí)行官(CEO)馬斯克等人資助的研究企業(yè)OpenAI在2020年6月公布了語言AI“GPT-3”。這款A(yù)I可以寫出跟人水平接近的比較自然的文章。

GPT-3利用巨大的“大腦”學(xué)習(xí)大量文件,獲得了很強(qiáng)的能力。開發(fā)中使用的數(shù)據(jù)相當(dāng)于數(shù)千億詞匯量。如果能在翻譯引擎中應(yīng)用GPT-3的系統(tǒng),就有可能大幅提高性能。

圍繞同聲傳譯,全球的大型IT企業(yè)都在競爭,不過日本情報(bào)通信研究機(jī)構(gòu)仍有勝算。隅田研究員指出“美國微軟、中國百度及美國谷歌都是以句子為單位進(jìn)行斷句,以語塊斷句的方法尚未取得成果。都在同一水平上”。各公司都在下力氣開發(fā)的中英語同聲傳譯也跟日本情報(bào)通信研究機(jī)構(gòu)開發(fā)一樣,存在10秒左右的延時(shí)。

如果能實(shí)現(xiàn)日語翻成其他主要語言的同聲傳譯,在國際上就會占據(jù)優(yōu)勢。

英語、中文及法語等使用人數(shù)較多的語言都是動詞跟在名詞后面的類型。占到全球語言的約4成。其實(shí),世界上有一半語言和日語一樣,把動詞放在句尾。同類型的語言之間更容易實(shí)現(xiàn)同聲傳譯。如果在不同類型語言之間的同聲傳譯方面,能開發(fā)出優(yōu)異的技術(shù),則有可能應(yīng)用于9成的語言。

責(zé)任編輯:xj

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報(bào)投訴
  • AI
    AI
    +關(guān)注

    關(guān)注

    87

    文章

    31028

    瀏覽量

    269365
  • 人工智能
    +關(guān)注

    關(guān)注

    1792

    文章

    47373

    瀏覽量

    238859
  • 翻譯
    +關(guān)注

    關(guān)注

    0

    文章

    47

    瀏覽量

    10789
收藏 人收藏

    評論

    相關(guān)推薦

    NVIDIA展望2025AI的應(yīng)用前景

    AI 重塑著各行各業(yè),從醫(yī)療健康電信,從媒體娛樂到零售,其身影無處不在。NVIDIA 的多位專家從不同行業(yè)出發(fā),對 2025
    的頭像 發(fā)表于 01-03 11:43 ?281次閱讀

    中科創(chuàng)達(dá)RUBIK AI Glass Lite版預(yù)計(jì)2025實(shí)現(xiàn)量產(chǎn)

    AI眼鏡點(diǎn)燃了市場的熱情,成為全球關(guān)注的焦點(diǎn)。中科創(chuàng)達(dá)最新推出的RUBIK AI Glass Lite版解決方案,很好地滿足了當(dāng)下AI眼鏡在時(shí)尚、輕量化及自然語言交互方面的市場需求。目前,RUBIK
    的頭像 發(fā)表于 12-27 10:57 ?276次閱讀

    AI加速采用推動存儲器市場2025顯著增長

    近日,據(jù)市調(diào)機(jī)構(gòu)TechInsights發(fā)布的最新報(bào)告,存儲器市場,特別是DRAM和NAND兩大領(lǐng)域,預(yù)計(jì)在2025實(shí)現(xiàn)顯著增長。這一增長趨勢主要得益于人工智能(AI)及相關(guān)技術(shù)的
    的頭像 發(fā)表于 12-26 14:43 ?246次閱讀

    NVIDIA AI加速推進(jìn)藥物研發(fā)

    在當(dāng)前的醫(yī)療健康領(lǐng)域,AI 的重要性愈發(fā)凸顯。NVIDIA AI 加速推進(jìn)藥物研發(fā),致力于減少藥物的研發(fā)時(shí)間和成本,使更多的老年患者能夠更快獲得關(guān)鍵治療。
    的頭像 發(fā)表于 11-19 16:07 ?250次閱讀

    小米隱秘布局AI眼鏡,預(yù)計(jì)2025Q2發(fā)布

    小米秘密籌備新一代AI眼鏡,并與歌爾股份展開合作,預(yù)計(jì)該產(chǎn)品將于2025第二季度正式發(fā)布。據(jù)小米創(chuàng)始人雷軍透露,他對這款AI眼鏡的出貨量
    的頭像 發(fā)表于 11-14 16:41 ?540次閱讀

    廣州市積極推進(jìn)新型儲能產(chǎn)業(yè) 儲能產(chǎn)業(yè)2025力爭達(dá)600億元以上

    日前《廣州市推進(jìn)新型儲能產(chǎn)業(yè)園區(qū)建設(shè)實(shí)施方案》出爐,據(jù)悉,廣州市加大力氣推動儲能產(chǎn)業(yè)發(fā)展,新型儲能產(chǎn)業(yè)營業(yè)收入力爭2025達(dá)600億元
    的頭像 發(fā)表于 11-07 15:53 ?435次閱讀

    美光預(yù)測AI需求將大幅增長,計(jì)劃2025投產(chǎn)EUV DRAM

    隨著人工智能技術(shù)日益普及,從云端服務(wù)器拓展至消費(fèi)級設(shè)備,對高級內(nèi)存的需求持續(xù)攀升。鑒于此趨勢,美光科技已將其高帶寬內(nèi)存(HBM)的全部產(chǎn)能規(guī)劃至2025。美光科技的中國臺灣業(yè)務(wù)負(fù)責(zé)人兼公司副總裁Donghui Lu指出,公司
    的頭像 發(fā)表于 10-26 15:22 ?734次閱讀

    AI同聲傳譯技術(shù)的新興力量知了未來已推動跨語言溝通革新

    知了未來:AI同聲傳譯領(lǐng)域的創(chuàng)新力量 在AI同聲傳譯領(lǐng)域,大家可能首先想到的是行業(yè)巨頭,然而,一家來自倫敦的小型華人研發(fā)團(tuán)隊(duì)——知了未來,憑借其最新推出的
    的頭像 發(fā)表于 10-18 09:21 ?304次閱讀

    中興通訊全場景AI終端應(yīng)用與裸眼3D新品亮相

    ”的產(chǎn)品戰(zhàn)略與理念,終端業(yè)務(wù)六大AI主題展示吸引了眾多關(guān)注,內(nèi)容覆蓋全球領(lǐng)先的AI裸眼3D、AI同聲傳譯和方言互譯、AI安全反詐、
    的頭像 發(fā)表于 10-15 10:00 ?928次閱讀

    AI同聲傳譯讓你瞬間掌握60種語言的那一天會發(fā)生什么事情?

    隨著AI技術(shù)的快速發(fā)展,語言不再是溝通的障礙。最新的AI同聲傳譯技術(shù)的突破,讓每個(gè)人都可以在不同語言環(huán)境下無縫交流,不必?fù)?dān)心語言差異帶來的不便。這種技術(shù)讓每個(gè)普通人隨時(shí)“攜帶”一個(gè)專屬的同聲傳
    的頭像 發(fā)表于 10-10 09:33 ?323次閱讀
    <b class='flag-5'>AI</b><b class='flag-5'>同聲傳譯</b>讓你瞬間掌握60種語言的那一天會發(fā)生什么事情?

    中興系列終端亮相2024世界人工智能大會

    業(yè)務(wù)圍繞AI裸眼3D、AI同聲傳譯與方言互譯、AI安全反詐、AI智慧商務(wù)與創(chuàng)作、紅魔AI游戲魔方
    的頭像 發(fā)表于 07-05 11:19 ?725次閱讀

    Arm計(jì)劃2025大規(guī)模銷售AI芯片

    軟銀集團(tuán)旗下的英國芯片巨頭Arm近日公布了其雄心勃勃的AI芯片銷售計(jì)劃。該公司宣布,計(jì)劃到2025實(shí)現(xiàn)AI芯片的大規(guī)模銷售,以進(jìn)一步鞏固其
    的頭像 發(fā)表于 05-20 10:48 ?636次閱讀

    Arm預(yù)計(jì)2025推出首款AI芯片

    全球知名的芯片設(shè)計(jì)公司安謀(Arm Holdings)正在積極籌劃其首款AI芯片的研發(fā),預(yù)計(jì)于2025正式推向市場。為了實(shí)現(xiàn)這一目標(biāo),Arm決定成立一個(gè)專門的
    的頭像 發(fā)表于 05-14 11:10 ?678次閱讀

    SK海力士稱AI存儲芯片2025訂單幾乎已滿

    SK海力士CEO郭魯近日在公開場合表示,AI存儲芯片的市場需求正在迅猛增長,預(yù)計(jì)至2025的訂單已接近飽和。他強(qiáng)調(diào),雖然目前AI主要服務(wù)
    的頭像 發(fā)表于 05-08 10:28 ?529次閱讀

    蘋果自研AI服務(wù)器芯片,預(yù)計(jì)2025臺積電3nm工藝

    4 月 24 日,知名數(shù)碼博主@手機(jī)晶片達(dá)人發(fā)布動態(tài),爆料蘋果研發(fā)自家 AI 服務(wù)器芯片,預(yù)計(jì) 2025 年下半年量產(chǎn),采用臺積電 3nm 制程。
    的頭像 發(fā)表于 04-24 11:00 ?912次閱讀