国产一本到在线视频观看,日产精品一致六区搬运,欧美aⅴ精品一区二区三区

科大訊飛日前在全球最具影響力的口語機(jī)器翻譯評測比賽IWSLT中，獲得了語音翻譯端到端模型評測的冠軍，還成為英德口語翻譯任務(wù)中唯一受邀做Oral report的參賽團(tuán)隊(duì)。端到端技術(shù)是當(dāng)前語音翻譯的研究前沿，科大訊飛聯(lián)合優(yōu)化語音識別和機(jī)器翻譯的新技術(shù)路線，理論上更具前景，一旦技術(shù)研究成功，將為翻譯機(jī)器性能的提升帶來極大促進(jìn)。

提問：語音翻譯涉及哪些步驟？

你或許會說，語音識別和機(jī)器翻譯——沒錯(cuò)，傳統(tǒng)的語音翻譯通常采用語音識別和機(jī)器翻譯級聯(lián)的方式實(shí)現(xiàn)，對輸入語音先進(jìn)行語音識別得到文本結(jié)果，然后再基于文本進(jìn)行機(jī)器翻譯，這也是當(dāng)前語音翻譯采用的主流方法。

不過，由于口語句子中含有大量非規(guī)范語言現(xiàn)象，例如重復(fù)、省略、顛倒，以及語義邏輯不清，斷句困難等問題，導(dǎo)致后續(xù)機(jī)器翻譯帶來嚴(yán)重的挑戰(zhàn)。此外，復(fù)雜環(huán)境下語音識別受發(fā)音人口音、環(huán)境噪聲，以及和語言中存在的同音詞、易混淆詞等復(fù)雜音素的影響也存在著識別錯(cuò)誤，對最終機(jī)器翻譯性能也可能帶來影響。

因此，實(shí)際應(yīng)用系統(tǒng)中，通常會在語音識別和機(jī)器翻譯之間增加一個(gè)語音識別后處理模塊，通過對識別結(jié)果進(jìn)行規(guī)整、斷句、順滑、標(biāo)點(diǎn)預(yù)測，甚至糾錯(cuò)來盡可能地減小口語化和識別錯(cuò)誤的影響。

不過，受語音和語言復(fù)雜性的影響，截止到目前為止，這些問題并沒有被真正解決。

在剛剛結(jié)束的2018年國際口語機(jī)器翻譯評測比賽（International Workshop on Spoken Language Translation，IWSLT）中，科大訊飛團(tuán)隊(duì)在端到端模型（End-to-End Model）的評測比賽中，以顯著優(yōu)勢奪得第一名。該獎(jiǎng)項(xiàng)也是科大訊飛今年在各項(xiàng)國際競賽中的第9個(gè)“世界冠軍”。

端到端語音翻譯技術(shù)路線，是通過構(gòu)造一個(gè)完整的神經(jīng)網(wǎng)絡(luò)模型，聯(lián)合優(yōu)化語音識別、識別后處理和機(jī)器翻譯，建立源語言語音信號到目標(biāo)語言文字的映射關(guān)系，進(jìn)而實(shí)現(xiàn)從原始語音到目標(biāo)譯文的翻譯。

這提供了一種解決語音翻譯的新思路，而且從目前看是初步可行的。一旦技術(shù)研究成功，理論上可以讓語音翻譯更準(zhǔn)更快，未來也將為翻譯機(jī)器性能的提升帶來極大促進(jìn)。

國際頂級口語機(jī)器翻譯評測比賽 IWSLT，推動(dòng)語音翻譯新方向

IWSLT是國際上最具影響力的口語機(jī)器翻譯評測比賽之一，重點(diǎn)關(guān)注口語，實(shí)現(xiàn)語音到文本的翻譯，從而解決人和人交流的問題。

到目前為止，IWSLT已經(jīng)舉辦了15屆，吸引了全球70多家科研團(tuán)隊(duì)的參與。IWSLT針對語音翻譯實(shí)際應(yīng)用面臨的難題，通過每年設(shè)定一些研究任務(wù)，并向外界提供公開的數(shù)據(jù)集合和評測交流機(jī)會，吸引了來自全球的科研團(tuán)隊(duì)參與，對于推動(dòng)語音翻譯技術(shù)創(chuàng)新和知識共享具有重要的意義。

除了科大訊飛，IWSLT 2018吸引了世界各地多所機(jī)器翻譯領(lǐng)域的知名大學(xué)及研究所參加，包括英國愛丁堡大學(xué)（University of Edinburgh）、美國約翰霍普金斯大學(xué)（JHU）、德國卡爾斯魯厄理工學(xué)院（KIT）、意大利Bruno Kessler 基金會（FBK）、芬蘭赫爾辛基大學(xué)（Helsinki），以及國內(nèi)的阿里巴巴、搜狗等。

本次比賽包括兩個(gè)主要任務(wù)，一是英語到德語演講場景下的語音翻譯任務(wù)；二是巴斯克語到英語的低資源文本翻譯任務(wù)。

其中，在英語到德語的語音翻譯任務(wù)上，主辦方在今年提出了兩種評測方案：

傳統(tǒng)路線，也即語音識別、識別后處理、機(jī)器翻譯分而治之，稱之為基線模型（baseline Model）；

端到端模型（End-to-end Model），將語音識別、識別后處理和機(jī)器翻譯統(tǒng)一起來聯(lián)合優(yōu)化，能夠在一定程度上避免傳統(tǒng)基線模型中存在的識別錯(cuò)誤擴(kuò)散等問題，是一種新的思路，理論上更具前景。

端到端模型是當(dāng)前口語翻譯研究領(lǐng)域的前沿，隨著深度學(xué)習(xí)的進(jìn)步，研究人員開始探索通過構(gòu)造一個(gè)完整的神經(jīng)網(wǎng)絡(luò)模型，建立語音信號到目標(biāo)文字的映射關(guān)系。

該方法通過將語音識別、識別后處理和機(jī)器翻譯統(tǒng)一起來聯(lián)合優(yōu)化，為解決傳統(tǒng)級聯(lián)方案分而治之中存在的難題提供了一種新的思路。例如，2017年Interspeech會議上，谷歌研究人員就將該方法應(yīng)用到西班牙到英語的語音翻譯任務(wù)上，取得初步成效。

引入這一新的評測方案，也體現(xiàn)了IWSLT主辦方引導(dǎo)科研探索，推動(dòng)語音翻譯技術(shù)不斷進(jìn)步的努力。

科大訊飛勇于挑戰(zhàn)新路線，端到端語音翻譯獲得第一

科大訊飛參與了口語翻譯的兩種評測，并且是唯一參與端到端模型這種新技術(shù)路線的中國團(tuán)隊(duì)。不僅如此，科大訊飛還作為唯一受組委會邀請的語音翻譯任務(wù)參賽團(tuán)隊(duì)、進(jìn)行Oral report，向與會人員分享兩種技術(shù)路線研究所采用的方法，對促進(jìn)語音翻譯新技術(shù)的進(jìn)步具有重要作用。

因?yàn)檎Z言和語音本身的復(fù)雜性，新技術(shù)路線對統(tǒng)一建模需要很強(qiáng)的語音處理能力和調(diào)序能力，加之語言本身受到口語表達(dá)、環(huán)境噪聲的干擾，所以端到端技術(shù)路線要實(shí)現(xiàn)從原始語音到目標(biāo)文本的翻譯，就是難上加難。

值得一提，賽事提供的公開數(shù)據(jù)集合中，能夠?yàn)槎说蕉四Ｐ头椒ㄌ峁┲苯拥挠斜O(jiān)督數(shù)據(jù)是小規(guī)模的。要在3個(gè)月的時(shí)間里，在小規(guī)模數(shù)據(jù)上構(gòu)建一套高性能的端到端語音翻譯系統(tǒng)，非常具有挑戰(zhàn)性。

基于語音和機(jī)器翻譯上雄厚的技術(shù)積累，訊飛研究團(tuán)隊(duì)針對端到端語音翻譯任務(wù)開展了探索性研究，最終在英德語音翻譯任務(wù)的端到端模型評測方案上獲得了第一名（與第二名BLEU分?jǐn)?shù)拉開9個(gè)百分點(diǎn)，一般而言，提升3個(gè)百分點(diǎn)就能明顯體會到系統(tǒng)的優(yōu)劣差異）。

不僅如此，在基線模型評測中，科大訊飛也取得了第二名的好成績。

“比賽的成績只是一方面，我們看重的是在源頭技術(shù)、新技術(shù)上進(jìn)行探索，”科大訊飛的研究人員表示。

“我們參加了本次IWSLT評測的語音翻譯任務(wù)，在基于傳統(tǒng)的基線模型中，針對語音識別文本結(jié)果和機(jī)器翻譯訓(xùn)練數(shù)據(jù)源語言文本風(fēng)格不匹配問題，提出了對源語言文本逆變換以適配識別風(fēng)格的方法，提高了語音翻譯的魯棒性。在端到端模型中，提出了基于DenseNet和BiLSTM編碼，以及基于自注意力機(jī)制解碼的端到端建模方案。實(shí)驗(yàn)結(jié)果表明，盡管當(dāng)前端到端模型的效果低于傳統(tǒng)方法，但從結(jié)果來看也證明該方法具有一定的可行性，整體系統(tǒng)框架也更加簡潔優(yōu)雅，有望為語音翻譯提供一種新的解決思路?！?/p>

客觀評價(jià)語音翻譯端到端技術(shù)，數(shù)據(jù)將是一大瓶頸和障礙，因?yàn)檎Z音識別的數(shù)據(jù)已積累了上十萬小時(shí)、機(jī)器翻譯的數(shù)據(jù)搜集也達(dá)到千萬甚至上億，但端到端的模型，需要專門的語音到文本的句對，這方面的數(shù)據(jù)目前積累不夠，若要商業(yè)化，還需要更大的數(shù)據(jù)支撐。

對此，科大訊飛研究團(tuán)隊(duì)表示，“由于語音翻譯任務(wù)的復(fù)雜性以及訓(xùn)練數(shù)據(jù)搜集的困難，無論傳統(tǒng)的基線模型方案還是最新提出的端到端語音翻譯方案，在實(shí)際應(yīng)用中都還面臨一系列的難題，需要學(xué)術(shù)界和產(chǎn)業(yè)界共同努力?！?/p>

至于端到端的新技術(shù)，“如果能減少對有監(jiān)督語音翻譯平行數(shù)據(jù)的依賴那是最好不過，而且這存在一定的可能性，例如可以嘗試借用現(xiàn)有的語音識別訓(xùn)練數(shù)據(jù)和機(jī)器翻譯訓(xùn)練數(shù)據(jù)，我們正在努力探索?！?/p>

聲明：本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人，不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用，如有內(nèi)容侵權(quán)或者其他違規(guī)問題，請聯(lián)系本站處理。舉報(bào)投訴

語音識別

語音識別

+關(guān)注

關(guān)注
38

文章
1742

瀏覽量
112717
機(jī)器翻譯

機(jī)器翻譯

+關(guān)注

關(guān)注
0

文章
139

瀏覽量
14914
科大訊飛

科大訊飛

+關(guān)注

關(guān)注
19

文章
808

瀏覽量
61334

原文標(biāo)題：語音翻譯也能端到端？深度學(xué)習(xí)這條路有戲！

文章出處：【微信號：AI_era，微信公眾號：新智元】歡迎添加關(guān)注！文章轉(zhuǎn)載請注明出處。

科大訊飛即將發(fā)布訊飛星火深度推理模型X1

，標(biāo)志著科大訊飛在AI技術(shù)領(lǐng)域的又一次重大突破。訊飛星火深度推理模型X1將為科大

發(fā)表于 01-08 10:30 ?165次閱讀

科大訊飛為華為Mate70提供技術(shù)支持

簽約標(biāo)志著雙方將在技術(shù)創(chuàng)新、產(chǎn)業(yè)應(yīng)用以及商業(yè)合作等多個(gè)領(lǐng)域展開全方位、深層次的合作，共同致力于構(gòu)建更加完善的人工智能產(chǎn)業(yè)生態(tài)。值得一提的是，在華為最新發(fā)布的Mate70智能手機(jī)中，科大訊飛為其提供了關(guān)鍵的

發(fā)表于 12-19 11:03 ?494次閱讀

科大訊飛升級AI大模型,加速產(chǎn)業(yè)化應(yīng)用進(jìn)程

被譽(yù)為“通用大模型國家隊(duì)”的科大訊飛，再度強(qiáng)化其大模型技術(shù)實(shí)力。在10月24日舉辦的第七屆世界聲博會及2024科大訊飛全球1024開發(fā)者節(jié)開

發(fā)表于 10-25 16:09 ?395次閱讀

科大訊飛發(fā)布訊飛星火4.0 Turbo大模型及星火多語言大模型

近日，科大訊飛正式推出了其最新研發(fā)成果——訊飛星火4.0 Turbo大模型。這一發(fā)布不僅標(biāo)志著科大訊飛在人工智能領(lǐng)域的又一次重大

發(fā)表于 10-24 13:58 ?410次閱讀

科大訊飛發(fā)布星火超擬人數(shù)字人

了語義貫穿的“口唇-表情-動(dòng)作”的超擬人數(shù)字人生成。這一技術(shù)的突破，使得數(shù)字人在表達(dá)情感和動(dòng)作時(shí)更加真實(shí)、自然，如同在和真人進(jìn)行對話一般。在科大訊飛的演示中，我們可以看到由大模型生成

發(fā)表于 10-24 11:03 ?435次閱讀

科大訊飛AI總部園區(qū)正式啟用

近日，安徽省科技創(chuàng)新領(lǐng)域迎來又一重大里程碑，科大訊飛AI總部園區(qū)（訊飛小鎮(zhèn)）正式宣告啟用，標(biāo)志著這一集前沿科技、創(chuàng)新研發(fā)與高端人才于一體的智慧高地正式揚(yáng)帆起航。此次啟用，不僅為安徽省乃至全國的科技創(chuàng)新版圖增添了濃墨重彩的一筆，也

發(fā)表于 09-03 16:06 ?659次閱讀

華為與科大訊飛在運(yùn)動(dòng)健康領(lǐng)域達(dá)成合作

華為與科大訊飛強(qiáng)強(qiáng)聯(lián)手，正式宣布在運(yùn)動(dòng)健康領(lǐng)域達(dá)成深度合作。此次合作，將華為卓越的硬件優(yōu)勢與科大訊飛領(lǐng)先的人工智能技術(shù)完美融合，共同探索并開

發(fā)表于 08-14 17:41 ?736次閱讀

科大訊飛發(fā)布智能辦公本Air 2

近日，科大訊飛隆重舉辦了智能辦公本新品發(fā)布會，正式推出了集前沿科技與高效辦公于一體的訊飛智能辦公本Air 2系列。此次發(fā)布，不僅彰顯了科大訊

發(fā)表于 08-08 10:43 ?664次閱讀

科大訊飛AI學(xué)習(xí)機(jī)暑期重磅升級

大模型等AI技術(shù)的迅猛發(fā)展，正深刻改變著整個(gè)教育領(lǐng)域，傳統(tǒng)的教與學(xué)迎來全面革新。作為國內(nèi)人工智能教育的先行者，科大訊飛過去25年間屢獲人工智能國際大賽冠軍，更在今年6月份榮獲國家科學(xué)技術(shù)

發(fā)表于 07-08 09:38 ?650次閱讀

科大訊飛星火大模型新添功能，語音臺歷即將面世

　4月26日，科大訊飛宣布訊飛星火大模型V3.5春季更新，新增功能包括：支持長文本、長圖文、長語音的大模型，首推星火圖文識別大模型，能夠快速識別并學(xué)習(xí)多種類型的海量知識，提供更為專業(yè)、

發(fā)表于 04-28 11:30 ?522次閱讀

科大訊飛創(chuàng)新推出長文本、長圖文、長語音大模型，解決落地難題

近期，科大訊飛推出了首個(gè)支持長文本、長圖及語音大數(shù)據(jù)處理的大模型，該系統(tǒng)融合了多元化數(shù)據(jù)源，包括海量文字、圖片以及會議音頻等，能為各行業(yè)場景提供專業(yè)化、精準(zhǔn)化的答案。

發(fā)表于 04-28 09:32 ?383次閱讀

科大訊飛華中總部已封頂年內(nèi)交付使用

科大訊飛華中總部已封頂年內(nèi)交付使用科大訊飛華中總部位于武漢經(jīng)開區(qū)車谷資本島，投資額50億；計(jì)劃建成科大

發(fā)表于 04-16 14:49 ?1578次閱讀

科大訊飛成立未來科技公司

科大訊飛成立未來科技公司日前科大訊飛成立未來科技公司，名稱是浙江科訊未來科技有限公司，注冊資本達(dá)3000萬元，浙江科

發(fā)表于 02-20 11:56 ?1100次閱讀

科大訊飛發(fā)布“訊飛星火V3.5”：基于全國產(chǎn)算力訓(xùn)練的全民開放大模型

科大訊飛，作為中國領(lǐng)先的智能語音和人工智能公司，近日宣布推出首個(gè)基于全國產(chǎn)算力訓(xùn)練的全民開放大模型“訊飛星火V3.5”。

發(fā)表于 02-04 11:28 ?1535次閱讀

科大訊飛發(fā)布星火語音大模型

科大訊飛行業(yè)資訊

北京中科同志科技股份有限公司
發(fā)布于 :2024年01月31日 09:17:28

搜索歷史

科大訊飛語音翻譯新技術(shù)路線上再獲突破

評論

科大訊飛即將發(fā)布訊飛星火深度推理模型X1

科大訊飛為華為Mate70提供技術(shù)支持

科大訊飛升級AI大模型,加速產(chǎn)業(yè)化應(yīng)用進(jìn)程

科大訊飛發(fā)布訊飛星火4.0 Turbo大模型及星火多語言大模型

科大訊飛發(fā)布星火超擬人數(shù)字人

科大訊飛AI總部園區(qū)正式啟用

華為與科大訊飛在運(yùn)動(dòng)健康領(lǐng)域達(dá)成合作

科大訊飛發(fā)布智能辦公本Air 2

科大訊飛AI學(xué)習(xí)機(jī)暑期重磅升級

科大訊飛星火大模型新添功能，語音臺歷即將面世

科大訊飛創(chuàng)新推出長文本、長圖文、長語音大模型，解決落地難題

科大訊飛華中總部已封頂年內(nèi)交付使用

科大訊飛成立未來科技公司

科大訊飛發(fā)布“訊飛星火V3.5”：基于全國產(chǎn)算力訓(xùn)練的全民開放大模型

科大訊飛發(fā)布星火語音大模型