一組微軟研究團(tuán)隊(duì)于本周三宣布,他們已經(jīng)創(chuàng)造了第一個(gè)能夠?qū)⒅形男侣劮g成英文的機(jī)器翻譯系統(tǒng),精確度與人類(lèi)譯者一致。該公司表示,它通過(guò)來(lái)自各種在線(xiàn)報(bào)紙的約2000條語(yǔ)句樣本對(duì)這一系統(tǒng)進(jìn)行了反復(fù)測(cè)試,并將測(cè)試結(jié)果與人類(lèi)譯者的翻譯進(jìn)行了比較,它還甚至聘請(qǐng)了外部的雙語(yǔ)顧問(wèn)來(lái)進(jìn)一步驗(yàn)證機(jī)器的精確度。
這一被稱(chēng)為newstest2017的樣本集已于去年秋天在研究會(huì)議WMT17上發(fā)布。
令人感到驚訝的是研究人員能夠如此快速的達(dá)到這一里程碑,尤其是機(jī)器翻譯是人們幾十年來(lái)一直在試圖解決的問(wèn)題。“機(jī)器翻譯要比單純的模式識(shí)別任務(wù)復(fù)雜得多,”微軟亞洲研究院助理總監(jiān)兼自然語(yǔ)言處理小組負(fù)責(zé)人周明說(shuō)道?!叭藗兛梢允褂貌煌膯卧~來(lái)表達(dá)相同的意思,但你無(wú)法判斷哪一種更好。”
微軟還指出,最近在AI方面取得的進(jìn)展,為研究人員實(shí)現(xiàn)這一里程碑作出了貢獻(xiàn)。
深度神經(jīng)網(wǎng)絡(luò)——一種訓(xùn)練AI系統(tǒng)的方法,允許研究人員創(chuàng)造更加流利自然的翻譯,并考慮到更廣泛的內(nèi)容背景,這一超前的方法被稱(chēng)之為統(tǒng)計(jì)機(jī)器翻譯。
微軟的研究人員還在系統(tǒng)中增加了他們自己的訓(xùn)練方法,以提高其精確度。這些方法類(lèi)似于人們?nèi)绾沃貜?fù)自己的工作時(shí)間,并再次確認(rèn)是否正確的過(guò)程。研究人員表示,他們使用的方法包括雙重學(xué)習(xí)的事實(shí)檢查翻譯;審議網(wǎng)絡(luò),進(jìn)行重復(fù)翻譯和改進(jìn);聯(lián)合訓(xùn)練等新技術(shù),以迭代促進(jìn)英到中和中到英翻譯系統(tǒng);以及協(xié)議正規(guī)化,即通過(guò)左到右和右到左閱讀語(yǔ)句來(lái)生成翻譯。
周明表示,用于實(shí)現(xiàn)這一里程碑的技術(shù)不會(huì)局限于機(jī)器翻譯。“這是機(jī)器翻譯研究可以應(yīng)用于人工智能研究全部領(lǐng)域的領(lǐng)域,”周明表示。
此外,它可以在未來(lái)讓其他語(yǔ)言的翻譯更加準(zhǔn)確和自然。研究人員表示,這一系統(tǒng)尚未在實(shí)時(shí)新聞報(bào)道中測(cè)試過(guò),在該技術(shù)被商業(yè)化到微軟產(chǎn)品前還有其他的挑戰(zhàn)需要解決。
但是你可以在微軟的網(wǎng)站上使用這一新的翻譯系統(tǒng)。
系統(tǒng)將顯示一個(gè)中文(簡(jiǎn)體)句子,然后以?xún)煞N方式進(jìn)行翻譯,右邊的翻譯會(huì)更加完善以表明這一技術(shù)的先進(jìn)性。機(jī)器翻譯是谷歌的研究人員一直致力于研究的內(nèi)容,包括使用谷歌的機(jī)器學(xué)習(xí)技術(shù)進(jìn)行中英文查詢(xún)。這些進(jìn)展已經(jīng)付諸實(shí)施,以改進(jìn)谷歌面向消費(fèi)者的產(chǎn)品,比如谷歌翻譯應(yīng)用,以及谷歌搜索的整合。
-
微軟
+關(guān)注
關(guān)注
4文章
6622瀏覽量
104283 -
人工智能
+關(guān)注
關(guān)注
1793文章
47588瀏覽量
239465
原文標(biāo)題:微軟宣布在機(jī)器翻譯方面取得突破,中翻英可達(dá)人類(lèi)水平
文章出處:【微信號(hào):gh_211d74f707ff,微信公眾號(hào):重慶人工智能】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
評(píng)論