一、現(xiàn)狀問題
國(guó)際系統(tǒng)當(dāng)前的多語(yǔ)言是國(guó)際業(yè)務(wù)的普遍特點(diǎn),僅僅倉(cāng)儲(chǔ)管理系統(tǒng),當(dāng)前系統(tǒng)語(yǔ)言種類已經(jīng)達(dá)到了九種,并且隨著業(yè)務(wù)的開展還在不斷的擴(kuò)展,現(xiàn)有的國(guó)際系統(tǒng)支持的語(yǔ)言有中文、英語(yǔ)、日語(yǔ)、韓語(yǔ)、葡萄牙語(yǔ)、西班牙語(yǔ)、法語(yǔ)、德語(yǔ)、越南語(yǔ)。其中每個(gè)語(yǔ)言包的詞條都有上萬(wàn)條,且隨著新需求的開發(fā)迭代也在不斷的新增,語(yǔ)言包的不斷擴(kuò)展和詞條的不斷增加,詞條翻譯的簡(jiǎn)潔性、專業(yè)性和時(shí)效性就直接影響了業(yè)務(wù)的開展和需求的交付速度,迭代的完成效率。更多完整的系統(tǒng)多語(yǔ)言解決方案參見: 系統(tǒng)國(guó)際化之多語(yǔ)言解決方案
??
國(guó)際的系統(tǒng)不僅僅是語(yǔ)言多、詞條多,而且基本涵蓋了供應(yīng)鏈體系的所有核心系統(tǒng),在這些系統(tǒng)的詞條翻譯也缺少統(tǒng)一的國(guó)際專業(yè)術(shù)語(yǔ),相同的業(yè)務(wù)釋義在不同的業(yè)務(wù)條線就存在各種名字,內(nèi)部溝通不僅費(fèi)時(shí)費(fèi)力,在客戶使用京東系統(tǒng)時(shí)也會(huì)造成一些困惑。
二、分析原因
在新語(yǔ)言的不斷新增過程中,每次新增一種語(yǔ)言,一般的流程是研發(fā)提供全套的待翻譯詞條,業(yè)務(wù)找到對(duì)口的翻譯公司按照詞條和我們提供的語(yǔ)境、場(chǎng)景翻譯成對(duì)應(yīng)的語(yǔ)言,研發(fā)根據(jù)翻譯公司提供的詞條生成新的語(yǔ)言包添加到系統(tǒng)中。但是標(biāo)準(zhǔn)和專業(yè)的工作流程往往實(shí)現(xiàn)起來存在困難,從“成本、效率、體驗(yàn)”的角度出發(fā),總不能研發(fā)每次做一個(gè)需求都要找一遍翻譯公司吧?隨著語(yǔ)言包的不斷新增和各種需求的不斷迭代,所有的翻譯都需要專業(yè)翻譯公司介入基本是不太現(xiàn)實(shí)的,這種工作流程方式既增加了成本,又影響了交付效率。在以前沒有大模型的時(shí)候,一些簡(jiǎn)單的翻譯基本都是借助各類翻譯平臺(tái)實(shí)現(xiàn)詞語(yǔ)的直譯。隨著GPT的出現(xiàn),我們開始使用GPT替換了人工翻譯和翻譯平臺(tái)的直譯,翻譯的準(zhǔn)確性對(duì)比其他翻譯工具更加準(zhǔn)確,對(duì)比人工翻譯成本降低了,效率提高了,且準(zhǔn)確性也能得到一定的保障。
不論是人工翻譯還是GPT的AI智能翻譯,都不能達(dá)到國(guó)外專業(yè)業(yè)務(wù)系統(tǒng)的簡(jiǎn)潔和準(zhǔn)確,但是想要做的特別專業(yè)就需要請(qǐng)專業(yè)的外部翻譯公司,無疑又增加了成本的支出,有沒有一種既能讓系統(tǒng)逐步迭代的越來越完美又能降低成本的辦法呢?
其實(shí),在多語(yǔ)言方面,“用戶”就是最專業(yè)的專家。他們對(duì)系統(tǒng)熟悉以后,在特定的場(chǎng)景和語(yǔ)境下,是最專業(yè)的人。如果他們能夠在線修訂系統(tǒng)中的各種詞匯,是不是就可以解決這個(gè)問題?
三、計(jì)劃目標(biāo)
1.實(shí)時(shí)多語(yǔ)言支持:
?利用大模型的翻譯能力,實(shí)現(xiàn)對(duì)新增語(yǔ)言的快速響應(yīng)和實(shí)時(shí)翻譯,從而加速國(guó)際系統(tǒng)對(duì)新語(yǔ)言的支持。
2.提升翻譯質(zhì)量:
?通過大模型對(duì)歷史翻譯數(shù)據(jù)的學(xué)習(xí),提高翻譯的專業(yè)性和準(zhǔn)確性,減少人工干預(yù),提升整體翻譯質(zhì)量。
3.提高詞條更新效率:
?通過“詞條管家”功能,允許用戶在線即時(shí)修改詞條,利用大模型提供智能建議和自動(dòng)更正,大幅提升詞條更新的速度。
4.優(yōu)化用戶參與流程:
?鼓勵(lì)用戶參與詞條的修訂,利用大模型分析用戶反饋,快速響應(yīng)用戶需求,提升用戶參與度和滿意度。
5.降低成本:
?減少對(duì)專業(yè)翻譯公司的依賴,通過大模型輔助的自動(dòng)化翻譯和用戶社區(qū)的參與,有效降低翻譯和更新的成本。
6.增強(qiáng)系統(tǒng)的智能化:
?利用大模型對(duì)用戶行為和詞條使用模式的分析,實(shí)現(xiàn)智能化的詞條推薦和預(yù)測(cè)性更新,進(jìn)一步提升系統(tǒng)的智能化水平。
7.持續(xù)學(xué)習(xí)和優(yōu)化:
?大模型將持續(xù)從用戶修訂、審批流程和系統(tǒng)反饋中學(xué)習(xí),不斷優(yōu)化翻譯和更新流程,實(shí)現(xiàn)持續(xù)的性能提升
充分利用大模型的強(qiáng)大計(jì)算和學(xué)習(xí)能力,實(shí)現(xiàn)多語(yǔ)言支持的自動(dòng)化、智能化,從而顯著提升整個(gè)系統(tǒng)的效率和性能。
四、實(shí)現(xiàn)步驟
4.1 建設(shè)國(guó)際物流術(shù)語(yǔ)詞條庫(kù)
建設(shè)國(guó)際系統(tǒng)統(tǒng)一使用的國(guó)際專業(yè)術(shù)語(yǔ)詞條庫(kù),這個(gè)詞條庫(kù)將現(xiàn)有各個(gè)系統(tǒng)已有詞匯匯集整理以后形成一套大家都在使用的標(biāo)準(zhǔn)國(guó)際專業(yè)術(shù)語(yǔ)詞條,后續(xù)新增的需求將優(yōu)先從詞條庫(kù)中選擇現(xiàn)有詞條,沒有的詞條需要產(chǎn)品新增,產(chǎn)品新增完成以后前端研發(fā)就會(huì)引用該詞條到各自的系統(tǒng)中。
??
使用技術(shù)手段,讓用戶能夠在線修訂系統(tǒng)中的各種詞條和提示語(yǔ),經(jīng)過審批流程以后,詞條、提示語(yǔ)就能夠生效并最終應(yīng)用于系統(tǒng)中。
4.2 哪里不對(duì)改哪里,詞條管家秒更新
在系統(tǒng)中集成了自動(dòng)劃詞修改功能,該功能允許用戶在瀏覽前端頁(yè)面時(shí),對(duì)識(shí)別出的不恰當(dāng)或過時(shí)的詞條進(jìn)行即時(shí)修改。
1.劃詞選中:用戶在前端頁(yè)面中發(fā)現(xiàn)需要修訂的詞條后,可以通過劃詞操作快速選中該詞條。
2.彈出更正窗口:選中詞條后,系統(tǒng)會(huì)自動(dòng)彈出一個(gè)更正窗口,引導(dǎo)用戶輸入修訂后的詞條內(nèi)容。
3.審批流程:用戶輸入新詞條并提交后,系統(tǒng)將啟動(dòng)審批流程。這一流程確保了詞條修改的專業(yè)性和準(zhǔn)確性。
4.自動(dòng)生效:一旦新詞條通過審批,修改將被自動(dòng)應(yīng)用并即時(shí)生效,從而保證了詞條庫(kù)的時(shí)效性和可靠性。
通過這一流程,我們不僅提高了詞條更新的效率,還通過審批機(jī)制確保了詞條內(nèi)容的質(zhì)量和權(quán)威性。
??
4.3 架構(gòu)實(shí)現(xiàn)
整體架構(gòu)設(shè)計(jì)
??
4.3.1 大模型翻譯
使用集團(tuán)提供的大模型平臺(tái)GPT、言犀等,對(duì)需要翻譯的語(yǔ)言包或者新增詞條部分進(jìn)行定制化翻譯,方便系統(tǒng)很快速的擴(kuò)展新的語(yǔ)言包。對(duì)國(guó)際術(shù)語(yǔ)詞條庫(kù)的內(nèi)容進(jìn)行實(shí)時(shí)在線翻譯,新增詞條時(shí)自動(dòng)根據(jù)母語(yǔ)(中文)翻譯出其他語(yǔ)言的結(jié)果供產(chǎn)品參考。
內(nèi)容沉淀:在翻譯過程中內(nèi)置了多種專業(yè)詞條庫(kù),包括敏感詞、商品名稱、報(bào)關(guān)地址、各個(gè)國(guó)家的地址信息等,在翻譯的同時(shí)還會(huì)沉淀下來,形成專業(yè)的術(shù)語(yǔ)庫(kù),為后續(xù)其他業(yè)務(wù)提供模塊化的支撐。
規(guī)則約束:在翻譯時(shí),會(huì)在系統(tǒng)中內(nèi)置一系列的邏輯,確保翻譯出來的結(jié)果符合各個(gè)語(yǔ)境下的習(xí)慣,例如英語(yǔ)的詞匯翻譯結(jié)果一般都是首字母大寫,在進(jìn)行英語(yǔ)簡(jiǎn)拼時(shí),一般后面都會(huì)帶個(gè)英文的“.”來標(biāo)識(shí)。日本的地址信息一般是按照都道府縣、市、區(qū)一級(jí)級(jí),類似于中國(guó)的省市縣,在翻譯日本地址信息也會(huì)嚴(yán)格遵照日本的地址規(guī)范,這些都是系統(tǒng)內(nèi)置的能力。
話術(shù)集成:對(duì)不同的翻譯場(chǎng)景,在使用時(shí)會(huì)使用已經(jīng)培訓(xùn)好的話術(shù),根據(jù)需要的不同場(chǎng)景自動(dòng)翻譯提煉。
結(jié)果糾錯(cuò):大語(yǔ)言模型對(duì)于翻譯的結(jié)果不是穩(wěn)定可靠的,經(jīng)常會(huì)因?yàn)樾枰g的話術(shù)存在歧義導(dǎo)致整體翻譯的結(jié)果不對(duì),或者翻譯出來的內(nèi)容不是純粹的翻譯結(jié)果而失敗,在進(jìn)行翻譯時(shí),根據(jù)多種規(guī)則判斷翻譯的結(jié)果是否是正常的翻譯內(nèi)容,包括翻譯結(jié)果的長(zhǎng)度是否和預(yù)期差異較大,包括翻譯的結(jié)果是否是純粹的結(jié)果而不是帶了一些其他的干擾詞匯等等最終實(shí)現(xiàn)翻譯結(jié)果與預(yù)期一致。
?
??
大模型自動(dòng)化輔助翻譯:在新增加詞條時(shí),用戶選擇語(yǔ)言后,利用大模型得到相對(duì)應(yīng)的翻譯輔助用戶,可直接使用或在此基礎(chǔ)上進(jìn)行調(diào)整,大大降低翻譯成本。
??
4.3.2 多語(yǔ)言線上化
將多語(yǔ)言包上傳至云存儲(chǔ),在每次更新翻譯內(nèi)容并審批通過時(shí)自動(dòng)更新云存儲(chǔ)的文件。
??
4.3.3 自動(dòng)版本更新
審批通過以后自動(dòng)生成新的版本,在前端拉取語(yǔ)言版本時(shí)自動(dòng)拉取的就是最新版本的語(yǔ)言包。系統(tǒng)底層存儲(chǔ)了各個(gè)語(yǔ)言的版本號(hào),和云存儲(chǔ)的文件對(duì)應(yīng)在一起。
??
4.3.4 自動(dòng)化詞條更新技術(shù)
自動(dòng)化詞條更新技術(shù),旨在提升詞條更新的效率和專業(yè)性。
效率:具體而言,當(dāng)用戶在前端界面啟用錨點(diǎn)編輯功能并選中特定詞條時(shí),系統(tǒng)將自動(dòng)觸發(fā)并展示更新界面。該界面引導(dǎo)用戶輸入新的詞條內(nèi)容,隨后前端將這些更改實(shí)時(shí)轉(zhuǎn)化為一個(gè)待審批的詞條替換任務(wù)。
專業(yè)性:此任務(wù)隨后被送至管理員端,由具備相應(yīng)權(quán)限的管理員進(jìn)行審核。審批流程不僅確保了詞條更新的合法性和準(zhǔn)確性,同時(shí)也維護(hù)了內(nèi)容的質(zhì)量和一致性。
一旦管理員批準(zhǔn)了該詞條替換任務(wù),所提議的詞條更改將被自動(dòng)應(yīng)用并立即生效,從而實(shí)現(xiàn)了對(duì)語(yǔ)言庫(kù)的快速而審慎的更新。
4.3.5 異常兼容降級(jí)
在用戶訪問應(yīng)用時(shí),優(yōu)先拉取最新的語(yǔ)言包,同時(shí)存儲(chǔ)該版本到本地,下次進(jìn)入獲取各語(yǔ)言包版本,和本地緩存的對(duì)應(yīng)語(yǔ)言包版本進(jìn)行對(duì)比,如果對(duì)應(yīng)語(yǔ)言的版本有更新,則獲取新資源同時(shí)對(duì)本地資源更新。
同時(shí)在每次構(gòu)建時(shí)自動(dòng)拉取最新的語(yǔ)言包并更新,同時(shí)該版本作為base(基礎(chǔ))版本,當(dāng)自動(dòng)更新詞條服務(wù)不可用時(shí)進(jìn)行降級(jí)處理,繼續(xù)引用編譯構(gòu)建時(shí)的語(yǔ)言包,不影響系統(tǒng)的正常使用。
??
本地緩存的語(yǔ)言包:
??
通過這種降級(jí)方案,我們可以實(shí)現(xiàn):
1.無縫更新:用戶可以自動(dòng)獲取最新的語(yǔ)言包,無需手動(dòng)干預(yù),提升了用戶體驗(yàn)。
2.離線支持:即使遠(yuǎn)程服務(wù)不可用,應(yīng)用也能通過本地緩存的語(yǔ)言包繼續(xù)運(yùn)行,保證了應(yīng)用的可用性。
3.版本兼容性:通過版本檢查確保用戶總是使用與應(yīng)用兼容的語(yǔ)言包,避免因版本不匹配導(dǎo)致的潛在問題。
4.構(gòu)建時(shí)更新:在構(gòu)建應(yīng)用時(shí)自動(dòng)更新語(yǔ)言包,確保部署的應(yīng)用總是使用最新的語(yǔ)言資源。
5.資源效率:通過本地緩存減少了重復(fù)從遠(yuǎn)程服務(wù)器拉取相同資源的次數(shù),節(jié)省了網(wǎng)絡(luò)帶寬和服務(wù)器負(fù)載。
6.容錯(cuò)性:即使在更新過程中出現(xiàn)問題,系統(tǒng)也可以回退到穩(wěn)定的base版本,保持系統(tǒng)的穩(wěn)定性。
7.易于維護(hù):清晰的版本管理和更新邏輯簡(jiǎn)化了維護(hù)工作,便于開發(fā)者管理和部署語(yǔ)言資源。
五、實(shí)現(xiàn)效果
5.1 人效提升
每個(gè)迭代周期按照經(jīng)驗(yàn)更正20個(gè)不規(guī)范詞條左右,并且每個(gè)迭代周期上線1.5次,那么每個(gè)月可以節(jié)省大約2人日的工作量。這種效率的提升,不僅提高了國(guó)際化產(chǎn)品的專業(yè)力,還提高了團(tuán)隊(duì)的整體生產(chǎn)力。
5.1.1 系統(tǒng)國(guó)際化快速?gòu)?fù)用
在傳統(tǒng)的國(guó)際化流程中,每當(dāng)系統(tǒng)需要支持新的語(yǔ)言,通常需要進(jìn)行繁瑣的翻譯和本地化工作。然而,通過引入大型模型的翻譯能力,我們能夠?qū)崿F(xiàn)快速的語(yǔ)言版本定制和更新。例如,當(dāng)系統(tǒng)需要支持一種新的語(yǔ)言時(shí),可以利用大模型快速翻譯系統(tǒng)代碼中的詞條,然后通過自動(dòng)化工具將這些詞條集成到系統(tǒng)中,無需進(jìn)行復(fù)雜的手動(dòng)操作。
此外,通過建立國(guó)際物流術(shù)語(yǔ)詞條庫(kù),我們可以確保不同系統(tǒng)之間的術(shù)語(yǔ)統(tǒng)一,避免了重復(fù)翻譯和不一致的問題。這種方法不僅提高了翻譯的準(zhǔn)確性,還大大減少了研發(fā)在多語(yǔ)言支持上的工作量,使得國(guó)際化過程更加高效。
??
5.1.2 詞條校準(zhǔn)快速高效
在每個(gè)迭代的需求開發(fā)時(shí),不再因?yàn)樵~條的更新需要研發(fā)不斷的發(fā)版,每次發(fā)版發(fā)布多套環(huán)境,而是系統(tǒng)自動(dòng)更新自動(dòng)生效。只需要在詞條管家中修改以后等待審批人審批以后即可生效,極大的縮短詞條的生效時(shí)間,助力敏捷提效??焖俑缓线m的詞條,省去各個(gè)中間環(huán)節(jié)。
原有流程完成一次術(shù)語(yǔ)修改需要經(jīng)過10個(gè)流程節(jié)點(diǎn)才能完成一次術(shù)語(yǔ)的修改和生效,每次修改需要2個(gè)多小時(shí),主要花費(fèi)在部署多套環(huán)境上。增加了術(shù)語(yǔ)庫(kù)的能力以后,每次修改術(shù)語(yǔ)需要4個(gè)流程節(jié)點(diǎn),生效時(shí)間只需要15分鐘左右,真正實(shí)現(xiàn)了即改即生效,生效即可見的效果。
??
5.2 質(zhì)量提升
5.2.1 物流術(shù)語(yǔ)專業(yè)統(tǒng)一
為了解決翻譯本土化的難題,我們嘗試了多種方案。最直接的方法是依賴第三方翻譯服務(wù)商,但這種做法存在多個(gè)問題。首先,成本較高;其次,翻譯的準(zhǔn)確性無法保證。主要問題是,我們的每個(gè)系統(tǒng)都具有專業(yè)性,日常使用中看似簡(jiǎn)單的詞匯,翻譯公司可能無法準(zhǔn)確理解其含義,從而導(dǎo)致翻譯結(jié)果無法準(zhǔn)確表達(dá)原意。因此,這種方法產(chǎn)生的結(jié)果并不理想。隨著越來越多的系統(tǒng)在做國(guó)際化,我們發(fā)現(xiàn)同行業(yè)系統(tǒng)之間有很多詞匯是相同的,但是不同系統(tǒng)的翻譯結(jié)果可能有差異,無法做到術(shù)語(yǔ)統(tǒng)一,這會(huì)給用戶帶來困擾,對(duì)外體驗(yàn)不好,因此我們?cè)杏鱿胱鲆粋€(gè)行業(yè)詞條庫(kù)的想法。
通過國(guó)際供應(yīng)鏈各個(gè)系統(tǒng)詞條匯總,統(tǒng)計(jì)出高頻詞條,通過GPT智能翻譯加人工校對(duì),確保詞條翻譯的準(zhǔn)確性和本土化,有了公共詞庫(kù)作為基礎(chǔ),所有系統(tǒng)多語(yǔ)言翻譯優(yōu)先查詢公共詞庫(kù),確保不同系統(tǒng)術(shù)語(yǔ)統(tǒng)一,其次才是復(fù)雜文本GPT智能翻譯。
國(guó)際公共詞庫(kù)成型示意圖:
??
通過現(xiàn)有國(guó)際物流系統(tǒng)的詞條,我們通過使用頻率篩選出高頻詞條,通過GPT翻譯加人工校驗(yàn)的方式進(jìn)行詞條沉淀,考慮到不同位置展示的詞條書寫格式的差異,詞條類型根據(jù)不同的用途進(jìn)行分類管理。比如考慮到菜單類詞條可能很多英語(yǔ)寫法喜歡縮寫,會(huì)將頁(yè)面菜單詞條和異常提示詞條分類存放,使用的時(shí)候同樣的詞匯會(huì)根據(jù)具體的類型進(jìn)行翻譯。
??
?
通過公共詞庫(kù)的實(shí)踐,我們避免了很多詞匯的二次翻譯,同時(shí)翻譯結(jié)果的準(zhǔn)確性和本土化程度大幅提高,隨著詞條沉淀的增多,發(fā)揮的作用將會(huì)越大,所以,如果你的系統(tǒng)正在做國(guó)際化,強(qiáng)烈推薦沉淀一份公共詞庫(kù),可以讓系統(tǒng)翻譯更加統(tǒng)一,更加精確。
六、總結(jié)規(guī)劃
當(dāng)前國(guó)際物流術(shù)語(yǔ)詞條庫(kù)已經(jīng)開始建設(shè),但是不同語(yǔ)言在系統(tǒng)層面如何精簡(jiǎn)的體現(xiàn)且能被用戶清晰的知曉還需要不斷的摸索和提煉,也希望大家獻(xiàn)言獻(xiàn)策,不斷完善。
國(guó)際在多語(yǔ)言的開發(fā)過程中不斷總結(jié)歸納,創(chuàng)新性的將國(guó)際的多語(yǔ)言整理成了國(guó)際術(shù)語(yǔ)詞條庫(kù),為國(guó)際的專業(yè)術(shù)語(yǔ)統(tǒng)一打下了良好的基礎(chǔ)。利用技術(shù)優(yōu)勢(shì),將語(yǔ)言包放置到了線上,在打包時(shí)自動(dòng)更新拉取,同時(shí)提供線上所見即所得的詞條修改能力,不斷提高多語(yǔ)言的專業(yè)性。
附錄:系統(tǒng)國(guó)際化技術(shù)解決方案系列—— 系統(tǒng)國(guó)際化之多語(yǔ)言解決方案
審核編輯 黃宇
-
GPT
+關(guān)注
關(guān)注
0文章
354瀏覽量
15423 -
大模型
+關(guān)注
關(guān)注
2文章
2478瀏覽量
2842
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
評(píng)論