“蘇州街站到了,請(qǐng)帶好隨身物品準(zhǔn)備下車?!?/p>
“巴溝站到了,請(qǐng)帶好隨身物品準(zhǔn)備下車?!?/p>
——地鐵語(yǔ)音播報(bào)編輯站名
隨著人工智能技術(shù)的發(fā)展,智能語(yǔ)音已融入我們?nèi)粘I畹姆椒矫婷?。在人機(jī)共生的智能時(shí)代,讓人機(jī)交互更自然、更流暢一直是人類不斷探索的目標(biāo)。
近期,思必馳TTS技術(shù)上線語(yǔ)音編輯功能。語(yǔ)音編輯,即在一段語(yǔ)音中間插入語(yǔ)音內(nèi)容,或根據(jù)之前的語(yǔ)音風(fēng)格續(xù)寫,使得插入或續(xù)寫的語(yǔ)音內(nèi)容與之前的語(yǔ)音風(fēng)格完美融合,帶給用戶更自然、流暢的語(yǔ)音服務(wù)體驗(yàn)。該技術(shù)可應(yīng)用于自媒體語(yǔ)音修正,軌交、電商、快遞、銀行等行業(yè)中的智能客服語(yǔ)音播報(bào)場(chǎng)景,目前,思必馳語(yǔ)音編輯支持中文語(yǔ)音編輯及英文語(yǔ)音編輯。
語(yǔ)音編輯,像文本一樣修改音頻
點(diǎn)擊下方音頻,感受思必馳優(yōu)化后的語(yǔ)音編輯效果
普通語(yǔ)音編輯,手機(jī)號(hào)部分能聽(tīng)出明顯差異
思必馳語(yǔ)音編輯,手機(jī)號(hào)部分與原有音頻自然融合
日常生活中,如音頻中所展示的智能客服已被廣泛應(yīng)用于快遞、銀行、電商等行業(yè)場(chǎng)景中,為行業(yè)降本增效帶來(lái)顯著作用。廠商通過(guò)語(yǔ)音編輯技術(shù),僅需對(duì)固定話術(shù)中的人名、數(shù)字等變量進(jìn)行替換,便可獲得針對(duì)不同用戶的差異性播報(bào)語(yǔ)音,批量通知用戶,大大提高了生產(chǎn)效率。
在語(yǔ)音編輯過(guò)程中,最大的挑戰(zhàn)就是如何使得編輯后的語(yǔ)音接近原有音頻的自然和流暢。情感的細(xì)微差別、語(yǔ)調(diào)變化、節(jié)奏等稍有不連貫,聽(tīng)眾便能從中聽(tīng)出明顯的語(yǔ)音差異。因此,為了讓此類編輯后的語(yǔ)音播報(bào)更自然,人類不斷優(yōu)化語(yǔ)音合成技術(shù)水平。
點(diǎn)擊試聽(tīng)思必馳語(yǔ)音編輯續(xù)寫后的文本
原有音頻風(fēng)格
后半句為根據(jù)原有音頻風(fēng)格進(jìn)行編輯續(xù)寫
思必馳對(duì)語(yǔ)音編輯技術(shù)優(yōu)化更新,應(yīng)用深度合成技術(shù),基于大模型實(shí)現(xiàn)零樣本高質(zhì)量語(yǔ)音編輯,可對(duì)中英文語(yǔ)音進(jìn)行插入文本、根據(jù)之前風(fēng)格續(xù)寫等操作。經(jīng)思必馳語(yǔ)音編輯后的語(yǔ)音更流暢、更自然,帶給用戶媲美原聲的聽(tīng)覺(jué)體驗(yàn)。
適用各種場(chǎng)景,音頻創(chuàng)作更高效
目前,語(yǔ)音編輯已經(jīng)應(yīng)用于快遞、電商、銀行等場(chǎng)景的智能客服以及自媒體短視頻配音修正中,為各行各業(yè)帶來(lái)更自然的語(yǔ)音服務(wù)。
智能客服固定話術(shù)修改變量
在快遞、電商、銀行、軌交等場(chǎng)景的智能客服中,常常需要用到固定話術(shù),但與用戶通話時(shí),固定話術(shù)需要根據(jù)不同用戶、場(chǎng)景對(duì)其中的變量進(jìn)行修改。如:
應(yīng)用場(chǎng)景
·張先生您好,請(qǐng)到樓下憑取件碼123取件;
·王女士您好,您近日在我店鋪購(gòu)買的商品,如果滿意請(qǐng)給5分好評(píng);
·劉先生您好,您的信用卡還款日為8月15日,請(qǐng)記得及時(shí)還款;
·蘇州街站到了,請(qǐng)帶好隨身物品準(zhǔn)備下車;
·北京,天氣晴轉(zhuǎn)多云,氣溫25-30℃。
在此類語(yǔ)音播報(bào)中,應(yīng)用思必馳語(yǔ)音編輯技術(shù),可對(duì)固定話術(shù)中的人名、地名、數(shù)字、日期等變量進(jìn)行編輯,從而快速獲得接近原聲的語(yǔ)音,滿足不同用戶、場(chǎng)景需求。
短視頻修正錄音口誤
修正前音頻
修正內(nèi)容后音頻
短視頻博主在視頻創(chuàng)作過(guò)程中,視頻素材往往有口誤、詞不達(dá)意或冗余的內(nèi)容,此時(shí),重新對(duì)某一句話進(jìn)行配音,則很難還原當(dāng)時(shí)的環(huán)境音,出現(xiàn)該句配音與其他音頻存在些許差異的情況。如果對(duì)視頻一幀一幀進(jìn)行修改,則需要花費(fèi)大量時(shí)間。在修改音頻時(shí),使用思必馳語(yǔ)音編輯技術(shù),可對(duì)個(gè)別字詞及冗余內(nèi)容進(jìn)行替換,替換后的字詞可完美融入之前的語(yǔ)音環(huán)境,降低語(yǔ)音編輯前后的差異性,獲得更自然、流暢的語(yǔ)音。
為了保證語(yǔ)音編輯技術(shù)合法使用,思必馳可通過(guò)聲紋識(shí)別對(duì)用戶上傳的公眾人物、敏感話題等音頻進(jìn)行屏蔽,拒絕編輯合成,保證技術(shù)安全。
除語(yǔ)音編輯外,思必馳聲音復(fù)刻、本地合成、情感音色合成等多項(xiàng)語(yǔ)音合成技術(shù)都迎來(lái)更新,敬請(qǐng)期待!
未來(lái),思必馳將基于DFM-2大模型,結(jié)合語(yǔ)音合成技術(shù)進(jìn)行技術(shù)聯(lián)動(dòng),為智能汽車、智能家居、消費(fèi)電子,以及金融、軌交、政務(wù)等數(shù)字政企行業(yè)場(chǎng)景客戶帶來(lái)更加自然、流暢的語(yǔ)音交互服務(wù)。
審核編輯:彭菁
-
人機(jī)交互
+關(guān)注
關(guān)注
12文章
1207瀏覽量
55402 -
TTS
+關(guān)注
關(guān)注
0文章
41瀏覽量
10792 -
思必馳
+關(guān)注
關(guān)注
4文章
284瀏覽量
14286 -
短視頻
+關(guān)注
關(guān)注
1文章
124瀏覽量
8935
原文標(biāo)題:語(yǔ)音編輯,讓智能播報(bào)更自然,思必馳TTS技術(shù)上新第一更!
文章出處:【微信號(hào):思必馳,微信公眾號(hào):思必馳】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
評(píng)論