近期,微軟發(fā)布了最新中文曉曉語(yǔ)音升級(jí),中文曉曉新增了 10 種風(fēng)格。升級(jí)后的該語(yǔ)音模型風(fēng)格多達(dá) 14 種,處于行業(yè)領(lǐng)先水平。新增風(fēng)格分別是適用于聊天(Chat)場(chǎng)景的語(yǔ)音,還有平靜(Calm)、開(kāi)心(cheerful)、悲傷(Sad)、憤怒(Angry)、 恐懼(Fearful)、 不滿(mǎn)(Disgruntled)、 嚴(yán)厲(Serious)、撒嬌(Affectionate)、溫柔(Gentle)等。此次,微軟升級(jí)的多情感技術(shù),極大豐富了聽(tīng)眾的收聽(tīng)體驗(yàn),尤其在長(zhǎng)文本收聽(tīng)過(guò)程中,可以很大程度緩解聽(tīng)覺(jué)疲勞,提升收聽(tīng)舒適度。
升級(jí)前微軟中文曉曉語(yǔ)音擁有 4 種不同風(fēng)格,分別是新聞(newscast)、客服(customer service)、助理(assistant)、抒情(lyrical),升級(jí)后支持多達(dá) 14 種不同風(fēng)格,能在豐富的情緒和場(chǎng)景中自由轉(zhuǎn)換,比如多情感有聲讀物、新聞、客服、助理、聊天等。可以滿(mǎn)足不同領(lǐng)域客戶(hù)的多樣化定制需求。
IT之家了解到,微軟發(fā)布的智能語(yǔ)音合成技術(shù)通過(guò)應(yīng)用語(yǔ)音表現(xiàn)力遷移技術(shù),僅利用少量表現(xiàn)力語(yǔ)料數(shù)據(jù),便可以訓(xùn)練出具有高質(zhì)量、高自然度表現(xiàn)力語(yǔ)音生成能力的源模型。該源模型通過(guò)對(duì)人類(lèi)語(yǔ)音表現(xiàn)力特征的深入挖掘,獲取了穩(wěn)定性高,適應(yīng)性強(qiáng)的語(yǔ)音情感表征,極大地豐富了合成語(yǔ)音的表現(xiàn)力與可控性,賦予了合成語(yǔ)音擬人的喜怒哀樂(lè),彌補(bǔ)了傳統(tǒng)人工智能語(yǔ)音合成技術(shù)中 “人情味”不足的缺憾。
理想的多情感技術(shù)將是每個(gè)聲音都擁有幾十種甚至上百種豐富細(xì)膩的情感表達(dá),可以駕馭不同場(chǎng)景,根據(jù)內(nèi)容表達(dá)自動(dòng)適配情感。
微軟智能語(yǔ)音多情感技術(shù)發(fā)布,標(biāo)志了語(yǔ)音合成發(fā)展的新趨勢(shì),將成為智能語(yǔ)音應(yīng)用的 “標(biāo)準(zhǔn)配置”,實(shí)現(xiàn)用戶(hù)體驗(yàn)新的突破。
責(zé)任編輯:PSY
-
技術(shù)
+關(guān)注
關(guān)注
0文章
431瀏覽量
58484 -
中文
+關(guān)注
關(guān)注
2文章
62瀏覽量
23153 -
智能語(yǔ)音
+關(guān)注
關(guān)注
10文章
783瀏覽量
48773
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
評(píng)論