IBM Watson Text to Speech API,它能夠?qū)⑽谋竞铣蔀槎喾N語言、聲音和方言的音頻。這里面“Allison”的聲音音色很甜、很有吸引力,特別契合我的書中主人公 Hailee Tupper 的年齡和性格特點。
有這樣一種說法,一張圖片勝過千言萬語。但事實上,清晰、措辭得當(dāng)、音調(diào)和發(fā)音準(zhǔn)確的口頭語言能夠更好地營造最難忘、最美好的畫面。而人工智能已經(jīng)取得了顯著的進展,能夠完成上述表達要求。
我想知道能否用一個女性人工智能聲音來演繹我所著的“Miraculous”一書中的主角,以讓人信服的方式讓聽眾相信她就是書中的真實角色。
我如何借助 Watson API 賦予主角生命
在對多家公司的多個不同的 AI 角色進行試音后,我最終選擇了 IBM Watson Text to Speech API,它能夠?qū)⑽谋竞铣蔀槎喾N語言、聲音和方言的音頻。我選擇了“Allison”的聲音,因為她的音色很甜、很有吸引力,同時也契合書中主人公 Hailee Tupper 的年齡。
為了幫助她演繹書中場景,我使用了文本轉(zhuǎn)語音 API 的表達功能“Expressiveness”,該功能可以使用情感元素擴展 SSML,而該情感元素能夠表達好消息 (GoodNews)、道歉 (Apology) 或不確定 (Uncertainty) 的說話語氣(僅適用于美音 Allison 聲音)??梢赃M一步了解 IBM Watson 情感語音服務(wù) Expressive SSML。
我的書中有數(shù)萬個單詞組合,Watson Allison 的聲音能夠以不同的方式處理這些單詞組合。通過單獨使用或組合使用三個情感語音情緒中的一個或多個情緒,并在說話時加上不同的停頓時間,她就能表達更多的情緒。
小說角色說話時會長短不一,因此會影響到一句話停頓的次數(shù)和頻率,而這種停頓也需要計算。書中特定場景的總體情緒也會影響停頓的頻率,如說話中止、語氣平靜和歡呼等。
下面,我將通過一個例子來展示上述技術(shù)有哪些作用。
若要完成此類項目,你是否必須成為一名 IT 人員或程序員?我不這么覺得。不論怎么想,我都不可能成為計算機人員或程序員。但是,我想說的是,耐心、實踐和創(chuàng)意都是非常重要的因素。這就像是一個故事的導(dǎo)演。整個過程會涉及大量的復(fù)制粘貼工作。關(guān)鍵要知道如何將代碼粘貼至文本中的正確位置,最終達到預(yù)期效果。
假如您對此類項目感興趣,我非常愿意與你分享我的知識和專業(yè)技能,比如,通過一個免費的視頻,幫助您取得最佳成果。
最后,我想說的是,與 IBM Watson 合作是一段美妙、精彩的經(jīng)歷。如果有可能,我很希望能夠跟他握手致謝。
-
人工智能
+關(guān)注
關(guān)注
1792文章
47387瀏覽量
238900 -
Watson
+關(guān)注
關(guān)注
0文章
17瀏覽量
9517
原文標(biāo)題:Watson 如何幫助作者賦予書中主角以生命
文章出處:【微信號:IBMGCG,微信公眾號:IBM中國】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
相關(guān)推薦
評論