當(dāng)涉及到高質(zhì)量的合成語音開發(fā)和定制時(shí),深度學(xué)習(xí)被證明是一個(gè)強(qiáng)大的工具。一家總部位于多倫多的初創(chuàng)公司, NVIDIA Inception 成員類似人工智能正在利用一種新的生成語音工具增加賭注,該工具能夠創(chuàng)建高質(zhì)量的合成人工智能語音。
這項(xiàng)技術(shù)可以在 50 多種最流行的語言中生成跨語言和自然說話的聲音,通過相似填充,用戶可以創(chuàng)建編程音頻,編輯和替換音頻片段中的單詞。
構(gòu)建、部署和擴(kuò)展現(xiàn)實(shí)人工智能語音的能力將幫助眾多行業(yè)。應(yīng)用范圍廣泛,從為廣告創(chuàng)建人工智能生成的文本,到交互式語音應(yīng)答系統(tǒng),再到視頻游戲開發(fā)。
自 2020 年 7 月以來,相似人工智能團(tuán)隊(duì)與 NVIDIA 的對(duì)話人工智能團(tuán)隊(duì)密切合作,將 NVIDIA riva多模態(tài)對(duì)話人工智能 SDK 集成到他們的語音管道中。據(jù)人工智能創(chuàng)始人兼首席執(zhí)行官佐哈伊布·艾哈邁德( Zohaib Ahmed )稱,這種經(jīng)歷讓他們?cè)谡麄€(gè)人工智能對(duì)話管道中融入了獨(dú)特的 i NSight 。
“ NVIDIA Inception 計(jì)劃有助于為對(duì)話人工智能領(lǐng)域提供關(guān)鍵 i NSight 以及為我們作為產(chǎn)品的每項(xiàng)工作推薦 GPU 計(jì)算提供技術(shù)支持,” Ahmed 說。
為了訓(xùn)練他們的語音模型和推理能力,該團(tuán)隊(duì)正在使用 Amazon 彈性 Kubernetes 服務(wù)( Amazon EKS )和 NVIDIA T4 GPU s 集群。然后,他們使用 NVIDIA Triton 推理服務(wù)器在生產(chǎn)中大規(guī)模部署他們訓(xùn)練有素的人工智能模型。
最近一個(gè)與 NVIDIA Omniverse Audio2Face集成的類似人工智能合成語音演示展示了組合技術(shù)如何從單一音頻源創(chuàng)建富有表情的面部動(dòng)畫和聲音。
Ahmed 說:“ Audio2Face 是一個(gè)很好的例子,它是一個(gè)強(qiáng)大的工具,可以很容易地與生成性人工智能語音相結(jié)合,在幾秒鐘內(nèi)產(chǎn)生結(jié)果,否則需要幾天時(shí)間?!?。
公司 已經(jīng)發(fā)展到擁有超過 150000 個(gè)用戶,建立了超過 60000 個(gè)語音。迄今為止, 類似人工智能在電信、金融、通訊中心、教育、游戲、媒體和娛樂等行業(yè)擁有 240 多個(gè)付費(fèi)客戶。
關(guān)于作者
Michelle Horton 是 NVIDIA 的高級(jí)開發(fā)人員通信經(jīng)理,擁有通信經(jīng)理和科學(xué)作家的背景。她在 NVIDIA 為開發(fā)者博客撰文,重點(diǎn)介紹了開發(fā)者使用 NVIDIA 技術(shù)的多種方式。
審核編輯:郭婷
-
NVIDIA
+關(guān)注
關(guān)注
14文章
4990瀏覽量
103119 -
人工智能
+關(guān)注
關(guān)注
1791文章
47314瀏覽量
238651
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
評(píng)論