0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

Rokid正式上線TTS語(yǔ)音開(kāi)放平臺(tái) 告別沒(méi)有情感的機(jī)械聲

電子工程師 ? 來(lái)源:yxw ? 2019-05-23 09:00 ? 次閱讀

目前各種 AI 語(yǔ)音助手已經(jīng)可以滿足我們的日常需求,比如問(wèn)天氣、提醒備忘、聽(tīng)音樂(lè)等。

很多人開(kāi)始注重與 AI 交流溝通的情感。

但現(xiàn)在市面上語(yǔ)音助手的聲音參次不齊,不少人吐槽有些 AI 聲音太僵硬了,機(jī)械化嚴(yán)重到?jīng)]有情感元素,一聽(tīng)到瞬間失去購(gòu)買的欲望。

剛剛,Rokid 正式上線了TTS 語(yǔ)音開(kāi)放平臺(tái),簡(jiǎn)單好用,讓我們告別沒(méi)有情感的機(jī)械聲,與 AI 自然的交流。

多種 AI 聲音選擇,好聽(tīng)自然

目前,該開(kāi)放平臺(tái)已提供中英文男聲、女聲、童聲等多種不同角色的在線語(yǔ)音合成體驗(yàn)。

你只需在網(wǎng)頁(yè)的文本框內(nèi)輸入一段文字,選擇發(fā)音角色和風(fēng)格參數(shù),即可輕松體驗(yàn)不同風(fēng)格的語(yǔ)音效果。

操作是不是很簡(jiǎn)單呢?

聽(tīng)過(guò)若琪聲音的小伙伴都知道,她的童聲 TTS 音色還原度、發(fā)音、聽(tīng)感都十分接近真實(shí)自然的聲音,帶有真實(shí)的語(yǔ)氣和情緒,仿佛一個(gè)八歲左右兒童的聲音。

“自然 AI 聲音”的背后

這次,TTS 語(yǔ)音開(kāi)放平臺(tái)也在童聲 TTS 中展示了帶有情感語(yǔ)氣的語(yǔ)音合成效果。

這是通過(guò)對(duì) TTS 角色情感語(yǔ)氣的設(shè)計(jì),將語(yǔ)氣詞在不同場(chǎng)景下的不同用法融入 TTS 的后端訓(xùn)練模型之中,聲音的自然度有質(zhì)的提高,你聽(tīng)到后便會(huì)感覺(jué)更加親切自然。

“自然 AI 聲音”的背后是 Rokid TTS 團(tuán)隊(duì)積累了多年的 TTS 技術(shù)。

由中科院自動(dòng)化研究所語(yǔ)音識(shí)別、語(yǔ)音合成方向的專家?guī)ш?duì),團(tuán)隊(duì)成員里還有牛津大學(xué)語(yǔ)言學(xué)方向的博士、音頻領(lǐng)域?qū)<?、專業(yè)配音演員、發(fā)音研究員等,旨在打造出業(yè)界領(lǐng)先的聲音。

Rokid TTS 不僅率先應(yīng)用于我們自己的語(yǔ)音助手若琪,也已經(jīng)為很多廠商提供了 TTS 技術(shù)支持,包括網(wǎng)易、喜馬拉雅、哈曼卡頓等業(yè)界知名合作伙伴。

希望能利用 Rokid 四年以來(lái)在語(yǔ)音方面的技術(shù)積累,進(jìn)一步服務(wù) AI 產(chǎn)品開(kāi)發(fā)者,為有定制語(yǔ)音需求的合作伙伴提供服務(wù)。

最后,小編想說(shuō),TTS 不僅能夠應(yīng)用于 AI 產(chǎn)品上,也在許多其他領(lǐng)域有了很成熟的應(yīng)用,比如教育、新聞、泛娛樂(lè)等領(lǐng)域都有定制語(yǔ)音的需求。

TTS 語(yǔ)音開(kāi)放平臺(tái)可以幫助這些領(lǐng)域進(jìn)行虛擬形象運(yùn)營(yíng)、語(yǔ)音實(shí)時(shí)播報(bào)、教育讀物制作、音樂(lè)創(chuàng)作等等,既能實(shí)現(xiàn)自然聽(tīng)感的聲音,又能提升效率。

想要使用 TTS 語(yǔ)音開(kāi)放平臺(tái)的能力并不難,只需要通過(guò)簡(jiǎn)單的 5 步申請(qǐng)接入流程,你就可以直接調(diào)用 TTS 接口,將 Rokid 的語(yǔ)音助手植入到自己的產(chǎn)品中,體驗(yàn)虛擬角色與用戶的實(shí)時(shí)對(duì)話功能。

我們還能用 AI 的聲音去做一些更有意義的事情。

今天,Rokid TTS 業(yè)務(wù)負(fù)責(zé)人方舟博士來(lái)到浙江特殊教育職業(yè)學(xué)院,與學(xué)生們聊聊人工智能技術(shù)能夠給生活帶去怎樣的改變。

例如,聽(tīng)障人士在 TTS 技術(shù)的幫助下,可以將文本內(nèi)容變成語(yǔ)音,借助語(yǔ)音助手來(lái)說(shuō)話,降低與他人溝通的難度。

Rokid 也借此機(jī)會(huì),向?qū)W生們捐贈(zèng)了智能音箱產(chǎn)品,希望通過(guò) AI 技術(shù)給他們的生活帶去更多便利和快樂(lè),讓每個(gè)人享受科技!

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • AI
    AI
    +關(guān)注

    關(guān)注

    87

    文章

    31028

    瀏覽量

    269365
  • TTS
    TTS
    +關(guān)注

    關(guān)注

    0

    文章

    42

    瀏覽量

    10800

原文標(biāo)題:AI 的聲音不自然?你可以試試這個(gè)

文章出處:【微信號(hào):Rokid1115,微信公眾號(hào):ROKID】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏

    評(píng)論

    相關(guān)推薦

    云打印機(jī)基于唯創(chuàng)知音語(yǔ)音播報(bào)+TTS語(yǔ)音合成)+離在線識(shí)別技術(shù)的五大語(yǔ)音方案

    AUTUMN前言當(dāng)下打印機(jī)使用越來(lái)越廣泛,品種也日益增多,從企業(yè)到商家到用戶,不同的客戶群體都有不同的需求。就拿語(yǔ)音播報(bào)來(lái)說(shuō),早先的打印機(jī)只做簡(jiǎn)單的文本打印功能,不帶語(yǔ)音播報(bào)提示,后來(lái)逐步加上語(yǔ)音
    的頭像 發(fā)表于 12-31 17:34 ?93次閱讀
    云打印機(jī)基于唯創(chuàng)知音<b class='flag-5'>語(yǔ)音</b>播報(bào)+<b class='flag-5'>TTS</b>(<b class='flag-5'>語(yǔ)音</b>合成)+離在線識(shí)別技術(shù)的五大<b class='flag-5'>語(yǔ)音</b>方案

    淘寶攜手Rokid上線3D購(gòu)物新體驗(yàn)

    在近日舉辦的Rokid Jungle 2024合作伙伴暨新品發(fā)布會(huì)上,Rokid創(chuàng)始人兼CEO Misa向外界透露了與淘寶的最新合作成果。這一合作將為廣大消費(fèi)者帶來(lái)前所未有的3D購(gòu)物體驗(yàn)。 據(jù)悉
    的頭像 發(fā)表于 11-19 11:29 ?523次閱讀

    語(yǔ)音提示器-WT3000A離在線TTS方案-打破語(yǔ)種限制/AI對(duì)話多功能支持

    TTS(Text To Speech )技術(shù)作為智能語(yǔ)音領(lǐng)域的重要組成部分,能夠?qū)⑽谋拘畔⑥D(zhuǎn)化為逼真的語(yǔ)音輸出,為各類硬件設(shè)備提供便捷的語(yǔ)音提示服務(wù)。本方案正是基于唯創(chuàng)知音的離在線
    的頭像 發(fā)表于 10-25 10:36 ?261次閱讀
    <b class='flag-5'>語(yǔ)音</b>提示器-WT3000A離在線<b class='flag-5'>TTS</b>方案-打破語(yǔ)種限制/AI對(duì)話多功能支持

    語(yǔ)音提示器-WT3000A離在線TTS方案-打破語(yǔ)種限制/AI對(duì)話多功能支持

    TTS(離線本地音樂(lè)播放與在線TTS合成播放結(jié)合)技術(shù),旨在為用戶打造一個(gè)智能、高效、人性化的語(yǔ)音提示解決方案。方案介紹SchemeIntroduction核心技術(shù):
    的頭像 發(fā)表于 10-25 08:11 ?253次閱讀
    <b class='flag-5'>語(yǔ)音</b>提示器-WT3000A離在線<b class='flag-5'>TTS</b>方案-打破語(yǔ)種限制/AI對(duì)話多功能支持

    中國(guó)科大-云知聯(lián)合團(tuán)隊(duì)斬獲CVPR2024開(kāi)放環(huán)境情感行為分析競(jìng)賽三項(xiàng)季軍

    日前, IEEE/CVF計(jì)算機(jī)視覺(jué)國(guó)際頂級(jí)會(huì)議——CVPR 2024公布第六屆開(kāi)放環(huán)境下情感行為分析國(guó)際挑戰(zhàn)賽(The 6th Workshop and Competition
    發(fā)表于 09-18 10:28 ?231次閱讀

    WT2605C TTS在線語(yǔ)音合成芯片:賦能多行業(yè)領(lǐng)域,引領(lǐng)產(chǎn)品智能化

    在當(dāng)今科技日新月異的時(shí)代,語(yǔ)音技術(shù)正逐步滲透到我們生活的方方面面,而TTS(Text-To-Speech,文本到語(yǔ)音)技術(shù)作為其中的重要一環(huán),更是以其獨(dú)特的魅力改變了人機(jī)交互的方式。WT2605C
    的頭像 發(fā)表于 09-12 15:54 ?338次閱讀
    WT2605C <b class='flag-5'>TTS</b>在線<b class='flag-5'>語(yǔ)音</b>合成芯片:賦能多行業(yè)領(lǐng)域,引領(lǐng)產(chǎn)品智能化

    收款機(jī)TTS語(yǔ)音芯片新方案:WT3000T8,雙語(yǔ)合成流暢,字庫(kù)解碼多樣!

    一:方案背景概述隨著科技的飛速發(fā)展,人工智能和語(yǔ)音識(shí)別技術(shù)在各個(gè)領(lǐng)域都得到了廣泛應(yīng)用。其中,文本轉(zhuǎn)語(yǔ)音TTS)技術(shù)以其獨(dú)特的優(yōu)勢(shì),在收款機(jī)語(yǔ)音播報(bào)收銀領(lǐng)域發(fā)揮著越來(lái)越重要的作用。本文
    的頭像 發(fā)表于 07-27 08:38 ?675次閱讀
    收款機(jī)<b class='flag-5'>TTS</b><b class='flag-5'>語(yǔ)音</b>芯片新方案:WT3000T8,雙語(yǔ)合成流暢,字庫(kù)解碼多樣!

    整合離線語(yǔ)音識(shí)別ASR和TTS,內(nèi)存映射時(shí)發(fā)生內(nèi)存不足怎么解決?

    start==end;,如果不加識(shí)別模型,TTS能正常和喚醒模型工作,這個(gè)問(wèn)題怎么解決,希望樂(lè)鑫給個(gè)方案。字典和模型的大小應(yīng)該都在3M左右吧,具體語(yǔ)音識(shí)別模型怎么加載進(jìn)來(lái)的?也是映射嗎? end1
    發(fā)表于 06-28 07:34

    中英文語(yǔ)音合成芯片(TTS芯片)WT3000T8-在ETC上的應(yīng)用案例

    隨著智能化浪潮的推進(jìn),ETC(電子不停車收費(fèi))系統(tǒng)已逐漸成為現(xiàn)代交通的重要組成部分。在這一背景下,唯創(chuàng)知音自主研發(fā)的WT3000T8中文轉(zhuǎn)語(yǔ)音合成芯片(TTS芯片)以其卓越的性能和廣泛的應(yīng)用前景,為ETC系統(tǒng)帶來(lái)了前所未有的智能體驗(yàn)。
    的頭像 發(fā)表于 05-28 09:47 ?463次閱讀

    【解讀】VTX316 TTS語(yǔ)音合成芯片幾個(gè)很實(shí)用的應(yīng)用技巧

    ? 前言 VTX316是北京宇音天下科技有限公司最新推出的一款更具性價(jià)比的中文TTS語(yǔ)音合成芯片,采用QFN32(4*4mm)封裝,體積更加精巧,文本合成一次高達(dá)500字節(jié)數(shù)據(jù)(250個(gè)漢字),支持
    的頭像 發(fā)表于 05-13 16:33 ?457次閱讀

    Rokid正式發(fā)布新一代AR Lite空間計(jì)算套裝

    Rokid正式發(fā)布新一代AR Lite空間計(jì)算套裝,包括Rokid Max2眼鏡和搭載驍龍平臺(tái)Rokid Station2主機(jī)。
    的頭像 發(fā)表于 04-22 09:54 ?695次閱讀

    WT3000T8-TTS語(yǔ)音合成芯片及應(yīng)用場(chǎng)景介紹

    TTS語(yǔ)音合成芯片是一種能夠?qū)⑽谋拘畔⑥D(zhuǎn)化為自然語(yǔ)音的專用芯片。它通過(guò)內(nèi)置的語(yǔ)音合成算法和音頻處理單元,實(shí)現(xiàn)了文本到語(yǔ)音的高效轉(zhuǎn)換,為各種智
    的頭像 發(fā)表于 04-18 18:03 ?906次閱讀

    【Longan Pi 3H 開(kāi)發(fā)板試用連載體驗(yàn)】給ChatGPT裝上眼睛,并且還可以語(yǔ)音對(duì)話:6,F(xiàn)astAPI服務(wù)器搭建與TTS播放

    Longan Pi完成全部處理后,需要將文字轉(zhuǎn)回語(yǔ)音返回給PC,那么這一步就需要用到TTS,文本轉(zhuǎn)語(yǔ)音。我使用的是EDGE-TTS庫(kù),這個(gè)庫(kù)使用非同步方法來(lái)處理流數(shù)據(jù),剛好FastAP
    發(fā)表于 04-16 12:54

    玩轉(zhuǎn)語(yǔ)音合成芯片(TTS芯片),看這一篇就夠了

    什么是語(yǔ)音合成芯片:語(yǔ)音合成芯片也稱為TTS芯片,即文字轉(zhuǎn)語(yǔ)音芯片,是一種能夠?qū)⑤斎氲奈淖中畔⑥D(zhuǎn)換為語(yǔ)音輸出的芯片。通過(guò)
    的頭像 發(fā)表于 03-19 18:13 ?1439次閱讀
    玩轉(zhuǎn)<b class='flag-5'>語(yǔ)音</b>合成芯片(<b class='flag-5'>TTS</b>芯片),看這一篇就夠了

    亞馬遜發(fā)布史上最大文本轉(zhuǎn)語(yǔ)音模型BASE TTS

    亞馬遜的人工智能研究團(tuán)隊(duì)近日宣布,他們成功開(kāi)發(fā)出了迄今為止規(guī)模最大的文本轉(zhuǎn)語(yǔ)音模型——BASE TTS。這款新模型擁有高達(dá)9.8億個(gè)參數(shù),不僅在規(guī)模上超越了之前的所有版本,還在能力上實(shí)現(xiàn)了質(zhì)的飛躍。
    的頭像 發(fā)表于 02-20 17:04 ?869次閱讀