0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

微軟在文本到語音合成方面達到了一個新的里程碑

DPVg_AI_era ? 來源:未知 ? 作者:李倩 ? 2018-09-26 09:09 ? 次閱讀

微軟在Ignite會議上推出新的神經(jīng)文本-語音合成(TTS)利器!這項新服務(wù)生成的語音在節(jié)奏、語調(diào)和頓挫感上都幾乎和真人一樣,具備人類語音一樣的自然韻律和詞匯清晰度。目前該服務(wù)已經(jīng)發(fā)布預(yù)覽版,開發(fā)者可申請嘗鮮!

微軟在文本到語音合成方面達到了一個新的里程碑,利用深度神經(jīng)網(wǎng)絡(luò),使計算機合成的聲音幾乎與真人的錄音無法區(qū)分。合成的聲音具備和人類語音一樣的自然韻律和明確的詞匯清晰度,用戶在與AI系統(tǒng)進行交互時,可以顯著降低聽覺疲勞。

微軟技術(shù)院士、語音和語言團隊負(fù)責(zé)人黃學(xué)東(Xuedong Huang)表示:

語音是推動環(huán)境計算開發(fā)的新界面,因為語音識別已經(jīng)改變了我們的日常生活,從數(shù)字化助理、電子郵件和文檔內(nèi)容的聽寫、再到記錄演講和會議內(nèi)容。由于微軟多年來在語音識別方面的研究,以及一直處于最前沿的神經(jīng)網(wǎng)絡(luò)技術(shù)的跨越式進步,這些方案在今天仍然可行。

隨著微軟Azure GPU加速的虛擬機規(guī)模的不斷擴展,如ND v2使用的8路互聯(lián)NVIDIA Tesla V100 GPU以及基于Skylake的處理器,我們有可能快速提高大規(guī)模語音識別模型的訓(xùn)練速度,為Cortana,Skype翻譯,Windows和Office提供支持。期待這些服務(wù)的發(fā)布!“

黃學(xué)東

新文本-語音合成服務(wù)已經(jīng)可預(yù)覽,開發(fā)者可嘗鮮

黃學(xué)東表示,微軟的團隊本周在佛羅里達州奧蘭多舉行的Microsoft Ignite會議上展示了這個神經(jīng)網(wǎng)絡(luò)驅(qū)動的文本到語音合成功能。該功能目前可通過Azure Cognitive Services語音服務(wù)進行預(yù)覽。

該功能可以讓聊天機器人和虛擬助理的交互更自然、更具吸引力,比如將電子書等數(shù)字化文本轉(zhuǎn)換為有聲讀物,讓車載導(dǎo)航系統(tǒng)的功能更加強大等。

這項文本-語音轉(zhuǎn)換功能是微軟在過去兩年中取得的一系列突破之一,其他技術(shù)突破還包括在會話語音識別和機器翻譯中達到與人類大體相當(dāng)?shù)乃健?/p>

神經(jīng)文本到語音合成(TTS):聲音和真人一樣

微軟此次發(fā)布的文本到語音合成技術(shù),利用深度神經(jīng)網(wǎng)絡(luò)來克服傳統(tǒng)的文本到語音轉(zhuǎn)換系統(tǒng)的局限性,匹配口語中的語音頓挫和語調(diào)模式和韻律,并將語音單元合成為計算機語音。

傳統(tǒng)的文本到語音系統(tǒng)將韻律分解為單獨的語言分析和聲學(xué)預(yù)測,這些步驟分別由獨立模型控制。這可能導(dǎo)致合成后的語音結(jié)果過于低沉和嘈雜。微軟的系統(tǒng)能夠同時進行韻律預(yù)測和語音合成,合成的聲音更加流暢自然。

利用微軟Azure的計算能力,該服務(wù)可以提供實時流,這對于與聊天機器人或虛擬助手進行交互等場景是非常有用的。

微軟將在Azure Kubernetes服務(wù)中提供該功能。這可以確保了這一功能具備較高的高可擴展性和可用性,讓客戶能夠從單個端點使用基于神經(jīng)網(wǎng)絡(luò)的文本到語音轉(zhuǎn)換和傳統(tǒng)的文本到語音轉(zhuǎn)換服務(wù)。

目前預(yù)覽版的服務(wù)提供兩種預(yù)先構(gòu)建的英語文本-語音轉(zhuǎn)換服務(wù),有男女兩種聲音(Jessa和Guy)。未來即將推出更多語言,以及49種語言的定制服務(wù),為希望構(gòu)建針對其特定需求而優(yōu)化語音的客戶提供定制化服務(wù)。

文本-語音轉(zhuǎn)換服務(wù)的典型應(yīng)用場景

提高可訪問性:文本-語音轉(zhuǎn)換技術(shù)使得內(nèi)容所有者和發(fā)布者能夠響應(yīng)人們與其內(nèi)容交互的不同方式。憑借該技術(shù),視力有障礙或閱讀困難的人也能夠通過聽覺來消費內(nèi)容。語音輸出還能使人們在上下班或鍛煉時更容易通過移動設(shè)備上獲取文本內(nèi)容,比如報紙或博客。

多任務(wù)場景下的反應(yīng):文本-語音轉(zhuǎn)換技術(shù)讓人們能夠在駕駛時、或不便閱讀的環(huán)境中快速舒適地吸收重要信息。該領(lǐng)域的常見應(yīng)用是導(dǎo)航服務(wù)。

增強多模式學(xué)習(xí):不同的人有不同的最佳學(xué)習(xí)方式。在線學(xué)習(xí)專家發(fā)現(xiàn),同時提供語音和文本有助于讓信息更加易于學(xué)習(xí)。

開發(fā)認(rèn)知機器人和助理:對話能力可能是智能聊天機器人或虛擬助手的重要組成部分。越來越多的公司正在開發(fā)聊天機器人,為客戶提供引人入勝的服務(wù)體驗。該技術(shù)為聊天機器人和數(shù)字化助理的響應(yīng)方式增加了一個新的維度。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 微軟
    +關(guān)注

    關(guān)注

    4

    文章

    6610

    瀏覽量

    104159
  • 神經(jīng)網(wǎng)絡(luò)

    關(guān)注

    42

    文章

    4773

    瀏覽量

    100889

原文標(biāo)題:微軟文本-語音合成轉(zhuǎn)換技術(shù)新里程碑!完美再現(xiàn)真人聲調(diào)

文章出處:【微信號:AI_era,微信公眾號:新智元】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏

    評論

    相關(guān)推薦

    e絡(luò)盟達成micro:bit分銷里程碑

    近日,全球電子元器件產(chǎn)品與解決方案分銷商e絡(luò)盟,與合作伙伴Micro:bit教育基金會共同宣布了項重要里程碑:e絡(luò)盟成功制造并分銷了超過1000萬臺BBC micro:bit計算機。這
    的頭像 發(fā)表于 12-23 16:26 ?252次閱讀

    破萬億!中國芯片出口迎來里程碑

    全球科技競爭日益激烈的今天,中國芯片產(chǎn)業(yè)的發(fā)展備受矚目。根據(jù)海關(guān)總署最新公布的數(shù)據(jù),2023年前11月,中國集成電路出口額首次突破1萬億元人民幣,同比增長20.3%,這一里程碑式的成就標(biāo)志著中國
    的頭像 發(fā)表于 12-17 16:43 ?514次閱讀
    破萬億!中國芯片出口迎來<b class='flag-5'>里程碑</b>

    e絡(luò)盟實現(xiàn)重要里程碑:成功分銷 1000 萬套 micro:bit 設(shè)備

    安富利旗下全球電子元器件產(chǎn)品與解決方案分銷商e絡(luò)盟與合作伙伴 Micro:bit 教育基金會日前攜手宣布,e絡(luò)盟成功達成了制造并分銷超過 1000 萬臺 BBC micro:bit 計算機的重大里程碑,以幫助全球青少年通過物理計算發(fā)現(xiàn)編程的樂趣。
    的頭像 發(fā)表于 12-12 10:34 ?196次閱讀
    e絡(luò)盟實現(xiàn)重要<b class='flag-5'>里程碑</b>:成功分銷 1000 萬套 micro:bit 設(shè)備

    Coherent 高意已實現(xiàn)出貨150,000OPSL的里程碑

    150,000 OPSL 且仍在增加Coherent 高意的里程碑成就展現(xiàn)了光泵半導(dǎo)體激光器 (OPSL) 的持久優(yōu)勢。我們于 2002 年將第款 OPSL(488 nm 藍色
    的頭像 發(fā)表于 11-22 06:31 ?168次閱讀
    Coherent 高意已實現(xiàn)出貨150,000<b class='flag-5'>個</b>OPSL的<b class='flag-5'>里程碑</b>

    比亞迪達成新能源汽車下線千萬輛里程碑

    近日,比亞迪迎來了其發(fā)展歷程中的重要里程碑——第1000萬輛新能源汽車正式下線。這歷史性的時刻標(biāo)志著比亞迪新能源汽車領(lǐng)域的卓越成就和
    的頭像 發(fā)表于 11-19 14:16 ?587次閱讀

    黑芝麻智能與Nullmax達成重要合作里程碑

    近日,自動駕駛技術(shù)領(lǐng)域的兩大領(lǐng)先企業(yè)——黑芝麻智能與Nullmax宣布達成了項重要的合作里程碑。雙方基于黑芝麻智能的武當(dāng)C1200家族芯片,共同推出了BEV無圖方案,并成功實現(xiàn)了NOA領(lǐng)航輔助、記憶行車及記憶泊車等高階智能駕駛功能。
    的頭像 發(fā)表于 10-10 18:15 ?649次閱讀

    愛瑪機電突破千萬臺電機產(chǎn)量里程碑

     電動車行業(yè)迎來新里程碑的9月25日,愛瑪科技集團股份有限公司(以下簡稱“愛瑪科技”)宣布其機電事業(yè)部成功實現(xiàn)累計產(chǎn)量從300萬臺1000萬臺的飛躍。這成就不僅標(biāo)志著愛瑪機電
    的頭像 發(fā)表于 09-26 17:07 ?676次閱讀

    特斯拉里程碑達成:第1億顆4680電池震撼問世

    特斯拉的4680電池技術(shù)再次跨越重要里程碑,公司于9月15日欣然宣布,其第1億顆創(chuàng)新性的4680電池已成功下線,這成就標(biāo)志著特斯拉電池制造領(lǐng)域的飛速進展。特斯拉首席執(zhí)行官埃隆·馬斯克通過社交媒體向辛勤工作的電池團隊致以熱烈祝
    的頭像 發(fā)表于 09-18 15:30 ?1269次閱讀

    Waymo自動駕駛里程碑:Alphabet引領(lǐng)未來出行新篇章

    聚焦于Waymo近期達成的周內(nèi)完成10萬次行程的里程碑成就,這壯舉自動駕駛行業(yè)發(fā)展中無疑投下了震撼彈。
    的頭像 發(fā)表于 08-26 17:14 ?1201次閱讀

    特斯拉迎來里程碑:全球第1000萬電驅(qū)系統(tǒng)下線

    科技日新月異的今天,電動汽車行業(yè)的領(lǐng)軍企業(yè)特斯拉再次以非凡的成就震撼全球。8月1日,特斯拉官方宣布了具有歷史意義的消息——全球第1000萬電驅(qū)系統(tǒng)正式下線,標(biāo)志著特斯拉
    的頭像 發(fā)表于 08-01 16:40 ?1118次閱讀

    谷歌等14家科技巨頭聯(lián)合成立安全AI聯(lián)盟

    7月18日舉行的阿斯彭安全論壇上,全球科技界的領(lǐng)軍力量——谷歌、微軟、亞馬遜、英特爾、英偉達、IBM、思科、Paypal、OpenAI等14家頂尖企業(yè),共同宣布了具有
    的頭像 發(fā)表于 07-19 15:38 ?443次閱讀

    國產(chǎn)通信衛(wèi)星新里程碑:亞太6E全電推衛(wèi)星正式運營

    中國航天科技集團于7月15日宣布了項重大成就——國產(chǎn)首顆全電推通信衛(wèi)星亞太6E,經(jīng)過系列嚴(yán)格的軌技術(shù)驗收評審后,于香港圓滿完成了所有測試流程,正式邁入運營階段。這
    的頭像 發(fā)表于 07-15 16:57 ?1244次閱讀

    WT3000T8-TTS語音合成芯片及應(yīng)用場景介紹

    TTS語音合成芯片是種能夠?qū)?b class='flag-5'>文本信息轉(zhuǎn)化為自然語音的專用芯片。它通過內(nèi)置的語音
    的頭像 發(fā)表于 04-18 18:03 ?907次閱讀

    它人機器人與俄羅斯的AVIALIFT正式攜手,達成里程碑式合作

    4月15日,它人機器人與俄羅斯的AVIALIFT正式攜手,達成里程碑式合作。這次合作不僅將我們的機器人產(chǎn)品、尖端技術(shù)和優(yōu)質(zhì)服務(wù)帶到了廣袤的俄羅斯,更是它人機器人在國際舞臺上的大飛躍。
    的頭像 發(fā)表于 04-17 09:26 ?572次閱讀
    它人機器人與俄羅斯的AVIALIFT正式攜手,達成<b class='flag-5'>里程碑</b>式合作

    語音合成技術(shù)智能駕駛中的創(chuàng)新與應(yīng)用

    、引言 隨著智能駕駛技術(shù)的不斷發(fā)展,人機交互變得越來越重要。語音合成技術(shù)作為人機交互的重要手段,智能駕駛中發(fā)揮著越來越重要的作用。本文將探討語音
    的頭像 發(fā)表于 02-01 18:09 ?670次閱讀