1月15日消息 近日,微軟在全球范圍內(nèi)對 Cortana 進行了神經(jīng)網(wǎng)絡(luò)語音全面升級,升級后的 Cortana 更加自然流暢,語音效果堪比真人發(fā)音。
IT之家獲悉,此次升級利用了深度神經(jīng)網(wǎng)絡(luò)技術(shù),打破重讀和語調(diào)的傳統(tǒng)語音合成限制。韻律預(yù)測和語音合成以同步方式執(zhí)行,使輸出聽起來更流暢且自然。該項技術(shù)能夠更流暢地將數(shù)字文本(如電子書)轉(zhuǎn)換為有聲讀物,也可以使得與聊天機器人和語音助手的交流更加自然,且富有吸引力。
微軟的神經(jīng)網(wǎng)絡(luò)語音已在全球部署,可通過 PC 瀏覽器免費試用。
責(zé)任編輯:PSY
聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。
舉報投訴
-
微軟
-
神經(jīng)網(wǎng)絡(luò)
-
語音
-
Cortana
相關(guān)推薦
重新訓(xùn)練神經(jīng)網(wǎng)絡(luò)是一個復(fù)雜的過程,涉及到多個步驟和考慮因素。 引言 神經(jīng)網(wǎng)絡(luò)是一種強大的機器學(xué)習(xí)模型,廣泛應(yīng)用于圖像識別、自然語言處理、語音識別等領(lǐng)域。然而,隨著時間的推移,數(shù)據(jù)分布可能會
發(fā)表于 07-11 10:25
?501次閱讀
BP神經(jīng)網(wǎng)絡(luò)和人工神經(jīng)網(wǎng)絡(luò)(Artificial Neural Networks,簡稱ANNs)之間的關(guān)系與區(qū)別,是神經(jīng)網(wǎng)絡(luò)領(lǐng)域中一個基礎(chǔ)且重要的話題。本文將從定義、結(jié)構(gòu)、算法、應(yīng)用及未來發(fā)展等多個方面,詳細闡述BP
發(fā)表于 07-10 15:20
?1245次閱讀
RNN(Recurrent Neural Network)是循環(huán)神經(jīng)網(wǎng)絡(luò),而非遞歸神經(jīng)網(wǎng)絡(luò)。循環(huán)神經(jīng)網(wǎng)絡(luò)是一種具有時間序列特性的神經(jīng)網(wǎng)絡(luò),能夠處理序列數(shù)據(jù),具有記憶功能。以下是關(guān)于循環(huán)
發(fā)表于 07-05 09:52
?620次閱讀
人工神經(jīng)網(wǎng)絡(luò)(Artificial Neural Networks, ANNs)是一種模擬人腦神經(jīng)元網(wǎng)絡(luò)的計算模型,它在許多領(lǐng)域,如圖像識別、語音識別、自然語言處理、預(yù)測分析等有著廣泛的應(yīng)用。本文將
發(fā)表于 07-05 09:13
?1318次閱讀
。 遞歸神經(jīng)網(wǎng)絡(luò)的概念 遞歸神經(jīng)網(wǎng)絡(luò)是一種具有短期記憶功能的神經(jīng)網(wǎng)絡(luò),它能夠處理序列數(shù)據(jù),如時間序列、文本、語音等。與傳統(tǒng)的前饋神經(jīng)網(wǎng)絡(luò)不同
發(fā)表于 07-04 14:54
?845次閱讀
神經(jīng)網(wǎng)絡(luò)在許多領(lǐng)域都有廣泛的應(yīng)用,如語音識別、圖像識別、自然語言處理等。然而,BP神經(jīng)網(wǎng)絡(luò)也存在一些問題,如容易陷入局部最優(yōu)解、訓(xùn)練時間長、對初始權(quán)重敏感等。為了解決這些問題,研究者們提出了一些改進的BP
發(fā)表于 07-04 09:51
?497次閱讀
神經(jīng)網(wǎng)絡(luò)在許多領(lǐng)域都有廣泛的應(yīng)用,如語音識別、圖像識別、自然語言處理等。然而,BP神經(jīng)網(wǎng)絡(luò)也存在一些問題,如容易陷入局部最優(yōu)解、訓(xùn)練時間長、對初始權(quán)重敏感等。為了解決這些問題,研究者們提出了一些改進的BP
發(fā)表于 07-03 11:00
?849次閱讀
Network)有相似之處,但它們之間還是存在一些關(guān)鍵的區(qū)別。 一、引言 神經(jīng)網(wǎng)絡(luò)是一種模擬人腦神經(jīng)元結(jié)構(gòu)的計算模型,它由大量的神經(jīng)元(或稱為節(jié)點)組成,這些神經(jīng)元通過權(quán)重連接在一起
發(fā)表于 07-03 10:14
?915次閱讀
卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Network,簡稱CNN)是一種深度學(xué)習(xí)模型,廣泛應(yīng)用于圖像識別、語音識別、自然語言處理等領(lǐng)域。本文將詳細介紹卷積神經(jīng)網(wǎng)絡(luò)的基本原理
發(fā)表于 07-02 15:30
?1334次閱讀
卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Network,簡稱CNN)是一種深度學(xué)習(xí)模型,廣泛應(yīng)用于圖像識別、語音識別、自然語言處理等領(lǐng)域。本文將詳細介紹卷積神經(jīng)網(wǎng)絡(luò)的原理,包括其
發(fā)表于 07-02 14:44
?759次閱讀
神經(jīng)網(wǎng)絡(luò)是一種強大的機器學(xué)習(xí)技術(shù),可以用于各種不同的應(yīng)用。以下是一些神經(jīng)網(wǎng)絡(luò)建模的適用范圍: 圖像識別和分類 神經(jīng)網(wǎng)絡(luò)在圖像識別和分類方面具有顯著的優(yōu)勢。它們可以用于識別和分類各種類型
發(fā)表于 07-02 11:40
?671次閱讀
、語音識別、自然語言處理等多個領(lǐng)域。本文將對幾種主要的神經(jīng)網(wǎng)絡(luò)架構(gòu)進行詳細介紹,包括前饋神經(jīng)網(wǎng)絡(luò)、循環(huán)神經(jīng)網(wǎng)絡(luò)、卷積神經(jīng)網(wǎng)絡(luò)、生成對抗
發(fā)表于 07-01 14:16
?825次閱讀
神經(jīng)網(wǎng)絡(luò)是人工智能領(lǐng)域的重要分支,廣泛應(yīng)用于圖像識別、自然語言處理、語音識別等多個領(lǐng)域。然而,要使神經(jīng)網(wǎng)絡(luò)在實際應(yīng)用中取得良好效果,必須進行有效的訓(xùn)練和優(yōu)化。本文將從
發(fā)表于 07-01 14:14
?512次閱讀
現(xiàn)代語音增強算法利用大量遞歸神經(jīng)網(wǎng)絡(luò)(RNNs)實現(xiàn)了顯著的噪聲抑制。然而,大型RNN限制了助聽器硬件(hearing aid hardware,HW)的實際部署,這些硬件是電池供電的,運行在資源
發(fā)表于 06-07 11:29
抑制任務(wù)是語音增強領(lǐng)域的一個重要學(xué)科, 隨著深度神經(jīng)網(wǎng)絡(luò)的興起,提出了幾種基于深度模型的音頻處理新方法[1,2,3,4]。然而,這些通常是為離線處理而開發(fā)的,不需要考慮實時性。當(dāng)使用神經(jīng)網(wǎng)絡(luò)
發(fā)表于 05-11 17:15
評論