0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

AI精確復(fù)制聲音, 真假“比爾·蓋茨”難辨

Gv1N_smartman16 ? 來源:yxw ? 2019-06-15 10:44 ? 次閱讀

近日, 臉書的研究人員成功克隆了微軟總裁比爾·蓋茨的聲音。

臉書人工智能研究中心的肖恩·瓦斯奎茲(Sean Vasquez)和邁克·劉易斯(Mike Lewis)于本周表示,他們已經(jīng)努力模仿人類語言有一段時間了。然而,模仿人類語言顯然是件難事,當(dāng)人們聽到斯蒂芬·霍金所使用的那套最著名的說話機器發(fā)聲時,會發(fā)現(xiàn)它聽起來仍然很不像人類。

但是現(xiàn)在,研究員們似乎已經(jīng)取得了進展。如果你聽了蓋茨的克隆所發(fā)出的聲音,我想你是會同意的。因為它聽起來很像比爾·蓋茨,你甚至很難分辨出它和他真實聲音的區(qū)別。

研究人員展示了他們的研究。在這里,機器模仿著蓋茨的腔調(diào)發(fā)聲,“請給你珍愛的朋友發(fā)一封充滿愛意的短信。”其中最不可思議的是,這臺機器在說“珍愛(cherish)”時,準(zhǔn)確無誤地捕捉到蓋茨不斷上升的語調(diào)變化的。

這項技術(shù)被稱為MelNet,可以用來復(fù)制人類的語調(diào)。到目前為止,蓋茨和其他許多人的聲音都被它完美地再現(xiàn)了。瓦斯奎茲和劉易斯說,克隆的音頻取自各類Ted演講。

兩位研究人員還表示,直到最近,文本到語音轉(zhuǎn)換軟件還不能很好地工作的原因是它使用了波形圖記錄聲音。這些圖顯示了聲音在幾秒鐘內(nèi)的音階變化。如果你聽到過蓋茨說“珍愛”這個詞,就知道他的語氣是變化劇烈的。在試圖模仿一個人的時候,深度學(xué)習(xí)機器必須預(yù)測到所有這些細(xì)微的變化,這很不容易。

瓦斯奎茲和劉易斯說,他們通過使用一種叫做光譜圖的東西來訓(xùn)練機器,成功地克隆了聲音。

研究人員說:“光譜圖的時間軸比波形圖的時間軸緊湊幾個數(shù)量級,這意味著在波形中跨越數(shù)萬個時間步長的依賴關(guān)系在光譜圖中只跨越數(shù)百個時間步長。這使得我們的光譜圖模型能夠在數(shù)秒內(nèi)記錄各種語音和音樂樣本,并保持它們一致性。”

不過,他們也經(jīng)歷了一些挫折。研究小組表示,對他們來說,幾乎完美地復(fù)制一個句子并不難,難的是復(fù)制那些在長達(dá)幾十秒或幾分鐘的時間里,顯示了情緒變化的復(fù)雜語調(diào)”。盡管如此,當(dāng)涉及到人機交互時,研究小組說,在只涉及簡短對話的情境中,這項技術(shù)可能會帶來革命性的變化。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • AI
    AI
    +關(guān)注

    關(guān)注

    87

    文章

    31262

    瀏覽量

    269627
  • 機器學(xué)習(xí)
    +關(guān)注

    關(guān)注

    66

    文章

    8428

    瀏覽量

    132835
  • 智能語音
    +關(guān)注

    關(guān)注

    10

    文章

    789

    瀏覽量

    48821

原文標(biāo)題:AI精確復(fù)制聲音, 真假“比爾·蓋茨”難辨

文章出處:【微信號:smartman163,微信公眾號:網(wǎng)易智能】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏

    評論

    相關(guān)推薦

    如何辨別網(wǎng)線真假

    辨別網(wǎng)線的真假可以從以下幾個方面入手: 一、查看包裝和標(biāo)識 檢查包裝:正品網(wǎng)線的包裝通常比較精美,紙質(zhì)較好,上面的印刷信息清晰,包括產(chǎn)品產(chǎn)地、執(zhí)行標(biāo)準(zhǔn)、種類、長度等。有些品牌還會在外包裝上貼上防偽
    的頭像 發(fā)表于 01-10 10:28 ?85次閱讀

    PW系列工控電腦復(fù)制機:效率與精度雙重提升

    進一步提升了數(shù)據(jù)復(fù)制的準(zhǔn)確性。PW系列復(fù)制機是企業(yè)在數(shù)據(jù)復(fù)制與管理中的理想選擇,幫助企業(yè)在處理復(fù)雜數(shù)據(jù)時變得更加高效和精確。
    的頭像 發(fā)表于 11-20 16:20 ?169次閱讀
    PW系列工控電腦<b class='flag-5'>復(fù)制</b>機:效率與精度雙重提升

    配置MySQL主從復(fù)制和讀寫分離

    配置MySQL主從復(fù)制和讀寫分離
    的頭像 發(fā)表于 10-23 11:44 ?518次閱讀
    配置MySQL主從<b class='flag-5'>復(fù)制</b>和讀寫分離

    友思特“未來視界”趣味實驗室 第2講:中草藥的高光譜成像

    “未來視界”趣味實驗室第2講:珍貴中草藥真假難辨,用高光譜成像系統(tǒng)就能一眼鑒別?友思特實驗室邀您一同探究!
    的頭像 發(fā)表于 09-26 13:32 ?236次閱讀
    友思特“未來視界”趣味實驗室 第2講:中草藥的高光譜成像

    如何搭建一個電流鏡電路,用于復(fù)制SiPM的電流?

    范圍大約為4mA~400mA。 如上圖所示,這是一個SiPM的讀出的ASIC電路結(jié)構(gòu)。圖中電流鏡能夠?qū)iPM的電流進行復(fù)制,并且可以按照一定比例縮小;我只需要進行精確復(fù)制,請問Ti有合適的器件嗎?
    發(fā)表于 08-02 07:38

    三星電容代理商怎么辨別真假呢?

    三星電容代理商 所代理產(chǎn)品辨別真假的方式有兩種,一種是先辨別 三星電容代理商 的真假,另一種就是根據(jù)三星電容的產(chǎn)品防偽標(biāo)志來進行辨別真假。今天針對這兩種方式給大家詳細(xì)的分享一下如何去針對這兩種方式
    的頭像 發(fā)表于 07-25 15:37 ?419次閱讀

    如何實現(xiàn)Python復(fù)制文件操作

    Python 中有許多“開蓋即食”的模塊(比如 os,subprocess 和 shutil)以支持文件 I/O 操作。在這篇文章中,你將會看到一些用 Python 實現(xiàn)文件復(fù)制的特殊方法。下面我們開始學(xué)習(xí)這九種不同的方法來實現(xiàn) Python 復(fù)制文件操作。
    的頭像 發(fā)表于 07-18 14:53 ?448次閱讀

    國科微AI首席科學(xué)家邢國良:打造全系邊端AI芯片,賦能下一代自動駕駛

    發(fā)展機遇,特別是車載平臺與基礎(chǔ)設(shè)施的互聯(lián)和協(xié)同將會大大提升自動駕駛的性能和安全性。當(dāng)前,國科微全系邊端AI芯片正在持續(xù)賦能車路協(xié)同,助力下一代自動駕駛技術(shù)加速落地。 在商業(yè)技術(shù)領(lǐng)域,據(jù)著名的比爾蓋茨法則,人們往往高估技
    的頭像 發(fā)表于 07-09 11:35 ?575次閱讀
    國科微<b class='flag-5'>AI</b>首席科學(xué)家邢國良:打造全系邊端<b class='flag-5'>AI</b>芯片,賦能下一代自動駕駛

    如何利用生成式人工智能進行精確編碼

    隨著技術(shù)的飛速發(fā)展,生成式人工智能(Generative AI)在軟件開發(fā)領(lǐng)域的應(yīng)用日益廣泛。生成式AI以其強大的學(xué)習(xí)和創(chuàng)造能力,為精確編碼提供了前所未有的可能性。本文將深入探討如何利用生成式人工智能進行
    的頭像 發(fā)表于 07-05 17:51 ?739次閱讀

    比爾·蓋茨展望AI:耳機與智能眼鏡引領(lǐng)人機交互新紀(jì)元

    在科技日新月異的今天,每一次技術(shù)的飛躍都預(yù)示著生活方式的深刻變革。7月4日,微軟公司的聯(lián)合創(chuàng)始人比爾·蓋茨,這位科技界的傳奇人物,在《下一個偉大的構(gòu)想》播客節(jié)目中,以其獨到的視角和前瞻性的思考,為
    的頭像 發(fā)表于 07-04 16:34 ?1011次閱讀

    比爾·蓋茨展望AI未來:從AI顧問到深度智能體的演變

    在科技日新月異的今天,人工智能(AI)作為引領(lǐng)未來變革的關(guān)鍵力量,其發(fā)展前景始終牽動著全球科技界與公眾的神經(jīng)。近日,微軟創(chuàng)始人比爾·蓋茨在知名播客節(jié)目《Next Big Idea Club》上,就
    的頭像 發(fā)表于 07-03 16:10 ?435次閱讀

    聲音測量的定義和典型應(yīng)用

    一、什么是聲音測量?聲音測量是聲學(xué)測量的一種。聲學(xué)測量是研究聲學(xué)測量技術(shù)的科學(xué),包括測量方法和測量儀器?;镜穆晫W(xué)測量包括聲強測量、聲質(zhì)點速度測量、波長測量、加速度測量、傳聲器和水聽器絕對校準(zhǔn)、通信
    的頭像 發(fā)表于 06-29 08:31 ?1860次閱讀
    <b class='flag-5'>聲音</b>測量的定義和典型應(yīng)用

    比爾·蓋茨斥資數(shù)十億美元,啟動未來核電站項目

    在全球能源需求日益增長,而環(huán)保呼聲日益高漲的當(dāng)下,比爾·蓋茨的又一重要戰(zhàn)略布局備受矚目。6月17日,據(jù)外媒報道,微軟創(chuàng)始人比爾·蓋茨在公開場合宣布,他準(zhǔn)備在美國懷俄明州投入數(shù)十億美元,
    的頭像 發(fā)表于 06-17 16:08 ?494次閱讀

    比爾·蓋茨在微軟仍掌握關(guān)鍵影響力

    據(jù)悉,蓋茨曾在2017年組織高層會晤,參與者包括時任CEO薩蒂亞·納德拉及多位高管。會上,蓋茨提出了“AI代理人”的概念,認(rèn)為它們將超越Siri和Alexa,成為強大的個人助手,引領(lǐng)新世界秩序。這一觀點促使微軟與OpenAI建立
    的頭像 發(fā)表于 04-30 11:13 ?690次閱讀

    微軟與OpenAI聯(lián)手打造聲音識別AI技術(shù)專利

    這款創(chuàng)新的系統(tǒng)旨在通過辨別環(huán)境音響,為使用者提供潛在風(fēng)險預(yù)警,對于公共安全及災(zāi)害預(yù)控領(lǐng)域具有不可估量的價值。它的關(guān)鍵技術(shù)在于對聲音信號的深度分析與處理。
    的頭像 發(fā)表于 04-09 15:55 ?342次閱讀