0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

AI語音克隆技術(shù),或是播客行業(yè)長久發(fā)展的終極解決方案

如意 ? 來源:科技行者 ? 作者:科技行者 ? 2020-10-08 14:10 ? 次閱讀

播客行業(yè)正朝著更加輕松自然、非正式性的音頻敘事方向發(fā)展。這種較少使用嚴(yán)肅用語的傳播形式,也成功拉近了主播與聽眾間的溝通距離。

換句話說,主播們盡可能使用口語表達,降低表述內(nèi)容的理解與反應(yīng)難度。也正是憑借著這種通俗易懂優(yōu)勢,音頻敘事變得越來越流行,相關(guān)調(diào)查數(shù)據(jù)也證明了這一發(fā)展趨勢。

根據(jù)Statista公布的統(tǒng)計結(jié)果,2018年全美播客收聽者已經(jīng)達到7500萬;預(yù)計到2024年,月收聽用戶將增長至1.64億。由此估計,2019年至2023年之間播客聽眾的復(fù)合年增長率將高達17%。

2020年,四分之三的美國民眾明確知曉播客為何物,其中超過半數(shù)(55%)的受訪者已經(jīng)開始收聽播客。而作為全球收入最高的播客,喬·羅根(Joe Rogan)的《喬·羅根體驗》(The Joe Rogan Experience)節(jié)目在2019年獲得高達5000萬美元銷售額,月均下載近2億次。

目前,播客行業(yè)面對的主要問題在于如何在維持內(nèi)容獨立性的同時,獲取支持行業(yè)快速增長的必要資源。終于進入正題——人工智能等突破性技術(shù)帶來的語音克隆功能,也許能夠帶來重要的解決手段,或者至少是部分解決方案。

以尼克松(Nixon)項目為例,其以令人信服的結(jié)果證明AI技術(shù)完全能夠重現(xiàn)出與人類對象沒有任何區(qū)別的語音效果。麻省理工學(xué)院的一組研究人員、新聞工作者及藝術(shù)家,同語音克隆廠商Respeecher及VDR公司Canny AI開展合作,共同創(chuàng)造出模擬得出的首次登月通話記錄——只是這一次,宇航員阿姆斯特朗與奧德林未能完成任務(wù),并被困在了月球上。

他們甚至還“偽造”了時任美國總統(tǒng)的尼克松的視頻,向全世界宣告此次登月之旅的悲慘失敗。

當(dāng)播客遇上AI

計算機化語音的主要挑戰(zhàn),在于如何復(fù)制人類表達以及其中的種種細(xì)微差別,同時盡力避免機器音的存在。而在識別并重現(xiàn)細(xì)微聲音變化元素方面,以人工智能為基礎(chǔ)的語音轉(zhuǎn)換技術(shù)為我們指明了一條可行的發(fā)展道路。

蘋果Sir、Amazon Alexa、微軟Cortana以及Google Assistant等語音助手仍在使用文本到語音轉(zhuǎn)換技術(shù)。雖然這種技術(shù)的實用性確實很高,但卻很難帶來不同的語音類型。以Siri為例,要想實現(xiàn)老年男性的語音效果,除了需要引入龐大的預(yù)錄制文件之外,Siri還無法處理該音頻文件中未能包含的單詞。在這方面,AI支持下的語音到語音轉(zhuǎn)換就成了新的突破口。

如何將AI語音克隆應(yīng)用于播客領(lǐng)域?

人工智能不僅能夠?qū)崿F(xiàn)語音克隆,還能夠在任意播客節(jié)目中完美復(fù)制一切語音效果。其中使用的是一項名為“智能雞尾酒”的經(jīng)典數(shù)字信號處理算法,外加專用的深度生成建模技術(shù)——允許內(nèi)容制作者使用最適合的聲音解決以往難以實現(xiàn)的錄制效果(例如播報員有其他工作,或者需要重現(xiàn)某位已經(jīng)去世的配音演員的音色等)。

下面來看幾種語音克隆技術(shù)在播客制作領(lǐng)域的可行用例:

1. 讓名人加入您的節(jié)目

我們很難請到知名演員、作家、運動員等參與您的節(jié)目,但如果使用人工智能技術(shù)復(fù)制他們的聲音,就可以既輕松實現(xiàn)同樣的效果、又不必勞煩他們親自到錄音棚跑一趟。以此為基礎(chǔ),聽眾們能夠聽到自己喜愛的聲音,節(jié)目制作方與名人們也省去了勞頓之苦。

2. 重現(xiàn)舊日之聲

語音克隆能夠讓已經(jīng)去世的演員們再次獻聲。想不想讓肯尼迪總統(tǒng)為歷史播客配上旁白?沒有問題,語音轉(zhuǎn)換技術(shù)能夠精確重現(xiàn)他的聲音——是的,不只是“相似”,而是真正的完美還原。

3. 使用童聲朗讀,又不用強迫孩子們長時間工作

孩子們講話總是非常有趣,這種趣味性不一定體現(xiàn)在內(nèi)容上,而更多在于他們的語音、語氣和語調(diào)當(dāng)中。但與孩子們一同工作可是相當(dāng)費心費力。通過語音合成技術(shù),我們可以讓專業(yè)演員念出孩子的臺詞,再將其轉(zhuǎn)換為童聲效果,大大簡化節(jié)目制作流程。

4. 快速推進節(jié)目制作進度,保證播客及時播出

AI可以瞬間重現(xiàn)人聲,而且短時間內(nèi)就可以提供高質(zhì)量的目標(biāo)語音成果。

總結(jié)

2017年,全球播客市場帶來的廣告收入高達2.2億美元,且每年都在翻番。而用戶參與度的提升,將成為吸引潛在廣告客戶的核心動力。更重要的是,播客中的廣告其實效果極佳,調(diào)查顯示此類廣告擁有近90%的播放完成率。

此外,廣告客戶甚至愿意為某些播客節(jié)目支付 高達30美元的CPM(廣告每千次展示成本)。單說這個數(shù)字大家可能沒有概念,但Facebook上的每千次廣告展示成本約為6美元。

網(wǎng)絡(luò)電視正在緩慢但堅定地取代著有線電視,播客與傳統(tǒng)廣播之間的關(guān)系似乎也是這樣。而單純從傳統(tǒng)廣播類廣告出發(fā),播客行業(yè)至少還能夠吸引到額外約200億美元收入。而正如我們在文章開頭提到,播客節(jié)目能夠吸引到大量原本根本不聽廣播的群體,因此其利潤增長期望可謂一片光明。

這些調(diào)查數(shù)字表明,播客業(yè)務(wù)將長久存在,同時也迫切需要音頻內(nèi)容制作者們找到效率更高、效果更好的節(jié)目產(chǎn)出方法。

也許AI語音克隆技術(shù),正是幫助播客行業(yè)在內(nèi)容獨立性與節(jié)目制作資源需求間找到完美平衡的終極解決方案。
責(zé)編AJX

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 音頻
    +關(guān)注

    關(guān)注

    29

    文章

    2896

    瀏覽量

    81763
  • 語音
    +關(guān)注

    關(guān)注

    3

    文章

    385

    瀏覽量

    38091
  • AI
    AI
    +關(guān)注

    關(guān)注

    87

    文章

    31399

    瀏覽量

    269787
收藏 人收藏

    評論

    相關(guān)推薦

    廣和通發(fā)布AI玩具大模型解決方案

    玩具行業(yè)的新篇章。 這一解決方案的最大亮點在于其高度的集成性和智能化。無需外接MCU,即可輕松實現(xiàn)音視頻及圖像的實時傳輸、精準(zhǔn)的語音識別、流暢的自然語言處理以及強大的機器學(xué)習(xí)功能。通過擬人、擬動物或擬IP的生動形式,該
    的頭像 發(fā)表于 01-21 14:45 ?141次閱讀

    廣和通AI解決方案內(nèi)置大模型,讓玩具成為你的智慧伙伴

    廣和通推出AI玩具大模型解決方案,該方案深度融合豆包等AI大模型、內(nèi)置廣和通Cat.1模組,助力智能玩具實現(xiàn)AI化升級。該
    的頭像 發(fā)表于 01-21 11:03 ?117次閱讀
    廣和通<b class='flag-5'>AI</b><b class='flag-5'>解決方案</b>內(nèi)置大模型,讓玩具成為你的智慧伙伴

    廣和通推出AI玩具大模型解決方案

    廣和通推出AI玩具大模型解決方案,該方案深度融合豆包等AI大模型、內(nèi)置廣和通Cat.1模組,助力智能玩具實現(xiàn)AI化升級。該
    的頭像 發(fā)表于 01-21 10:27 ?56次閱讀

    MediaTek與意騰科技CES 2025共展多元AI語音方案

    直觀的生活方式。 雙方將共同致力于提升用戶與汽車、智能設(shè)備之間的互動體驗。通過集成先進的AI技術(shù),這些解決方案將能夠準(zhǔn)確識別用戶的語音指令,并迅速作出響應(yīng),從而實現(xiàn)更加流暢、自然的人機
    的頭像 發(fā)表于 01-10 14:10 ?134次閱讀

    企業(yè)AI解決方案包括哪些內(nèi)容

    企業(yè)AI解決方案是一種集成了人工智能技術(shù)的綜合性方案,旨在提高企業(yè)運營效率、降低成本、優(yōu)化業(yè)務(wù)流程,并提升企業(yè)的整體競爭力。那么,企業(yè)AI
    的頭像 發(fā)表于 01-10 10:15 ?87次閱讀

    廣和通發(fā)布AI Buddy產(chǎn)品及解決方案,創(chuàng)新AI智能終端

    1月9日,在2025國際消費電子展覽會(CES)期間,廣和通發(fā)布集智能語音交互及翻譯、4G/5G全球漫游、隨身熱點、智能娛樂、充電續(xù)航等功能于一體的AIBuddy(AI陪伴)產(chǎn)品及解決方案,創(chuàng)新
    的頭像 發(fā)表于 01-09 18:24 ?264次閱讀
    廣和通發(fā)布<b class='flag-5'>AI</b> Buddy產(chǎn)品及<b class='flag-5'>解決方案</b>,創(chuàng)新<b class='flag-5'>AI</b>智能終端

    聯(lián)發(fā)科攜手意騰科技,于CES 2025展出多元AI語音方案

    近日,聯(lián)發(fā)科與意騰科技宣布,將協(xié)同合作為車用、智慧家庭,以及智慧零售市場打造創(chuàng)新的AI語音解決方案,并于CES 2025展出。雙方合作將致力于提升用戶與汽車、智能設(shè)備的互動體驗,為全球用戶帶來更智能
    的頭像 發(fā)表于 01-08 10:03 ?137次閱讀

    AI與HPC技術(shù)推動先進封裝行業(yè)發(fā)展

    “隨著人工智能(AI)和高性能計算(HPC)技術(shù)的迅猛發(fā)展,半導(dǎo)體行業(yè)也迎來了新的變革浪潮?!薄@句話在2024年的今天,早已被喻為行業(yè)
    的頭像 發(fā)表于 10-22 11:22 ?487次閱讀

    賽富時將收購AI語音代理公司Tenyx

    科技巨頭賽富時近日宣布了一項重要戰(zhàn)略舉措,正式達成收購人工智能語音代理公司Tenyx的協(xié)議。此次收購旨在進一步鞏固賽富時在AI領(lǐng)域的領(lǐng)先地位,通過整合Tenyx的先進技術(shù),加速其人工智能驅(qū)動
    的頭像 發(fā)表于 09-04 16:30 ?412次閱讀

    基于Realtek的智能語音服務(wù)解決方案

    最為著名的應(yīng)用之一是語音助手。自從蘋果推出SIRI以來,智能語音互動應(yīng)用得到了迅猛發(fā)展。為滿足這一趨勢,瑞昱半導(dǎo)體(Realtek)推出了智能語音服務(wù)
    發(fā)表于 06-14 16:08 ?1次下載

    MK米方德的AI智能存儲解決方案

    隨著人工智能(AI技術(shù)的飛速發(fā)展,我們正步入一個前所未有的智能時代。AI不僅在改變著我們的生活方式,也在深刻影響著各行各業(yè)的發(fā)展。在眾多領(lǐng)
    的頭像 發(fā)表于 05-27 10:04 ?482次閱讀
    MK米<b class='flag-5'>客</b>方德的<b class='flag-5'>AI</b>智能存儲<b class='flag-5'>解決方案</b>

    USB AI話務(wù)語音降噪音頻方案

    USB AI話務(wù)語音降噪音頻方案
    的頭像 發(fā)表于 04-25 18:16 ?667次閱讀
    USB <b class='flag-5'>AI</b>話務(wù)<b class='flag-5'>語音</b>降噪音頻<b class='flag-5'>方案</b>

    AI快訊:華為助力金融行業(yè)加速擁抱AI 馬斯克xAI 展示首個多模態(tài)模型

    數(shù)據(jù)基礎(chǔ)設(shè)施峰會上華為正式發(fā)布四大AI創(chuàng)新解決方案,包括中心AI、邊緣AI、AI數(shù)據(jù)保護、AI數(shù)
    發(fā)表于 04-15 12:32 ?426次閱讀

    英偉達與ServiceNow合作推出通信行業(yè)專用生成式AI解決方案

    英偉達,全球知名的圖形處理器(GPU)制造商,以及企業(yè)級IT服務(wù)管理和運營管理云端平臺供應(yīng)商ServiceNow,近日宣布將進一步深化合作,為通信行業(yè)推出專用的生成式AI解決方案。這一創(chuàng)新舉措旨在通過先進的
    的頭像 發(fā)表于 02-28 10:13 ?524次閱讀

    深入探討工業(yè)AI/ML技術(shù)發(fā)展趨勢及相關(guān)解決方案

    芯科科技已經(jīng)創(chuàng)建了一套完整的硬件和軟件解決方案,可支持開發(fā)用于工業(yè)市場的工業(yè)AI/ML解決方案。具體來說,我們的Sub-GHz、藍(lán)牙和802.15.4產(chǎn)品內(nèi)置了硬件加速功能,可優(yōu)化邊緣的AI
    的頭像 發(fā)表于 01-29 09:42 ?517次閱讀