0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

Google最新推出的音頻編解碼器Lyra

LiveVideoStack ? 來源:LiveVideoStack ? 作者:LiveVideoStack ? 2021-03-11 16:37 ? 次閱讀

Google最新推出的音頻編解碼器Lyra,不僅實現(xiàn)了以每秒3kb網(wǎng)絡(luò)寬帶提供聽起來自然清晰的語音聊天,還可以在僅90ms延遲的情況下在從高端云服務(wù)器到中端智能手機的任何設(shè)備上運行。

2月25日,Google AI blog發(fā)布了一篇文章詳細的介紹了最新推出的Lyra——一種用于語音壓縮的新型超低比特率編解碼器。該編解碼器使Google Duo,以及未來的其他應(yīng)用程序能夠以每秒3kb的網(wǎng)絡(luò)寬帶提供聽起來很自然清晰的語音聊天。

眾所周知,人們對實時音視頻的需求不斷增加。特別是去年由于受到疫情的影響,許多人不得不隔離在家,只能與親朋好友通過視頻通話的方式保持聯(lián)系。例如,僅去年一年Google Duo和Meet就承載了超過1萬億分鐘的視頻。而這些情況無疑是給全球的互聯(lián)網(wǎng)基礎(chǔ)設(shè)施帶來了巨大的挑戰(zhàn)。除此之外,雖然有些人可以使用一致的高質(zhì)量,高速網(wǎng)絡(luò),但這種連接并不普遍。比如在網(wǎng)絡(luò)通信并不發(fā)達的農(nóng)村地區(qū)。然而,盡管在連接良好的地區(qū),人們有時也會遇到質(zhì)量差、帶寬低的問題。那么如何在有限的帶寬下實現(xiàn)高質(zhì)量的音頻輸出就成為了目前最重要的議題。

Lyra音頻編解碼器

6e8f3e5c-7e1a-11eb-8b86-12bb97331649.png

因此,Google推出了一種高質(zhì)量、低比特率的新型音頻編解碼器——Lyra。盡管用戶在網(wǎng)速很慢的情況下,也能進行語音聊天。Lyra編解碼器的基本結(jié)構(gòu)體系非常簡單,如上圖所示。而Lyra與其他音頻編解碼器的不同之處在于:它利用機器學(xué)習(xí)模型,開發(fā)了一種新的模型,能夠使用最少的數(shù)據(jù)來重建語音。這種模型不僅能夠區(qū)分信號,還能生成全新的信號。與之相比,傳統(tǒng)的參數(shù)編解碼器只從語音中提取關(guān)鍵參數(shù),然后用于在接收端重建信號。雖然實現(xiàn)低比特率,但得到的音頻通常聽起來很機械,不自然。而Lyra利用這些新的自然聲生成模型,即能夠保持參數(shù)編解碼器的低比特率,同時又能實現(xiàn)高質(zhì)量的音頻輸出。這與目前大多流媒體平臺中使用的波形編解碼器幾乎不相上下。更重要的是,Lyra的效率足夠高,可以在僅90ms延遲的情況下在從高端云服務(wù)器到中端智能手機的任何設(shè)備上運行。

與現(xiàn)有編解碼器對比

Lyra目前被設(shè)計運行在3kbps情況下,聽力測試表明,Lyra的表現(xiàn)優(yōu)于任何其他編解碼器。并且優(yōu)于在相同8kbps情況下的Opus,從而實現(xiàn)了超過60%的帶寬減少。Lyra可以在帶寬條件不適合高比特率和現(xiàn)有的低比特率編解碼器不能提供足夠質(zhì)量的情況下使用,這是它的一大優(yōu)勢,也是解決現(xiàn)在低音頻質(zhì)量的方案。

以下是Lyra與現(xiàn)有編解碼器的對比:

在安靜的環(huán)境下:

Original原始音頻

Opus@6kbps

Lyra@3kbps

Speex@3kbps

在嘈雜的環(huán)境下:

Original原始音頻

Opus@6kbps

Lyra@3kbps

Speex@3kbps

上方是Google提供的Lyra與Opus、Speex分別以6kbps和3kbps,對同一音頻的壓縮質(zhì)量對比。能夠明顯感受到即使Lyra在3kbps情況下,自然語音音頻的清晰程度也遠優(yōu)于Opus在6kbps下的情況。

適用情況

Google已經(jīng)利用開源音頻庫對Lyra使用超過70種語言的揚聲器進行了數(shù)千小時的音頻培訓(xùn),然后與專家和來自廣泛的聽眾一起驗證音頻質(zhì)量。Lyra在一個廣泛的數(shù)據(jù)集中訓(xùn)練,包括大量不同語言的使用者,以確保編解碼器能夠應(yīng)對各種情況。另外,Lyra還可以在云環(huán)境中使用,以方便使用各種網(wǎng)絡(luò)和設(shè)備的用戶能夠無縫對接聊天。不僅如此,Google還將Lyra與新的視頻壓縮技術(shù)(例如AV1)配對后,即使用戶通過56kbps撥號調(diào)制調(diào)節(jié)器連接到Internet,也可以進行視頻聊天。

責任編輯:lq

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • Google
    +關(guān)注

    關(guān)注

    5

    文章

    1772

    瀏覽量

    57739
  • 音頻編解碼器
    +關(guān)注

    關(guān)注

    4

    文章

    140

    瀏覽量

    55927
  • 應(yīng)用程序
    +關(guān)注

    關(guān)注

    38

    文章

    3292

    瀏覽量

    57866

原文標題:在3kbps的帶寬下還能清晰地語音聊天?

文章出處:【微信號:livevideostack,微信公眾號:LiveVideoStack】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏

    評論

    相關(guān)推薦

    國芯思辰| 單聲道音頻編解碼器SC2601應(yīng)用于錄音筆,替換ES8311

    國芯思辰| 單聲道音頻編解碼器SC2601應(yīng)用于錄音筆,替換ES8311
    的頭像 發(fā)表于 01-07 10:33 ?146次閱讀
    國芯思辰| 單聲道<b class='flag-5'>音頻</b><b class='flag-5'>編解碼器</b>SC2601應(yīng)用于錄音筆,替換ES8311

    TLV320AIC28音頻編解碼器評估模塊

    電子發(fā)燒友網(wǎng)站提供《TLV320AIC28音頻編解碼器評估模塊.pdf》資料免費下載
    發(fā)表于 12-20 16:02 ?0次下載
    TLV320AIC28<b class='flag-5'>音頻</b><b class='flag-5'>編解碼器</b>評估模塊

    替換ES8311,音頻編解碼器SC2601在行車記錄儀中的應(yīng)用

    替換ES8311,音頻編解碼器SC2601在行車記錄儀中的應(yīng)用
    的頭像 發(fā)表于 11-29 10:07 ?263次閱讀
    替換ES8311,<b class='flag-5'>音頻</b><b class='flag-5'>編解碼器</b>SC2601在行車記錄儀中的應(yīng)用

    配置I2S以從編解碼器設(shè)備生成BCLK

    電子發(fā)燒友網(wǎng)站提供《配置I2S以從編解碼器設(shè)備生成BCLK.pdf》資料免費下載
    發(fā)表于 10-21 10:30 ?0次下載
    配置I2S以從<b class='flag-5'>編解碼器</b>設(shè)備生成BCLK

    TMS320F2833x與AIC23B立體聲音頻編解碼器的接口

    電子發(fā)燒友網(wǎng)站提供《TMS320F2833x與AIC23B立體聲音頻編解碼器的接口.pdf》資料免費下載
    發(fā)表于 10-15 09:21 ?0次下載
    TMS320F2833x與AIC23B立體聲<b class='flag-5'>音頻</b><b class='flag-5'>編解碼器</b>的接口

    Linux上的編解碼器移植TMS320DM365預(yù)覽版

    電子發(fā)燒友網(wǎng)站提供《Linux上的編解碼器移植TMS320DM365預(yù)覽版.pdf》資料免費下載
    發(fā)表于 10-14 10:53 ?0次下載
    Linux上的<b class='flag-5'>編解碼器</b>移植TMS320DM365預(yù)覽版

    TMS320DM365中的智能編解碼器功能

    電子發(fā)燒友網(wǎng)站提供《TMS320DM365中的智能編解碼器功能.pdf》資料免費下載
    發(fā)表于 10-14 10:24 ?0次下載
    TMS320DM365中的智能<b class='flag-5'>編解碼器</b>功能

    音頻編解碼器和ADC中有哪些常見噪聲問題,如何幫助避免這些問題?

    音頻編解碼器和 ADC 中有哪些常見噪聲問題,如何幫助避免這些問題?
    發(fā)表于 10-10 08:09

    音頻編解碼器中的常見噪聲問題

    電子發(fā)燒友網(wǎng)站提供《音頻編解碼器中的常見噪聲問題.pdf》資料免費下載
    發(fā)表于 10-09 10:19 ?0次下載
    <b class='flag-5'>音頻</b><b class='flag-5'>編解碼器</b>中的常見噪聲問題

    帶你探索HiFi智能編解碼器的奇妙世界

    HiFi智能編解碼器就像是音頻世界的魔法師,它讓我們能聽到最真實、最動人的聲音。無論是家庭音響、智能音箱,還是無線耳機和專業(yè)設(shè)備,這個小小的設(shè)備都能帶來巨大的音質(zhì)提升。讓我們一同期待,未來HiFi智能編解碼器為我們帶來的更多驚喜
    的頭像 發(fā)表于 07-18 17:20 ?909次閱讀
    帶你探索HiFi智能<b class='flag-5'>編解碼器</b>的奇妙世界

    音頻編解碼器AC'97電壓轉(zhuǎn)換收發(fā)數(shù)據(jù)表

    電子發(fā)燒友網(wǎng)站提供《音頻編解碼器AC'97電壓轉(zhuǎn)換收發(fā)數(shù)據(jù)表.pdf》資料免費下載
    發(fā)表于 05-28 10:52 ?0次下載
    <b class='flag-5'>音頻</b><b class='flag-5'>編解碼器</b>AC'97電壓轉(zhuǎn)換收發(fā)<b class='flag-5'>器</b>數(shù)據(jù)表

    國產(chǎn)可編程振蕩在視頻編解碼器中的應(yīng)用,兼容SiTime

    國產(chǎn)可編程振蕩在視頻編解碼器中的應(yīng)用,兼容SiTime
    的頭像 發(fā)表于 04-17 09:39 ?2173次閱讀
    國產(chǎn)可編程振蕩<b class='flag-5'>器</b>在視頻<b class='flag-5'>編解碼器</b>中的應(yīng)用,兼容SiTime

    集成電源管理和音頻編解碼器TPS65950數(shù)據(jù)表

    電子發(fā)燒友網(wǎng)站提供《集成電源管理和音頻編解碼器TPS65950數(shù)據(jù)表.pdf》資料免費下載
    發(fā)表于 03-06 11:15 ?0次下載
    集成電源管理和<b class='flag-5'>音頻</b><b class='flag-5'>編解碼器</b>TPS65950數(shù)據(jù)表

    TPS65920和TPS65930集成電源管理/音頻編解碼器數(shù)據(jù)表

    電子發(fā)燒友網(wǎng)站提供《TPS65920和TPS65930集成電源管理/音頻編解碼器數(shù)據(jù)表.pdf》資料免費下載
    發(fā)表于 03-06 10:55 ?0次下載
    TPS65920和TPS65930集成電源管理/<b class='flag-5'>音頻</b><b class='flag-5'>編解碼器</b>數(shù)據(jù)表

    高性能立體聲編解碼器DA7400 數(shù)據(jù)表

    電子發(fā)燒友網(wǎng)站提供《高性能立體聲編解碼器DA7400 數(shù)據(jù)表.pdf》資料免費下載
    發(fā)表于 02-20 10:11 ?1次下載
    高性能立體聲<b class='flag-5'>編解碼器</b>DA7400 數(shù)據(jù)表