亚洲男男无套GV大学生,日本免费黄色小视频,青青热精品免费线视频观看

通過語音和視頻通話與他人在線聯(lián)系逐漸成為日常生活的一部分，這得益于 WebRTC 等實(shí)時(shí)通信框架，而后者依靠高效的壓縮技術(shù)和編解碼器，解碼或編碼傳輸和存儲的信號。數(shù)十年來，編解碼器一直是媒體應(yīng)用的重要組成部分，可使需要占用大量帶寬的應(yīng)用高效傳輸數(shù)據(jù)，支持用戶隨時(shí)隨地進(jìn)行高質(zhì)量通信。

因此，在開發(fā)視頻和音頻編解碼器時(shí)，一項(xiàng)長期目標(biāo)就是提高信號質(zhì)量，減少數(shù)據(jù)使用，以及最大程度降低實(shí)時(shí)通信延遲。雖然與音頻相比，視頻貌似會占用更多帶寬，但現(xiàn)代視頻編解碼器能夠?qū)崿F(xiàn)比較低的比特率，甚至可能低于目前某些高質(zhì)量語音編解碼器所能達(dá)到的值。將低比特率視頻和語音編解碼器相結(jié)合，即使在低帶寬網(wǎng)絡(luò)中也能實(shí)現(xiàn)高質(zhì)量的視頻通話體驗(yàn)。但是根據(jù)過往經(jīng)驗(yàn)，音頻編解碼器的比特率越低，語音信號的清晰度就越差，聲音也越像機(jī)器人。此外，盡管部分人可以訪問穩(wěn)定的高質(zhì)量、高速網(wǎng)絡(luò)，但這種網(wǎng)絡(luò)連接水平并不普遍，即便在網(wǎng)絡(luò)良好的地區(qū)，有時(shí)也會遇到質(zhì)量差、帶寬低和網(wǎng)絡(luò)擁堵的情況。

為解決這一問題，我們構(gòu)建了 Lyra。這是一款比特率極低的高質(zhì)量語音編解碼器，即使在最慢的網(wǎng)絡(luò)上也可以實(shí)現(xiàn)語音通信。為此，我們采用傳統(tǒng)編解碼器技術(shù)，同時(shí)利用機(jī)器學(xué)習(xí) （ML）的優(yōu)勢，使用基于數(shù)千小時(shí)數(shù)據(jù)進(jìn)行訓(xùn)練的模型，創(chuàng)造出一種全新的語音信號壓縮與傳輸方法。

Lyra 概覽

Lyra 編解碼器的基礎(chǔ)架構(gòu)非常簡單。每隔 40 毫秒，該編解碼器都會從語音中提取特征或獨(dú)特的語音屬性，將其壓縮后傳輸。這些特征本身為對數(shù)梅爾聲譜圖，是一系列代表不同頻段語音能量的數(shù)字，因其根據(jù)人類的聽覺反應(yīng)建模，具有感知相關(guān)性，所以一直以來得以應(yīng)用于相關(guān)領(lǐng)域。在另一端，生成模型使用這些特征重建語音信號。就這一點(diǎn)來說，Lyra 與其他傳統(tǒng)參數(shù)編解碼器非常相似，如 MELP。

但是，傳統(tǒng)參數(shù)編解碼器只是簡單地從語音中提取關(guān)鍵參數(shù)，然后在接收端用參數(shù)重建信號，雖然可以實(shí)現(xiàn)低比特率，但聲音往往聽起來像機(jī)器人一樣，并不自然。這些缺點(diǎn)促使相關(guān)人員開發(fā)新一代高質(zhì)量音頻生成模型，這些模型不僅能夠區(qū)分信號，還可以生成全新的信號，為這一領(lǐng)域帶來了巨大變革。DeepMind WaveNet 為首個(gè)生成模型，為之后的模型鋪平了道路。此外，WaveNetEQ，即目前 Duo 中使用的基于生成模型的丟包隱藏系統(tǒng)，就是將此技術(shù)用于真實(shí)場景的成果。

Lyra 壓縮的全新方法

以這些模型為基準(zhǔn)，我們開發(fā)了一個(gè)全新的模型，能夠使用少量數(shù)據(jù)重建語音。Lyra 利用這些強(qiáng)大的新型自然語音生成模型，確保將參數(shù)編解碼器的比特率維持在較低水平，同時(shí)實(shí)現(xiàn)較高質(zhì)量，達(dá)到與當(dāng)今大多數(shù)直播和通信平臺所用頂尖波形編解碼器相當(dāng)?shù)谋憩F(xiàn)。波形編解碼器的缺點(diǎn)在于，要達(dá)到這種高質(zhì)量水平，必需逐一壓縮和發(fā)送信號樣本，這需要更高的比特率，并且在大多數(shù)情況下，并不是實(shí)現(xiàn)自然語音的必要條件。

生成模型的一個(gè)問題在于其計(jì)算復(fù)雜度。Lyra 使用成本更低的遞歸生成模型，即 WaveRNN 變體，從而避免了這一問題。該模型以較低的比特率運(yùn)行，但可并行生成頻率范圍不同的多個(gè)信號，然后以所需采樣率將其組合為單個(gè)輸出信號。得益于這一設(shè)計(jì)，Lyra 不僅可以在云服務(wù)器上運(yùn)行，還可以在中檔手機(jī)設(shè)備上實(shí)時(shí)運(yùn)行（處理延遲為 90 毫秒，與其他傳統(tǒng)語音編解碼器相當(dāng)）。與 WaveNet 類似，此生成模型基于數(shù)千小時(shí)的語音數(shù)據(jù)訓(xùn)練，可準(zhǔn)確重建輸入的音頻。

與現(xiàn)有編解碼器對比

自 Lyra 問世以來，我們一直致力于以遠(yuǎn)低于現(xiàn)有編解碼器的比特率實(shí)現(xiàn)最高的音頻質(zhì)量。目前，免版稅的開源編解碼器 Opus 是 WebRTC 型 VOIP 應(yīng)用中使用最廣泛的編解碼器，在音頻為 32 Kbps 時(shí)，通?？梢詫?shí)現(xiàn)與原始語音幾無差別的語音質(zhì)量。然而，盡管 Opus 可以在帶寬受限的環(huán)境中運(yùn)行，且比特率最低可達(dá) 6 Kbps，但聲音質(zhì)量會明顯下降。Speex、MELP、AMR 等其他編解碼器雖然也能夠?qū)崿F(xiàn)與 Lyra 相當(dāng)?shù)谋忍芈?，但聲音皆會失真，聽起來像機(jī)器人一樣。

根據(jù)目前的設(shè)計(jì)，Lyra 會以 3 Kbps 的比特率運(yùn)行。聽音測試表明，Lyra 在該比特率下的性能優(yōu)于其他所有編解碼器，并且與 Opus 在 8 Kbps 比特率下的表現(xiàn)相當(dāng)，因此可節(jié)省 60% 以上的帶寬。在帶寬條件不足以滿足較高比特率，且現(xiàn)有低比特率編解碼器無法實(shí)現(xiàn)所需質(zhì)量時(shí)，可以使用 Lyra。

確保公平

與所有基于 ML 的系統(tǒng)一樣，必須對模型進(jìn)行訓(xùn)練，確保其滿足所有人的需求。我們利用開源音頻庫對 Lyra 進(jìn)行訓(xùn)練，音頻數(shù)據(jù)長達(dá)數(shù)千個(gè)小時(shí)，涵蓋 70 余種語言，然后與專家和眾包聽眾一同驗(yàn)證音頻質(zhì)量。

我們設(shè)計(jì) Lyra 的一個(gè)目標(biāo)在于確保人人都能獲得高質(zhì)量的音頻體驗(yàn)。用于訓(xùn)練 Lyra 的數(shù)據(jù)集范圍廣泛，涵蓋多種語言，可確保編解碼器能夠穩(wěn)健應(yīng)對可能遇到的任何情況。

社會影響和我們未來的發(fā)展方向

無論從短期還是長期來看，Lyra 等技術(shù)都具有重要而廣泛的影響。有了 Lyra，數(shù)十億新興市場的用戶就能使用高效的低比特率編解碼器，獲得遠(yuǎn)高于以往的音頻質(zhì)量。此外，Lyra 也可用于云環(huán)境，幫助使用不同網(wǎng)絡(luò)和設(shè)備的用戶順暢地聊天。將 Lyra 與 AV1 等全新視頻壓縮技術(shù)相結(jié)合，可為較差網(wǎng)絡(luò)環(huán)境中的視頻聊天提供支持。用戶即使通過調(diào)制解調(diào)器撥號上網(wǎng)，網(wǎng)速只有 56 Kbps，也可以進(jìn)行視頻聊天。

Duo 已使用 ML 來減少音頻中斷，目前正推出 Lyra，以求在連接帶寬極低時(shí)，提高語音通話的質(zhì)量和可靠性。我們將繼續(xù)優(yōu)化 Lyra 的性能和質(zhì)量，以盡可能地提高技術(shù)的可用性，同時(shí)還會開展 GPU 加速和 TPU 加速的相關(guān)研究。我們還將著手研究如何基于這些技術(shù)開發(fā)比特率較低的通用音頻編解碼器，即音樂和其他非語音用例。

原文標(biāo)題：推出 Lyra：用于語音壓縮的新型極低比特率編解碼器

文章出處：【微信公眾號：TensorFlow】歡迎添加關(guān)注！文章轉(zhuǎn)載請注明出處。

責(zé)任編輯：haq

聲明：本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人，不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用，如有內(nèi)容侵權(quán)或者其他違規(guī)問題，請聯(lián)系本站處理。舉報(bào)投訴

編碼器

編碼器

+關(guān)注

關(guān)注
45

文章
3643

瀏覽量
134531
機(jī)器學(xué)習(xí)

機(jī)器學(xué)習(xí)

+關(guān)注

關(guān)注
66

文章
8418

瀏覽量
132654

原文標(biāo)題：推出 Lyra：用于語音壓縮的新型極低比特率編解碼器

文章出處：【微信號：tensorflowers，微信公眾號：Tensorflowers】歡迎添加關(guān)注！文章轉(zhuǎn)載請注明出處。

TLV320AIC28音頻編解碼器評估模塊

電子發(fā)燒友網(wǎng)站提供《TLV320AIC28音頻編解碼器評估模塊.pdf》資料免費(fèi)下載

發(fā)表于 12-20 16:02 ?0次下載

TLV320AIC28音頻<b class='flag-5'>編解碼器</b>評估模塊

TAS25xx編解碼器控制EVM手冊

電子發(fā)燒友網(wǎng)站提供《TAS25xx編解碼器控制EVM手冊.pdf》資料免費(fèi)下載

發(fā)表于 12-10 14:14 ?0次下載

TAS25xx<b class='flag-5'>編解碼器</b>控制EVM手冊

用于便攜式數(shù)字音頻應(yīng)用的低功率、高質(zhì)量的立體聲編解碼器

Codec芯片 - CJC8974A是一款低功率、高質(zhì)量的立體聲編解碼器，設(shè)計(jì)用于便攜式數(shù)字音頻應(yīng)用，以及一種單聲道橋接音頻功率放大器，在由5V電源供電時(shí)，能夠?qū)?W的連續(xù)平均功率傳輸

發(fā)表于 12-05 09:21 ?132次閱讀

用于便攜式數(shù)字音頻應(yīng)用的低功率、<b class='flag-5'>高質(zhì)量</b>的立體聲<b class='flag-5'>編解碼器</b>

配置I2S以從編解碼器設(shè)備生成BCLK

電子發(fā)燒友網(wǎng)站提供《配置I2S以從編解碼器設(shè)備生成BCLK.pdf》資料免費(fèi)下載

發(fā)表于 10-21 10:30 ?0次下載

配置I2S以從<b class='flag-5'>編解碼器</b>設(shè)備生成BCLK

Linux上的編解碼器移植TMS320DM365預(yù)覽版

電子發(fā)燒友網(wǎng)站提供《Linux上的編解碼器移植TMS320DM365預(yù)覽版.pdf》資料免費(fèi)下載

發(fā)表于 10-14 10:53 ?0次下載

Linux上的<b class='flag-5'>編解碼器</b>移植TMS320DM365預(yù)覽版

TMS320DM365中的智能編解碼器功能

電子發(fā)燒友網(wǎng)站提供《TMS320DM365中的智能編解碼器功能.pdf》資料免費(fèi)下載

發(fā)表于 10-14 10:24 ?0次下載

TMS320DM365中的智能<b class='flag-5'>編解碼器</b>功能

音頻編解碼器和ADC中有哪些常見噪聲問題，如何幫助避免這些問題？

音頻編解碼器和 ADC 中有哪些常見噪聲問題，如何幫助避免這些問題？

發(fā)表于 10-10 08:09

音頻編解碼器中的常見噪聲問題

電子發(fā)燒友網(wǎng)站提供《音頻編解碼器中的常見噪聲問題.pdf》資料免費(fèi)下載

發(fā)表于 10-09 10:19 ?0次下載

一款低功率、高質(zhì)量的單聲道音頻編解碼器 - CJC8911

CJC8911是一個(gè)低功率，高質(zhì)量的單聲道編解碼器，設(shè)計(jì)用于便攜式數(shù)字音頻應(yīng)用程序。該設(shè)備集成了完整的接口到一個(gè)出線端口的接口。片上數(shù)字信號處理執(zhí)行圖形均衡器，三維聲音增強(qiáng)和麥克風(fēng)或線

發(fā)表于 08-08 09:39 ?483次閱讀

<b class='flag-5'>一款</b>低功率、<b class='flag-5'>高質(zhì)量</b>的單聲道音頻<b class='flag-5'>編解碼器</b> - CJC8911

帶你探索HiFi智能編解碼器的奇妙世界

HiFi智能編解碼器就像是音頻世界的魔法師，它讓我們能聽到最真實(shí)、最動人的聲音。無論是家庭音響、智能音箱，還是無線耳機(jī)和專業(yè)設(shè)備，這個(gè)小小的設(shè)備都能帶來巨大的音質(zhì)提升。讓我們一同期待，未來HiFi智能編解碼器為我們帶來的更多驚喜

發(fā)表于 07-18 17:20 ?798次閱讀

帶你探索HiFi智能<b class='flag-5'>編解碼器</b>的奇妙世界

TVP5146高質(zhì)量、單芯片數(shù)字視頻解碼器數(shù)據(jù)表

電子發(fā)燒友網(wǎng)站提供《TVP5146高質(zhì)量、單芯片數(shù)字視頻解碼器數(shù)據(jù)表.pdf》資料免費(fèi)下載

發(fā)表于 07-04 10:00 ?0次下載

TVP5146<b class='flag-5'>高質(zhì)量</b>、單芯片數(shù)字視頻<b class='flag-5'>解碼器</b>數(shù)據(jù)表

【RTC程序設(shè)計(jì)：實(shí)時(shí)音視頻權(quán)威指南】音視頻的編解碼壓縮技術(shù)

至關(guān)重要的作用，編解碼器的主要目標(biāo)是通過去除冗余信息和壓縮視頻數(shù)據(jù)來減少文件的大小，同時(shí)還要保持高質(zhì)量的視頻圖像編碼器負(fù)責(zé)壓縮解碼器則負(fù)責(zé)還原，編解

發(fā)表于 04-28 21:04

國產(chǎn)可編程振蕩器在視頻編解碼器中的應(yīng)用，兼容SiTime

國產(chǎn)可編程振蕩器在視頻編解碼器中的應(yīng)用，兼容SiTime

發(fā)表于 04-17 09:39 ?1922次閱讀

集成電源管理和音頻編解碼器TPS65950數(shù)據(jù)表

電子發(fā)燒友網(wǎng)站提供《集成電源管理和音頻編解碼器TPS65950數(shù)據(jù)表.pdf》資料免費(fèi)下載

發(fā)表于 03-06 11:15 ?0次下載

高性能立體聲編解碼器DA7400 數(shù)據(jù)表

電子發(fā)燒友網(wǎng)站提供《高性能立體聲編解碼器DA7400 數(shù)據(jù)表.pdf》資料免費(fèi)下載

發(fā)表于 02-20 10:11 ?1次下載

搜索歷史

一款比特率極低的高質(zhì)量語音編解碼器

評論