谷歌推出了一項(xiàng)新技術(shù),當(dāng)服務(wù)無(wú)法維持穩(wěn)定的WaveNetEQ連接時(shí),可以提高Duo通話的音頻質(zhì)量。它是基于谷歌的DeepMind部門的技術(shù),該部門的目標(biāo)是用人工噪音代替音頻抖動(dòng),這種噪音聽(tīng)起來(lái)就像人類說(shuō)話一樣,是通過(guò)機(jī)器學(xué)習(xí)產(chǎn)生的。
如果你曾經(jīng)在網(wǎng)上打過(guò)電話,那么你很有可能經(jīng)歷過(guò)音頻抖動(dòng)。當(dāng)作為調(diào)用的一部分發(fā)送的音頻數(shù)據(jù)包在傳輸過(guò)程中丟失,或出現(xiàn)延遲或順序錯(cuò)誤時(shí),就會(huì)發(fā)生這種情況。谷歌說(shuō)99%的Duo呼叫都經(jīng)歷過(guò)數(shù)據(jù)包丟失:20%的丟失超過(guò)3%的音頻,10%的丟失超過(guò)8%。有很多音頻需要替換。
每個(gè)呼叫應(yīng)用程序都必須以某種方式處理這種丟包,但谷歌表示,這些丟包隱藏(PLC)過(guò)程可能很難填補(bǔ)60毫秒或更長(zhǎng)的空白,聽(tīng)起來(lái)既不像機(jī)器人,也不重復(fù)。WaveNetEQ的解決方案是基于DeepMind的神經(jīng)網(wǎng)絡(luò)技術(shù),它已經(jīng)對(duì)來(lái)自48種不同語(yǔ)言的100多個(gè)使用者的數(shù)據(jù)進(jìn)行了訓(xùn)練。
將WaveNetEQ與NetEQ(一種常用的PLC技術(shù))進(jìn)行了比較。嘗試替換60ms丟包時(shí)的聲音。不過(guò),這個(gè)系統(tǒng)可以替換的音頻是有限制的。谷歌的技術(shù)旨在取代短音,而不是完整的單詞。因此,120毫秒后,它會(huì)逐漸消失,并產(chǎn)生靜音。谷歌說(shuō),它對(duì)系統(tǒng)進(jìn)行了評(píng)估,以確保沒(méi)有引入任何重要的新聲音。另外,所有的處理都需要在設(shè)備上進(jìn)行,因?yàn)楣雀鐳uo調(diào)用默認(rèn)是端到端加密的。一旦通話的真實(shí)音頻恢復(fù),WaveNetEQ將無(wú)縫地回到現(xiàn)實(shí)中。
這是一個(gè)巧妙的小技術(shù),當(dāng)互聯(lián)網(wǎng)讓他們失望時(shí),打電話應(yīng)該更容易理解。由于Pixel 4手機(jī)在12月的功能下降,該技術(shù)已經(jīng)可以用于在Pixel 4手機(jī)上撥打Duo電話。谷歌表示,它正在將這項(xiàng)技術(shù)推廣到其他未命名的手機(jī)上。
-
谷歌
+關(guān)注
關(guān)注
27文章
6180瀏覽量
105775 -
神經(jīng)網(wǎng)絡(luò)
+關(guān)注
關(guān)注
42文章
4778瀏覽量
101023
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
評(píng)論