0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

谷歌推出了一項(xiàng)新技術(shù),可以提高Duo通話的音頻質(zhì)量

倩倩 ? 來(lái)源:好嘿科技 ? 2020-04-15 15:32 ? 次閱讀

谷歌推出了一項(xiàng)新技術(shù),當(dāng)服務(wù)無(wú)法維持穩(wěn)定的WaveNetEQ連接時(shí),可以提高Duo通話的音頻質(zhì)量。它是基于谷歌的DeepMind部門的技術(shù),該部門的目標(biāo)是用人工噪音代替音頻抖動(dòng),這種噪音聽(tīng)起來(lái)就像人類說(shuō)話一樣,是通過(guò)機(jī)器學(xué)習(xí)產(chǎn)生的。

如果你曾經(jīng)在網(wǎng)上打過(guò)電話,那么你很有可能經(jīng)歷過(guò)音頻抖動(dòng)。當(dāng)作為調(diào)用的一部分發(fā)送的音頻數(shù)據(jù)包在傳輸過(guò)程中丟失,或出現(xiàn)延遲或順序錯(cuò)誤時(shí),就會(huì)發(fā)生這種情況。谷歌說(shuō)99%的Duo呼叫都經(jīng)歷過(guò)數(shù)據(jù)包丟失:20%的丟失超過(guò)3%的音頻,10%的丟失超過(guò)8%。有很多音頻需要替換。

每個(gè)呼叫應(yīng)用程序都必須以某種方式處理這種丟包,但谷歌表示,這些丟包隱藏(PLC)過(guò)程可能很難填補(bǔ)60毫秒或更長(zhǎng)的空白,聽(tīng)起來(lái)既不像機(jī)器人,也不重復(fù)。WaveNetEQ的解決方案是基于DeepMind的神經(jīng)網(wǎng)絡(luò)技術(shù),它已經(jīng)對(duì)來(lái)自48種不同語(yǔ)言的100多個(gè)使用者的數(shù)據(jù)進(jìn)行了訓(xùn)練。

將WaveNetEQ與NetEQ(一種常用的PLC技術(shù))進(jìn)行了比較。嘗試替換60ms丟包時(shí)的聲音。不過(guò),這個(gè)系統(tǒng)可以替換的音頻是有限制的。谷歌的技術(shù)旨在取代短音,而不是完整的單詞。因此,120毫秒后,它會(huì)逐漸消失,并產(chǎn)生靜音。谷歌說(shuō),它對(duì)系統(tǒng)進(jìn)行了評(píng)估,以確保沒(méi)有引入任何重要的新聲音。另外,所有的處理都需要在設(shè)備上進(jìn)行,因?yàn)楣雀鐳uo調(diào)用默認(rèn)是端到端加密的。一旦通話的真實(shí)音頻恢復(fù),WaveNetEQ將無(wú)縫地回到現(xiàn)實(shí)中。

這是一個(gè)巧妙的小技術(shù),當(dāng)互聯(lián)網(wǎng)讓他們失望時(shí),打電話應(yīng)該更容易理解。由于Pixel 4手機(jī)在12月的功能下降,該技術(shù)已經(jīng)可以用于在Pixel 4手機(jī)上撥打Duo電話。谷歌表示,它正在將這項(xiàng)技術(shù)推廣到其他未命名的手機(jī)上。

聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 谷歌
    +關(guān)注

    關(guān)注

    27

    文章

    6180

    瀏覽量

    105775
  • 神經(jīng)網(wǎng)絡(luò)

    關(guān)注

    42

    文章

    4778

    瀏覽量

    101023
收藏 人收藏

    評(píng)論

    相關(guān)推薦

    即時(shí)通話軟件音頻傳輸質(zhì)量測(cè)試方案

    使用過(guò)程中的音頻傳輸質(zhì)量。即時(shí)通話軟件基于移動(dòng)網(wǎng)絡(luò)鏈路傳輸信號(hào),通過(guò)本套測(cè)試方案中配套的網(wǎng)絡(luò)損傷仿真設(shè)備對(duì)傳輸鏈路添加不同的網(wǎng)絡(luò)影響,模擬軟件在不同網(wǎng)絡(luò)環(huán)境下的使用情況,進(jìn)而測(cè)得更接近真實(shí)應(yīng)用場(chǎng)景下的
    的頭像 發(fā)表于 12-03 14:34 ?208次閱讀
    即時(shí)<b class='flag-5'>通話</b>軟件<b class='flag-5'>音頻</b>傳輸<b class='flag-5'>質(zhì)量</b>測(cè)試方案

    AMD獲得一項(xiàng)玻璃基板技術(shù)專利

    近日,處理器大廠AMD宣布獲得了一項(xiàng)涵蓋玻璃芯基板技術(shù)的專利(專利號(hào)“12080632”),這消息標(biāo)志著AMD在高性能系統(tǒng)級(jí)封裝(SiP)領(lǐng)域的研究取得了重要進(jìn)展。
    的頭像 發(fā)表于 12-02 10:33 ?236次閱讀

    谷歌云宣布一項(xiàng)重要人事任命

    近日,谷歌云(Google Cloud)正式宣布了一項(xiàng)重要人事任命,尹世明將加入谷歌云,擔(dān)任大中華區(qū)總裁職。這任命無(wú)疑將為
    的頭像 發(fā)表于 11-18 15:07 ?319次閱讀

    ip網(wǎng)絡(luò)音頻終端是什么

    IP地址進(jìn)行通信。它們可以音頻信號(hào)轉(zhuǎn)換成數(shù)字信號(hào),并通過(guò)局域網(wǎng)或因特網(wǎng)進(jìn)行傳輸,從而在不同地點(diǎn)之間實(shí)現(xiàn)高質(zhì)量音頻傳輸和通信。 二、主要功能 語(yǔ)音
    的頭像 發(fā)表于 10-08 14:52 ?569次閱讀

    星閃,一項(xiàng)迫于無(wú)奈的創(chuàng)新技術(shù)

    星閃(NearLink,舊稱SparkLink)是種短距離低功耗無(wú)線通信技術(shù),由華為于2020年9月?tīng)款^成立的星閃聯(lián)盟(超過(guò)300多家會(huì)員單位)負(fù)責(zé)制定其標(biāo)準(zhǔn)和規(guī)范,于2022年11月發(fā)布星閃
    的頭像 發(fā)表于 07-30 18:39 ?3714次閱讀
    星閃,<b class='flag-5'>一項(xiàng)</b>迫于無(wú)奈的創(chuàng)<b class='flag-5'>新技術(shù)</b>

    谷歌推出Trillium AI芯片,性能提高近5倍

    谷歌推出了其最新的人工智能數(shù)據(jù)中心芯片——Trillium。這款芯片是谷歌的第六代產(chǎn)品,與上代TPU v5e相比,Trillium在每個(gè)芯片上的峰值計(jì)算性能
    的頭像 發(fā)表于 05-16 10:39 ?811次閱讀

    谷歌提出大規(guī)模ICL方法

    谷歌DeepMind團(tuán)隊(duì)近日取得了一項(xiàng)突破性的研究成果。他們提出了強(qiáng)化和無(wú)監(jiān)督兩種新型的ICL(In-Context Learning)學(xué)習(xí)方法,這創(chuàng)
    的頭像 發(fā)表于 05-14 14:17 ?384次閱讀

    谷歌DeepMind推出新一代藥物研發(fā)AI模型AlphaFold 3

    谷歌DeepMind公司近日重磅推出了款名為AlphaFold 3的全新藥物研發(fā)AI模型,這創(chuàng)新技術(shù)將為科學(xué)家們提供前所未有的幫助,使他
    的頭像 發(fā)表于 05-10 09:35 ?418次閱讀

    NVIDIA和谷歌云宣布開(kāi)展一項(xiàng)新的合作,加速AI開(kāi)發(fā)

    NVIDIA 和谷歌云宣布開(kāi)展一項(xiàng)新的合作,以幫助全球初創(chuàng)企業(yè)加速創(chuàng)建生成式 AI 應(yīng)用和服務(wù)。
    的頭像 發(fā)表于 04-11 14:03 ?540次閱讀

    谷歌推出能制作旅行攻略的AI工具

    谷歌近日發(fā)布了一項(xiàng)令人矚目的新功能,它是款能夠借助自然語(yǔ)言對(duì)話幫助用戶生成旅行行程和出游建議的AI工具。這款工具的推出,標(biāo)志著谷歌在人工智
    的頭像 發(fā)表于 03-29 11:08 ?712次閱讀

    谷歌推出多模態(tài)VLOGGER AI

    谷歌最新推出的VLOGGER AI技術(shù)引起了廣泛關(guān)注,這項(xiàng)創(chuàng)新的多模態(tài)模型能夠讓靜態(tài)肖像圖“活”起來(lái)并“說(shuō)話”。用戶只需提供張人物肖像照片和
    的頭像 發(fā)表于 03-22 10:45 ?883次閱讀

    聆聽(tīng)未來(lái):藍(lán)牙Auracast? 廣播音頻技術(shù)

    公共場(chǎng)所,都能提供種全新的聽(tīng)覺(jué)體驗(yàn)。Auracast廣播音頻技術(shù)是藍(lán)牙技術(shù)聯(lián)盟(BluetoothSIG)推出
    的頭像 發(fā)表于 03-22 08:19 ?1167次閱讀
    聆聽(tīng)未來(lái):藍(lán)牙Auracast? 廣播<b class='flag-5'>音頻</b><b class='flag-5'>技術(shù)</b>

    NVIDIA即將推出一項(xiàng)新的生成式AI專業(yè)認(rèn)證

    NVIDIA 即將推出一項(xiàng)新的生成式 AI 專業(yè)認(rèn)證,助力開(kāi)發(fā)者在這重要領(lǐng)域證明自身技術(shù)實(shí)力。
    的頭像 發(fā)表于 03-14 09:43 ?574次閱讀

    長(zhǎng)電科技推出了一項(xiàng)革命性的高精度熱阻測(cè)試與仿真模擬驗(yàn)證技術(shù)

    在芯片封裝技術(shù)日益邁向高密度、高性能的今天,長(zhǎng)電科技引領(lǐng)創(chuàng)新,推出了一項(xiàng)革命性的高精度熱阻測(cè)試與仿真模擬驗(yàn)證技術(shù)。
    的頭像 發(fā)表于 03-08 13:33 ?589次閱讀

    機(jī)器視覺(jué)缺陷檢測(cè)是工業(yè)自動(dòng)化領(lǐng)域的一項(xiàng)關(guān)鍵技術(shù)

    機(jī)器視覺(jué)缺陷檢測(cè)是工業(yè)自動(dòng)化領(lǐng)域的一項(xiàng)關(guān)鍵技術(shù),
    的頭像 發(fā)表于 02-22 13:59 ?563次閱讀
    機(jī)器視覺(jué)缺陷檢測(cè)是工業(yè)自動(dòng)化領(lǐng)域的<b class='flag-5'>一項(xiàng)</b>關(guān)鍵<b class='flag-5'>技術(shù)</b>