0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

如何使用音頻來(lái)估計(jì)與講話用戶(hù)之間的距離,并識(shí)別周?chē)穆曇?/h1>

最新研究表明,蘋(píng)果公司正在研究HomePod或其他設(shè)備如何使用音頻來(lái)估計(jì)與講話用戶(hù)之間的距離,并識(shí)別周?chē)穆曇簟?/p>

Apple的HomePod已經(jīng)非常擅長(zhǎng)于聽(tīng)到您的聲音,即使它正在大聲播放音樂(lè)。蘋(píng)果公司有兩項(xiàng)單獨(dú)的新專(zhuān)利申請(qǐng)表明,蘋(píng)果公司希望將其改進(jìn),并將設(shè)備的聆聽(tīng)能力提高到一個(gè)新水平。

其中之一,“基于學(xué)習(xí)的距離估計(jì)”,不僅涉及使用音頻來(lái)識(shí)別用戶(hù),而且要弄清楚他們?cè)谀睦铩?/p>

專(zhuān)利申請(qǐng)說(shuō):“通常希望設(shè)備使用[其]緊湊型麥克風(fēng)陣列來(lái)估算從設(shè)備到用戶(hù)的距離?!?“例如,該設(shè)備可以基于用戶(hù)到該設(shè)備的估計(jì)距離來(lái)調(diào)整播放音量或來(lái)自智能輔助設(shè)備的響應(yīng)?!?/p>

繼續(xù)說(shuō):“因此,如果用戶(hù)離設(shè)備非常近,則不會(huì)大量播放音樂(lè)或語(yǔ)音?!?或者,如果用戶(hù)離得很遠(yuǎn),則可以將媒體播放或來(lái)自智能助手設(shè)備的響應(yīng)調(diào)整為更大的音量?!?/p>

同樣的想法也意味著將其引入蘋(píng)果公司目前令人印象深刻但有些瑕疵的系統(tǒng),在該系統(tǒng)中,所有設(shè)備都會(huì)嘗試確定您對(duì)“嘿,Siri”說(shuō)的是什么。

蘋(píng)果公司說(shuō):“在有多個(gè)設(shè)備的應(yīng)用程序中,這些設(shè)備可以在彼此之間進(jìn)行協(xié)調(diào)或仲裁,以根據(jù)從每個(gè)設(shè)備到用戶(hù)的距離來(lái)決定應(yīng)回答一個(gè)或多個(gè)設(shè)備的查詢(xún)?!?/p>

蘋(píng)果公司提出了簡(jiǎn)單和更復(fù)雜的解決方案,它們都可以同時(shí)使用。更簡(jiǎn)單的方法是讓設(shè)備先執(zhí)行HomePod的工作并首先繪制其環(huán)境圖。

然后,它實(shí)際上具有“在聲學(xué)環(huán)境中的測(cè)量點(diǎn)或模擬點(diǎn)的網(wǎng)格”。在這種情況下,可以將聲音與此“網(wǎng)格”進(jìn)行比較,以大致了解說(shuō)話者所在的位置。

但是,Apple認(rèn)為這本身并不足夠好,并且還說(shuō)它與Siri最少一起使用。那是因?yàn)橐粋€(gè)人說(shuō)話時(shí)可能會(huì)動(dòng)彈,而且他們要求快速回應(yīng)-此提議不適合。

備選地,然后,“如果至少兩個(gè)麥克風(fēng)陣列可用”,則“可以使用三角測(cè)量方法來(lái)估計(jì)語(yǔ)音源的距離”。

但是,這里的關(guān)鍵部分是至少需要兩個(gè)帶麥克風(fēng)的設(shè)備。因此,Apple提供了另一個(gè)涉及更多的解決方案,其中涉及“基于學(xué)習(xí)的系統(tǒng),如深度神經(jīng)網(wǎng)絡(luò)(DNN)”,并且不需要多個(gè)設(shè)備。

專(zhuān)利申請(qǐng)說(shuō):“深度學(xué)習(xí)系統(tǒng)可以根據(jù)緊湊型麥克風(fēng)陣列接收到的語(yǔ)音信號(hào)來(lái)估計(jì)每個(gè)時(shí)間幀的語(yǔ)音源距離?!?/p>

這個(gè)DNN系統(tǒng)可以做的是確定什么是語(yǔ)音,什么是背景噪聲。然后,它可以計(jì)算“有關(guān)直接信號(hào)傳播的信息”以及“混響效果和噪聲”。

該申請(qǐng)歸功于三位發(fā)明者,包括Mehrez Souden和Joshua D. Atkins。他們先前的相關(guān)工作包括已獲專(zhuān)利的如何使用比普通麥克風(fēng)少的聲音來(lái)錄制完整空間聲音的專(zhuān)利。

這特別涉及Apple AR中的音頻,該最新專(zhuān)利申請(qǐng)涉及真實(shí)環(huán)境中的物理設(shè)備。但是,如果只是為了避免用太大聲的HomePod mini炸毀別人的耳朵而感到很麻煩,那還有很多事情要做。

該專(zhuān)利申請(qǐng)說(shuō):“例如,助聽(tīng)器之類(lèi)的輔助和增強(qiáng)型助聽(tīng)器可以根據(jù)語(yǔ)音源的距離來(lái)增強(qiáng)音頻信號(hào)。”

這也是第二個(gè)新公開(kāi)的專(zhuān)利申請(qǐng)重點(diǎn)關(guān)注的內(nèi)容。

識(shí)別重要的聲音

“基于觀察到的聲音識(shí)別聲源的系統(tǒng)和方法”,是關(guān)于讓一些設(shè)備識(shí)別其他聲音并為我們做出反應(yīng)。

“許多家用電器,例如微波爐,洗衣機(jī),洗碗機(jī)和門(mén)鈴,會(huì)發(fā)出聲音來(lái)提醒用戶(hù)該器具的狀況已經(jīng)改變,”該專(zhuān)利申請(qǐng)開(kāi)始。

它繼續(xù)說(shuō):“但是,由于各種原因,用戶(hù)可能無(wú)法聽(tīng)到家用電器發(fā)出的聲音警報(bào)?!?“例如,用戶(hù)可能有聽(tīng)力障礙,用戶(hù)可能在外面或在另一個(gè)房間里,或者設(shè)備可能發(fā)出被家庭聲學(xué)場(chǎng)景遮擋的聲音。”

也不必是您的煮蛋計(jì)時(shí)器關(guān)閉。該專(zhuān)利同樣涉及“公共場(chǎng)所(政府大樓),半公共場(chǎng)所(辦公室大廳)和私人場(chǎng)所(住宅或辦公大樓)”中的聲音。

它說(shuō):“(這些)也有聲學(xué)場(chǎng)景,可以包含帶有信息的聲音。” “例如,鈴,鈴或蜂鳴器可能指示門(mén)已經(jīng)打開(kāi)或關(guān)閉,或者警報(bào)器可能發(fā)出警報(bào)聲或其他聲音,警告附近的人有危險(xiǎn)(例如,煙,火或一氧化碳)。”

總體而言,該專(zhuān)利申請(qǐng)主要詳述了可以“訓(xùn)練”設(shè)備以識(shí)別“常見(jiàn)聲音”的方法。然后,它將繼續(xù)偵聽(tīng)其中的任何一個(gè),并且當(dāng)聽(tīng)到一個(gè)聲音時(shí),可以發(fā)出“響應(yīng)于確定聲音存在于聲學(xué)場(chǎng)景中的選定輸出”。

換句話說(shuō),如果是您的煮蛋計(jì)時(shí)器關(guān)閉,則該設(shè)備可能會(huì)使您的Apple Watch在手腕上輕按。或者,如果是防盜警報(bào),則該設(shè)備可以通知當(dāng)局。

蘋(píng)果公司表示:“聲音中包含大量的上下文信息?!?“識(shí)別常見(jiàn)的聲音可以使電子設(shè)備響應(yīng)于觀察到的環(huán)境(例如,根據(jù)觀察到的聲音確定)來(lái)適應(yīng)其行為或提供服務(wù),從而增加它們對(duì)用戶(hù)的相關(guān)性和價(jià)值,同時(shí)需要更少的用戶(hù)幫助或輸入。”

第二項(xiàng)專(zhuān)利申請(qǐng)歸功于包括丹尼爾·克林格(Daniel C. Klinger)在內(nèi)的四位發(fā)明家。他先前的工作包括一項(xiàng)專(zhuān)利申請(qǐng),該專(zhuān)利用于通過(guò)HomePod或其他設(shè)備進(jìn)行安全的電話呼叫。

責(zé)任編輯:lq

聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 音頻
    +關(guān)注

    關(guān)注

    29

    文章

    2883

    瀏覽量

    81639
  • 蘋(píng)果公司
    +關(guān)注

    關(guān)注

    2

    文章

    447

    瀏覽量

    22599
  • 深度學(xué)習(xí)
    +關(guān)注

    關(guān)注

    73

    文章

    5506

    瀏覽量

    121255
收藏 人收藏

    評(píng)論

    相關(guān)推薦

    TIKOOL太酷信息無(wú)線內(nèi)部通話系統(tǒng)允許多個(gè)人一起講話,頻道內(nèi)會(huì)不會(huì)很吵?

    傳統(tǒng)的對(duì)講機(jī)聲音采樣率普遍是4K,音質(zhì)差,往往音量大但稍有干擾就聽(tīng)不清內(nèi)容;TIKOOL太酷無(wú)線內(nèi)部通話系統(tǒng)音頻采樣率可達(dá)16K,音質(zhì)數(shù)倍的提升,具備極高的聲音還原度,如同面對(duì)面聊天,多人講話
    發(fā)表于 12-18 09:07

    音頻功放芯片:音頻設(shè)備的核心驅(qū)動(dòng)力

    音頻功放芯片是音頻設(shè)備核心,放大音頻信號(hào)精準(zhǔn)控制音質(zhì)、音量。高保真、穩(wěn)定、易集成,但面臨散熱和成本問(wèn)題。盡管如此,它仍是呈現(xiàn)高品質(zhì)聲音不可
    的頭像 發(fā)表于 12-17 16:37 ?248次閱讀
    <b class='flag-5'>音頻</b>功放芯片:<b class='flag-5'>音頻</b>設(shè)備的核心驅(qū)動(dòng)力

    TLV320aic3104怎么設(shè)置使耳機(jī)能聽(tīng)到人講話聲音?

    我公司有項(xiàng)目正在使用TLV320AIC3104 這顆TI codec IC,已拿到這顆IC的開(kāi)發(fā)套件,但是現(xiàn)在用TLV320aic3104評(píng)估板有些問(wèn)題請(qǐng)教。從電腦里面輸出聲音,耳機(jī)能正常收聽(tīng)。但是還不知道怎么設(shè)置使耳機(jī)能聽(tīng)到人講話
    發(fā)表于 11-07 06:44

    8127+tlv320aic3104設(shè)置立體聲采集到音頻播放是快進(jìn)音頻聲音,怎么解決?

    8127+tlv320aic3104設(shè)置單通道采集到的音頻播放正常流暢的聲音,設(shè)置立體聲采集到音頻 播放出來(lái)是快進(jìn)音頻聲音就是
    發(fā)表于 11-05 06:31

    用PCM1804做音頻轉(zhuǎn)換,輸出聲音很難聽(tīng)是什么原因?qū)е碌?

    。 目前還不確定問(wèn)題在哪里,就TTS和PCM之間來(lái)檢測(cè),有幾個(gè)可能,TTS輸出到PCM的信號(hào)需要調(diào)制到2.5V的中心電壓(已測(cè)試,無(wú)效果);TTS輸出到PCM的聲音信號(hào)峰值需放到2.5V。PCM
    發(fā)表于 10-28 08:01

    FSA8049連接耳麥L/R輸出聲音正常,耳麥話筒講話聲音沒(méi)有從FSA8049_B1腳輸出來(lái)是為什么?

    請(qǐng)工程幫忙確認(rèn)一下圖中FSA8049連接是否正確,現(xiàn)在遇到的問(wèn)題是連接耳麥L/R輸出聲音正常,耳麥話筒講話聲音沒(méi)有從FSA8049_B1腳輸出來(lái),測(cè)量B1腳MIC_BIAS電壓2.5v正常,B3腳連接耳麥正極就沒(méi)有電壓。
    發(fā)表于 10-25 11:07

    音頻信號(hào)通常包括哪些聲音信號(hào)

    音頻信號(hào)是指通過(guò)聲音傳輸?shù)男盘?hào),它包含了各種不同的聲音信號(hào)。以下是對(duì)音頻信號(hào)中常見(jiàn)的聲音信號(hào)的介紹: 語(yǔ)音信號(hào) 語(yǔ)音信號(hào)是人類(lèi)通過(guò)聲帶振動(dòng)產(chǎn)
    的頭像 發(fā)表于 08-25 15:43 ?1388次閱讀

    用opa1671做麥克風(fēng)前置放大器做音頻ADC采樣時(shí),距離遠(yuǎn)聲音太小怎么解決?

    在用opa1671做麥克風(fēng)前置放大器做音頻ADC采樣時(shí),距離遠(yuǎn)聲音太小,距離聲音太大,有沒(méi)有推薦的自動(dòng)AGC電路(參考電路),(由于功耗
    發(fā)表于 08-08 08:23

    TEA2025立體聲音頻功率放大器原理是什么

    音頻設(shè)備設(shè)計(jì)中,功率放大器是實(shí)現(xiàn)高質(zhì)量音頻輸出的關(guān)鍵組件。TEA2025立體聲音頻功率放大器以其杰出的性能和穩(wěn)定性,成為音頻工程師的理想選擇。本文將詳細(xì)介紹TEA2025立體
    的頭像 發(fā)表于 06-11 17:23 ?769次閱讀

    基于深度學(xué)習(xí)的鳥(niǎo)類(lèi)聲音識(shí)別系統(tǒng)

    模型被用于對(duì)鳥(niǎo)類(lèi)聲音數(shù)據(jù)進(jìn)行高精度的分類(lèi)。然而,現(xiàn)有的大多數(shù)鳥(niǎo)類(lèi)聲音識(shí)別模型的泛化能力較差,并且采用復(fù)雜的算法來(lái)提取鳥(niǎo)類(lèi)聲音特征。為了解決這
    發(fā)表于 05-30 20:30

    谷歌增強(qiáng)安卓無(wú)障礙體驗(yàn):用AI描述周?chē)?/b>環(huán)境等

     據(jù)悉,Lookout是谷歌專(zhuān)為盲人與低視力Android用戶(hù)設(shè)計(jì)的應(yīng)用,旨在協(xié)助他們識(shí)別周邊環(huán)境閱讀文檔。此次升級(jí)后,Lookout新增了一種查找模式,可識(shí)別包括座椅、桌子等在內(nèi)的
    的頭像 發(fā)表于 05-17 10:18 ?420次閱讀

    【RTC程序設(shè)計(jì):實(shí)時(shí)音視頻權(quán)威指南】音頻采集與渲染

    在進(jìn)行視頻的采集與渲染的同時(shí),我們還需要對(duì)音頻進(jìn)行實(shí)時(shí)的采集和渲染。對(duì)于rtc來(lái)說(shuō),音頻的實(shí)時(shí)性和流暢性更加重要。 聲音是由于物體在空氣中振動(dòng)而產(chǎn)生的壓力波,聲波的存在依賴(lài)于空氣介質(zhì),那么聲音
    發(fā)表于 04-28 21:00

    蘋(píng)果獲家庭聲音定位和識(shí)別專(zhuān)利,HomePod可監(jiān)聽(tīng)嬰兒哭鬧并向用戶(hù)發(fā)

    據(jù)美國(guó)商標(biāo)與專(zhuān)利管理局最近公布信息,蘋(píng)果成功取得一項(xiàng)關(guān)于音頻的專(zhuān)利,透過(guò)監(jiān)測(cè)室內(nèi)響動(dòng),為用戶(hù)提供另一間房?jī)?nèi)事件詳情。該專(zhuān)利名為《家庭聲音定位及辨識(shí)》
    的頭像 發(fā)表于 02-28 11:41 ?819次閱讀

    如何將HC-SR04連接到Arduino編寫(xiě)一個(gè)簡(jiǎn)單的程序來(lái)測(cè)量距離

    一種流行的Arduino超聲波傳感器是HC-SR04。它廣泛用于非接觸式距離測(cè)量,通常用于機(jī)器人和自動(dòng)化項(xiàng)目。本指南將向您展示如何將HC-SR04連接到Arduino編寫(xiě)一個(gè)簡(jiǎn)單的程序來(lái)測(cè)量
    的頭像 發(fā)表于 02-11 10:17 ?2395次閱讀
    如何將HC-SR04連接到Arduino<b class='flag-5'>并</b>編寫(xiě)一個(gè)簡(jiǎn)單的程序<b class='flag-5'>來(lái)</b>測(cè)量<b class='flag-5'>距離</b>

    立體聲音頻放大器電路圖分享

    立體聲音頻放大器是一種專(zhuān)門(mén)設(shè)計(jì)用于處理立體聲音頻信號(hào)的放大器。它通常具有兩個(gè)獨(dú)立的放大通道,分別用于處理左聲道和右聲道的音頻信號(hào)。立體聲音頻放大器的主要目的是增強(qiáng)
    的頭像 發(fā)表于 02-06 14:45 ?2715次閱讀
    立體<b class='flag-5'>聲音頻</b>放大器電路圖分享