最新研究表明,蘋(píng)果公司正在研究HomePod或其他設(shè)備如何使用音頻來(lái)估計(jì)與講話用戶(hù)之間的距離,并識(shí)別周?chē)穆曇簟?/p>
Apple的HomePod已經(jīng)非常擅長(zhǎng)于聽(tīng)到您的聲音,即使它正在大聲播放音樂(lè)。蘋(píng)果公司有兩項(xiàng)單獨(dú)的新專(zhuān)利申請(qǐng)表明,蘋(píng)果公司希望將其改進(jìn),并將設(shè)備的聆聽(tīng)能力提高到一個(gè)新水平。
其中之一,“基于學(xué)習(xí)的距離估計(jì)”,不僅涉及使用音頻來(lái)識(shí)別用戶(hù),而且要弄清楚他們?cè)谀睦铩?/p>
專(zhuān)利申請(qǐng)說(shuō):“通常希望設(shè)備使用[其]緊湊型麥克風(fēng)陣列來(lái)估算從設(shè)備到用戶(hù)的距離?!?“例如,該設(shè)備可以基于用戶(hù)到該設(shè)備的估計(jì)距離來(lái)調(diào)整播放音量或來(lái)自智能輔助設(shè)備的響應(yīng)?!?/p>
繼續(xù)說(shuō):“因此,如果用戶(hù)離設(shè)備非常近,則不會(huì)大量播放音樂(lè)或語(yǔ)音?!?或者,如果用戶(hù)離得很遠(yuǎn),則可以將媒體播放或來(lái)自智能助手設(shè)備的響應(yīng)調(diào)整為更大的音量?!?/p>
同樣的想法也意味著將其引入蘋(píng)果公司目前令人印象深刻但有些瑕疵的系統(tǒng),在該系統(tǒng)中,所有設(shè)備都會(huì)嘗試確定您對(duì)“嘿,Siri”說(shuō)的是什么。
蘋(píng)果公司說(shuō):“在有多個(gè)設(shè)備的應(yīng)用程序中,這些設(shè)備可以在彼此之間進(jìn)行協(xié)調(diào)或仲裁,以根據(jù)從每個(gè)設(shè)備到用戶(hù)的距離來(lái)決定應(yīng)回答一個(gè)或多個(gè)設(shè)備的查詢(xún)?!?/p>
蘋(píng)果公司提出了簡(jiǎn)單和更復(fù)雜的解決方案,它們都可以同時(shí)使用。更簡(jiǎn)單的方法是讓設(shè)備先執(zhí)行HomePod的工作并首先繪制其環(huán)境圖。
然后,它實(shí)際上具有“在聲學(xué)環(huán)境中的測(cè)量點(diǎn)或模擬點(diǎn)的網(wǎng)格”。在這種情況下,可以將聲音與此“網(wǎng)格”進(jìn)行比較,以大致了解說(shuō)話者所在的位置。
但是,Apple認(rèn)為這本身并不足夠好,并且還說(shuō)它與Siri最少一起使用。那是因?yàn)橐粋€(gè)人說(shuō)話時(shí)可能會(huì)動(dòng)彈,而且他們要求快速回應(yīng)-此提議不適合。
備選地,然后,“如果至少兩個(gè)麥克風(fēng)陣列可用”,則“可以使用三角測(cè)量方法來(lái)估計(jì)語(yǔ)音源的距離”。
但是,這里的關(guān)鍵部分是至少需要兩個(gè)帶麥克風(fēng)的設(shè)備。因此,Apple提供了另一個(gè)涉及更多的解決方案,其中涉及“基于學(xué)習(xí)的系統(tǒng),如深度神經(jīng)網(wǎng)絡(luò)(DNN)”,并且不需要多個(gè)設(shè)備。
專(zhuān)利申請(qǐng)說(shuō):“深度學(xué)習(xí)系統(tǒng)可以根據(jù)緊湊型麥克風(fēng)陣列接收到的語(yǔ)音信號(hào)來(lái)估計(jì)每個(gè)時(shí)間幀的語(yǔ)音源距離?!?/p>
這個(gè)DNN系統(tǒng)可以做的是確定什么是語(yǔ)音,什么是背景噪聲。然后,它可以計(jì)算“有關(guān)直接信號(hào)傳播的信息”以及“混響效果和噪聲”。
該申請(qǐng)歸功于三位發(fā)明者,包括Mehrez Souden和Joshua D. Atkins。他們先前的相關(guān)工作包括已獲專(zhuān)利的如何使用比普通麥克風(fēng)少的聲音來(lái)錄制完整空間聲音的專(zhuān)利。
這特別涉及Apple AR中的音頻,該最新專(zhuān)利申請(qǐng)涉及真實(shí)環(huán)境中的物理設(shè)備。但是,如果只是為了避免用太大聲的HomePod mini炸毀別人的耳朵而感到很麻煩,那還有很多事情要做。
該專(zhuān)利申請(qǐng)說(shuō):“例如,助聽(tīng)器之類(lèi)的輔助和增強(qiáng)型助聽(tīng)器可以根據(jù)語(yǔ)音源的距離來(lái)增強(qiáng)音頻信號(hào)。”
這也是第二個(gè)新公開(kāi)的專(zhuān)利申請(qǐng)重點(diǎn)關(guān)注的內(nèi)容。
識(shí)別重要的聲音
“基于觀察到的聲音識(shí)別聲源的系統(tǒng)和方法”,是關(guān)于讓一些設(shè)備識(shí)別其他聲音并為我們做出反應(yīng)。
“許多家用電器,例如微波爐,洗衣機(jī),洗碗機(jī)和門(mén)鈴,會(huì)發(fā)出聲音來(lái)提醒用戶(hù)該器具的狀況已經(jīng)改變,”該專(zhuān)利申請(qǐng)開(kāi)始。
它繼續(xù)說(shuō):“但是,由于各種原因,用戶(hù)可能無(wú)法聽(tīng)到家用電器發(fā)出的聲音警報(bào)?!?“例如,用戶(hù)可能有聽(tīng)力障礙,用戶(hù)可能在外面或在另一個(gè)房間里,或者設(shè)備可能發(fā)出被家庭聲學(xué)場(chǎng)景遮擋的聲音。”
也不必是您的煮蛋計(jì)時(shí)器關(guān)閉。該專(zhuān)利同樣涉及“公共場(chǎng)所(政府大樓),半公共場(chǎng)所(辦公室大廳)和私人場(chǎng)所(住宅或辦公大樓)”中的聲音。
它說(shuō):“(這些)也有聲學(xué)場(chǎng)景,可以包含帶有信息的聲音。” “例如,鈴,鈴或蜂鳴器可能指示門(mén)已經(jīng)打開(kāi)或關(guān)閉,或者警報(bào)器可能發(fā)出警報(bào)聲或其他聲音,警告附近的人有危險(xiǎn)(例如,煙,火或一氧化碳)。”
總體而言,該專(zhuān)利申請(qǐng)主要詳述了可以“訓(xùn)練”設(shè)備以識(shí)別“常見(jiàn)聲音”的方法。然后,它將繼續(xù)偵聽(tīng)其中的任何一個(gè),并且當(dāng)聽(tīng)到一個(gè)聲音時(shí),可以發(fā)出“響應(yīng)于確定聲音存在于聲學(xué)場(chǎng)景中的選定輸出”。
換句話說(shuō),如果是您的煮蛋計(jì)時(shí)器關(guān)閉,則該設(shè)備可能會(huì)使您的Apple Watch在手腕上輕按。或者,如果是防盜警報(bào),則該設(shè)備可以通知當(dāng)局。
蘋(píng)果公司表示:“聲音中包含大量的上下文信息?!?“識(shí)別常見(jiàn)的聲音可以使電子設(shè)備響應(yīng)于觀察到的環(huán)境(例如,根據(jù)觀察到的聲音確定)來(lái)適應(yīng)其行為或提供服務(wù),從而增加它們對(duì)用戶(hù)的相關(guān)性和價(jià)值,同時(shí)需要更少的用戶(hù)幫助或輸入。”
第二項(xiàng)專(zhuān)利申請(qǐng)歸功于包括丹尼爾·克林格(Daniel C. Klinger)在內(nèi)的四位發(fā)明家。他先前的工作包括一項(xiàng)專(zhuān)利申請(qǐng),該專(zhuān)利用于通過(guò)HomePod或其他設(shè)備進(jìn)行安全的電話呼叫。
責(zé)任編輯:lq
-
音頻
+關(guān)注
關(guān)注
29文章
2883瀏覽量
81639 -
蘋(píng)果公司
+關(guān)注
關(guān)注
2文章
447瀏覽量
22599 -
深度學(xué)習(xí)
+關(guān)注
關(guān)注
73文章
5506瀏覽量
121255
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
評(píng)論