微軟一直致力于開發(fā)一種新的語(yǔ)音輸入接口,允許用戶在沒有語(yǔ)音泄漏的情況下進(jìn)行說(shuō)話和錄音。該研究由微軟研究院進(jìn)行,并在UIST 2018中進(jìn)行了介紹。該模塊名為SilentVoice,可以捕捉來(lái)自口腔的空氣并記錄聲音而不會(huì)打擾周圍的人。此外,該模塊還將過(guò)濾周圍的語(yǔ)音,因此即使有外界干擾,用戶也可以捕獲清晰的語(yǔ)音。
SilentVoice是一種新的語(yǔ)音輸入接口設(shè)備,所提出的“漸進(jìn)式語(yǔ)音”方法使得能夠?qū)Ⅺ溈孙L(fēng)放置在非??拷斓那安慷皇墉h(huán)境噪聲的影響,捕獲具有良好信噪比非常柔和的語(yǔ)音。它實(shí)現(xiàn)了超?。ǖ陀?9dB)的語(yǔ)音泄漏,允許用戶使用語(yǔ)音輸入,而不會(huì)在公共和移動(dòng)情況下以及在辦公室和家庭中煩擾周圍的人。
通過(guò)測(cè)量氣流方向,SilentVoice可以很容易地與正常話語(yǔ)分離,準(zhǔn)確率為98.8%,它可以用于帶有經(jīng)過(guò)專門訓(xùn)練的語(yǔ)音識(shí)別器的語(yǔ)音激活系統(tǒng),微軟評(píng)估其單詞錯(cuò)誤率(WERs)為1.8%,(依賴說(shuō)話者的條件),7.0%(和說(shuō)話者無(wú)關(guān)的條件)。
該技術(shù)仍處于研究階段,但肯定會(huì)幫助人們?cè)诓淮驍_周圍人的情況下工作并且錄制語(yǔ)音。
聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。
舉報(bào)投訴
原文標(biāo)題:微軟正在研發(fā)新語(yǔ)音輸入技術(shù):用戶小聲說(shuō)話也能輸入
文章出處:【微信號(hào):robot-1hjqr,微信公眾號(hào):1號(hào)機(jī)器人網(wǎng)】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
相關(guān)推薦
智能語(yǔ)音識(shí)別和語(yǔ)音應(yīng)答,成為移動(dòng)互聯(lián)網(wǎng)時(shí)代重要的技術(shù),蘋果、微軟、谷歌(微博)、亞馬遜等各大巨頭均有布局。在人類
發(fā)表于 10-19 09:57
?3551次閱讀
微軟語(yǔ)音識(shí)別系統(tǒng)如何可以在labview上應(yīng)用起來(lái)?貌似這兩個(gè)軟件不兼容,有什么好的處理方法
發(fā)表于 03-23 16:00
導(dǎo)讀:關(guān)于下一代 HoloLens,微軟終于透露了一些消息:正在研發(fā) AI 芯片,使其識(shí)別
發(fā)表于 07-31 21:17
導(dǎo)讀:微軟今天宣布,其會(huì)話語(yǔ)音識(shí)別系統(tǒng)的誤率達(dá)到了5.1%,是目前為止最低的。
[img][/img]
這一數(shù)據(jù)超過(guò)了微軟人工智
發(fā)表于 08-23 09:18
,通過(guò)語(yǔ)音命令進(jìn)行操作。語(yǔ)音技術(shù)的應(yīng)用已經(jīng)成為一個(gè)具有競(jìng)爭(zhēng)性的新興高技術(shù)產(chǎn)業(yè)。
發(fā)表于 03-10 22:00
聲音波形的一個(gè)個(gè)點(diǎn)了。下圖是一個(gè)波形的示例。 在開始語(yǔ)音識(shí)別之前,有時(shí)需要把首尾端的靜音切除,降低對(duì)后續(xù)步驟造成的干擾。這個(gè)
發(fā)表于 05-30 07:41
特定人語(yǔ)音識(shí)別的方法有哪些?特定人語(yǔ)音識(shí)別系統(tǒng)是由哪些部分組成的?如何去實(shí)現(xiàn)一種特定人語(yǔ)音
發(fā)表于 05-19 06:44
語(yǔ)音與“家電溝通”,控制其開啟和關(guān)斷?;舅悸罚鹤髌啡诤蠁纹瑱C(jī)技術(shù)、基于非特定人的語(yǔ)音識(shí)別技術(shù)、無(wú)線信息發(fā)傳輸
發(fā)表于 09-15 06:50
基于STM32F429的語(yǔ)音識(shí)別交互系統(tǒng)有哪些具體功能?怎樣去設(shè)計(jì)一種基于STM32F429的語(yǔ)音識(shí)別交互系統(tǒng)?
發(fā)表于 10-20 06:58
基于微軟嵌入式系統(tǒng)該怎樣去添加語(yǔ)音識(shí)別及朗讀功能呢?
發(fā)表于 12-23 06:42
什么是語(yǔ)音識(shí)別技術(shù)
語(yǔ)音識(shí)別技術(shù)就是讓機(jī)器通過(guò)識(shí)別
發(fā)表于 03-06 10:35
?1597次閱讀
Cloud Shell表明微軟正在研發(fā)一種基于云計(jì)算的Windows 10系統(tǒng),并且可以在基于x86架構(gòu)(英特爾、AMD)和ARM架構(gòu)(驍龍、Tegra、Exynos)等不同設(shè)備上運(yùn)行
發(fā)表于 01-29 22:47
?512次閱讀
隨著微處理器技術(shù)的發(fā)展與成熟,嵌入式語(yǔ)音識(shí)別系統(tǒng)已逐漸成為各領(lǐng)域研究的熱點(diǎn)方向,各種迎合人們需求的語(yǔ)音識(shí)別設(shè)備出現(xiàn)在我們的現(xiàn)實(shí)生活中。本課題
發(fā)表于 03-19 14:29
?4070次閱讀
語(yǔ)音識(shí)別是一種可以識(shí)別口語(yǔ)單詞的技術(shù),然后可以將其轉(zhuǎn)換為文本。語(yǔ)音
發(fā)表于 03-03 10:51
?1088次閱讀
方案介紹概要:此設(shè)計(jì)提供了一種低功耗的語(yǔ)音識(shí)別解決方案。它通過(guò)實(shí)現(xiàn)波束賦形和噪聲抑制器功能來(lái)提高識(shí)別率,并且可以根據(jù)工作環(huán)境進(jìn)行調(diào)整。系統(tǒng)優(yōu)勢(shì)通過(guò)使用 RA6M1 MCU 的低功耗
發(fā)表于 12-28 16:10
?0次下載
評(píng)論