一枚硬幣大小的石墨烯片,貼在頸部靠近喉嚨處,就能幫助發(fā)音障礙者獲得新“聲”。近日,清華大學(xué)集成電路學(xué)院任天令教授及合作團(tuán)隊(duì)在智能語(yǔ)音交互方面取得重要進(jìn)展,其研發(fā)的可穿戴人工喉可以感知喉部發(fā)聲相關(guān)信號(hào),并通過(guò)人工智能模型將其識(shí)別和合成為語(yǔ)音,還原準(zhǔn)確率超過(guò)90%。
這一研究結(jié)果為語(yǔ)音識(shí)別與交互系統(tǒng)提供了一條新的技術(shù)途徑,并于近日在線發(fā)表在《自然》人工智能子刊《自然·機(jī)器智能》上。
語(yǔ)音是人類(lèi)交流的重要方式,但說(shuō)話(huà)人的健康狀態(tài)(例如神經(jīng)疾病、癌癥、外傷等原因?qū)е碌穆曇粽系K)和周?chē)h(huán)境(噪音干擾、傳播介質(zhì))往往會(huì)影響聲音的傳輸和識(shí)別。一直以來(lái),研究人員在致力改進(jìn)語(yǔ)音識(shí)別和交互技術(shù)以應(yīng)對(duì)微弱的聲源或嘈雜的環(huán)境。多通道聲學(xué)傳感器可以顯著提高聲音識(shí)別的精度,但會(huì)導(dǎo)致更大的設(shè)備體積,而可穿戴設(shè)備能夠獲取高質(zhì)量的原始語(yǔ)音或其他生理信號(hào)。然而,目前尚無(wú)充分的證據(jù)表明喉部肌肉的運(yùn)動(dòng)模式和反映在體表的發(fā)聲器官振動(dòng)中隱含著可識(shí)別的語(yǔ)音特征,且尚無(wú)實(shí)驗(yàn)證明其作為語(yǔ)音識(shí)別技術(shù)的完備性。
為解決這一問(wèn)題,任天令團(tuán)隊(duì)成員開(kāi)發(fā)了一款基于石墨烯的智能可穿戴人工喉,同商業(yè)麥克風(fēng)和壓電薄膜相比,人工喉對(duì)低頻的肌肉運(yùn)動(dòng)、中頻食管振動(dòng)和高頻聲波信息有很高的靈敏度,同時(shí)也具有抗噪聲的語(yǔ)音感知能力。對(duì)聲學(xué)信號(hào)和機(jī)械運(yùn)動(dòng)的混合模態(tài)的感知使人工喉能夠獲得更低的語(yǔ)音基頻信號(hào)。此外,該器件還可以通過(guò)熱聲效應(yīng)實(shí)現(xiàn)聲音的播放功能。人工喉的制作過(guò)程簡(jiǎn)單、性能穩(wěn)定、易于集成,為語(yǔ)音識(shí)別和交互提供了一種新的硬件平臺(tái)。
圖1 可穿戴的第二代智能石墨烯人工喉系統(tǒng):該人工喉集收聲和發(fā)聲于一體,可直接貼附于失語(yǔ)者喉部,并將喉部的不同動(dòng)作轉(zhuǎn)化為對(duì)應(yīng)聲音,有望幫助失語(yǔ)者正常與他人“交談”。
團(tuán)隊(duì)還利用人工智能模型對(duì)人工喉感知的信號(hào)進(jìn)行語(yǔ)音識(shí)別和合成,實(shí)現(xiàn)了對(duì)基本語(yǔ)音元素(音素、聲調(diào)和詞語(yǔ))的高精度識(shí)別,以及對(duì)喉癌患者模糊語(yǔ)音的識(shí)別與再現(xiàn),為聲音障礙者的溝通和交互提供了一種創(chuàng)新的解決方案。
實(shí)驗(yàn)結(jié)果表明,人工喉采集的混合模態(tài)語(yǔ)音信號(hào)可以識(shí)別基本語(yǔ)音元素(音素、音調(diào)和單詞),平均準(zhǔn)確率為99.05%。同時(shí)人工喉的抗噪聲性能明顯優(yōu)于麥克風(fēng),在60分貝以上環(huán)境噪聲下仍能保持識(shí)別能力。任天令研究團(tuán)隊(duì)進(jìn)一步演示了它的語(yǔ)音交互式應(yīng)用:通過(guò)集成AI模型,人工喉能夠識(shí)別一名喉切除術(shù)患者模糊說(shuō)出的日常詞語(yǔ),準(zhǔn)確率超過(guò)90%。識(shí)別出的內(nèi)容被合成為語(yǔ)音在人工喉上播放,可以初步恢復(fù)患者的語(yǔ)音交流能力。
任天令介紹,該人工喉還有很大的優(yōu)化和拓展空間,例如提高聲音的質(zhì)量和音量,增加語(yǔ)音的多樣性和表情,以及結(jié)合其他生理信號(hào)和環(huán)境信息實(shí)現(xiàn)更自然和智能的語(yǔ)音交互。研究團(tuán)隊(duì)希望通過(guò)進(jìn)一步的研究和合作,讓人工喉造福更多的聲音障礙者和語(yǔ)音交互的用戶(hù)。在未來(lái),該人工喉將與聲紋識(shí)別、機(jī)器學(xué)習(xí)等技術(shù)結(jié)合,在語(yǔ)音識(shí)別、家庭醫(yī)療等領(lǐng)域具有廣闊前景。
審核編輯 :李倩
-
人工智能
+關(guān)注
關(guān)注
1792文章
47514瀏覽量
239247 -
石墨烯
+關(guān)注
關(guān)注
54文章
1561瀏覽量
79834 -
智能語(yǔ)音
+關(guān)注
關(guān)注
10文章
789瀏覽量
48825
原文標(biāo)題:清華大學(xué)研發(fā)出可穿戴人工喉:還原準(zhǔn)確率超90%
文章出處:【微信號(hào):MEMSensor,微信公眾號(hào):MEMS】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
評(píng)論