除了指紋識(shí)別、面容識(shí)別,你還能想到什么生物識(shí)別方法呢?沒錯(cuò)!就是聲紋識(shí)別。雖然聲紋識(shí)別一直非常低調(diào),但也不能否認(rèn)它是人工智能領(lǐng)域的又一黑科技。
語音識(shí)別并不是聲紋識(shí)別
聲紋識(shí)別聽上去好像很高級(jí),其實(shí)不少小伙伴的手機(jī)里就有這個(gè)功能哦。小黑以iPhone為例,當(dāng)你開啟Siri語音助手時(shí),系統(tǒng)會(huì)先讓你讀出一些特定的句子。這個(gè)步驟就是為了識(shí)別你的聲紋,以免其他人可以喚醒你的Siri。
現(xiàn)在很多智能家居都可以通過聲音來操控,比如用小愛音箱來開關(guān)燈具,或者對(duì)智能電視發(fā)出指令來調(diào)換頻道等。于是就會(huì)有許多小伙伴認(rèn)為,這也是聲紋識(shí)別。其實(shí)目前大多數(shù)的聲音操控都屬于語音識(shí)別。
簡(jiǎn)而言之,語音識(shí)別是為了識(shí)別語音中的內(nèi)容,并用AI自動(dòng)將我們說出的話轉(zhuǎn)換成相應(yīng)的文字。而聲紋識(shí)別可以識(shí)別出說話人的身份,實(shí)現(xiàn)“一對(duì)一”語音控制。因此,聲紋識(shí)別不注重語音信號(hào)的語義,而是從語音信號(hào)中提取個(gè)人聲紋特征,挖掘出包含在語音信號(hào)中的個(gè)性因素。
聲紋識(shí)別究竟特別在哪里?
我們平時(shí)在說話時(shí)的發(fā)聲器官在尺寸和形狀方面每個(gè)人的差異都很大,所以任何兩個(gè)人的聲紋圖譜都不可能相同。聲紋識(shí)別也正是通過這個(gè)特點(diǎn)來通過對(duì)比語音的相同音素上的發(fā)聲來判斷聲音是否屬于同一個(gè)人。
聲紋識(shí)別基于語音中所包含的說話人特有的個(gè)性信息,再利用計(jì)算機(jī)以及現(xiàn)有的識(shí)別技術(shù),自動(dòng)鑒別當(dāng)前語音對(duì)應(yīng)的說話人身份。聲紋識(shí)別系統(tǒng)包含了說話人模型訓(xùn)練和測(cè)試語音識(shí)別兩個(gè)階段。
▲ 聲紋識(shí)別的系統(tǒng)框架
訓(xùn)練階段:對(duì)使用系統(tǒng)的說話人預(yù)留了充足的語音,并對(duì)不同說話人的語音提取聲學(xué)特征,然后根據(jù)每個(gè)說話人的語音特征,訓(xùn)練得到對(duì)應(yīng)的說話人模型,最終將全體說話人模型集合在一起組成系統(tǒng)的說話人模型庫(kù)。
識(shí)別階段:說話人進(jìn)行識(shí)別認(rèn)證的時(shí)候,系統(tǒng)對(duì)識(shí)別語音進(jìn)行相同的特征提取,并將語音特征與說話人模型庫(kù)進(jìn)行比對(duì),得到對(duì)應(yīng)說話人模型的相似性打分,最后根據(jù)識(shí)別打分,判斷說話人身份。
指紋和面容識(shí)別無法做到無感知
和指紋識(shí)別相比,聲紋識(shí)別技術(shù)可以做到無感知、無接觸。你不需要用手指觸摸很多人留下細(xì)菌的指紋識(shí)別設(shè)備。而相比于面容識(shí)別,特別在人人都戴口罩的特殊時(shí)期,不用摘下口罩依然可以利用聲紋來辨別信息。
哪些場(chǎng)景會(huì)運(yùn)用到聲紋識(shí)別?
其實(shí)當(dāng)今遠(yuǎn)程交互方式變得越來越多,在一些特定的智能場(chǎng)景中,是沒有辦法通過指紋或是面容來進(jìn)行識(shí)別的,那么聲紋識(shí)別就成為了唯一可以識(shí)別我們身份的技術(shù)。既然聲紋識(shí)別這么厲害,它可以被運(yùn)用到哪些場(chǎng)景中呢?
大家應(yīng)該都在銀行的電話客服上面辦過業(yè)務(wù)吧,每一次都要報(bào)出身份證、手機(jī)號(hào)等一系列能夠證明自己身份的信息。但如果聲紋識(shí)別未來得到普及,銀行就可以通過聲紋來辨別身份,無論是電話還是網(wǎng)上都能夠輕松辦理業(yè)務(wù)了。
當(dāng)然,社保局也可以運(yùn)用聲紋識(shí)別防止養(yǎng)老金被冒領(lǐng)。畢竟許多老人對(duì)于人工智能、生物識(shí)別并不很了解,而聲紋識(shí)別只用通過聲音,哪怕本人無法到達(dá)現(xiàn)場(chǎng),也可以通過電話進(jìn)行遠(yuǎn)程身份確認(rèn)。
聲紋識(shí)別還可以運(yùn)用到火車、飛機(jī)的安檢流程中,有效的對(duì)危險(xiǎn)人物進(jìn)行識(shí)別和提示。對(duì)于電話詐騙、刑事案件也有很大的幫助,公安司法人員可以通過聲紋識(shí)別來鎖定嫌犯或縮小偵查范圍。
不過,聲紋識(shí)別的缺點(diǎn)也十分明顯,對(duì)環(huán)境的要求非常高,在嘈雜的環(huán)境混合說話下,聲紋不易獲??;人的聲音也會(huì)隨著年齡、身體狀況、情緒等的影響而變化;不同的麥克風(fēng)和信道對(duì)識(shí)別性能有影響等。
聲紋識(shí)別作為最前沿的生物識(shí)別技術(shù)之一,未來一定會(huì)有更多有意義的使用場(chǎng)景,例如在操控智能音箱時(shí),根據(jù)不同用戶的聲紋判斷他們的使用習(xí)慣,來以此提供更人性化的服務(wù)。不過,小黑覺得想要達(dá)到真正的一對(duì)一聲紋識(shí)別,人工智能還需要時(shí)間來學(xué)習(xí)。
責(zé)任編輯:xj
-
指紋識(shí)別
+關(guān)注
關(guān)注
43文章
1742瀏覽量
102249 -
生物識(shí)別
+關(guān)注
關(guān)注
3文章
1210瀏覽量
52521 -
面部識(shí)別
+關(guān)注
關(guān)注
1文章
375瀏覽量
26637
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
評(píng)論