基于DSP的高速實(shí)時(shí)語(yǔ)音識(shí)別系統(tǒng)的設(shè)計(jì) - 全文

實(shí)時(shí)語(yǔ)音識(shí)別系統(tǒng)中，由于語(yǔ)音的數(shù)據(jù)量大，運(yùn)算復(fù)雜，對(duì)處理器性能提出了很高的要求，適于采用高速DSP實(shí)現(xiàn)。雖然DSP提供了高速和靈活的硬件設(shè)計(jì)，但是在實(shí)時(shí)處理系統(tǒng)中，還需結(jié)合DSP器件的結(jié)構(gòu)及工作方式，針對(duì)語(yǔ)音處理的特點(diǎn)，對(duì)軟件進(jìn)行反復(fù)優(yōu)化，以縮短識(shí)別時(shí)間，滿足實(shí)時(shí)的需求。因此如何對(duì)DSP進(jìn)行優(yōu)化編程，解決算法的復(fù)雜性和硬件存儲(chǔ)容量及速度之間的矛盾，成為實(shí)現(xiàn)系統(tǒng)性能的關(guān)鍵。本文基于TMS320C6713設(shè)計(jì)并實(shí)現(xiàn)了高速實(shí)時(shí)語(yǔ)音識(shí)別系統(tǒng)，在固定文本的說(shuō)話人辨識(shí)的應(yīng)用中效果顯著。

1 語(yǔ)音識(shí)別的原理

　　語(yǔ)音識(shí)別的基本原理框圖如圖1所示。語(yǔ)音信號(hào)中含有豐富的信息，從中提取對(duì)語(yǔ)音識(shí)別有用的信息的過(guò)程，就是特征提取，特征提取方法是整個(gè)語(yǔ)音識(shí)別系統(tǒng)的基礎(chǔ)。語(yǔ)音識(shí)別的過(guò)程可以被看作足模式匹配的過(guò)程，模式匹配是指根據(jù)一定的準(zhǔn)則，使未知模式與模型庫(kù)中的某一模型獲得最佳匹配。

1.1 MFCC

語(yǔ)音識(shí)別中對(duì)特征參數(shù)的要求是：

(1) 能夠有效地代表語(yǔ)音特征；

(2) 各階參數(shù)之間有良好的獨(dú)立性；

(3) 特征參數(shù)要計(jì)算方便，保證識(shí)別的實(shí)時(shí)實(shí)現(xiàn)。

　　系統(tǒng)使用目前最為常用的MFCC(Mel FrequencyCepSTral Coefficient，美爾頻率倒譜系數(shù))參數(shù)。

求取MFCC的主要步驟是：

(1) 給每一幀語(yǔ)音加窗做FFT，取出幅度；

(2) 將幅度和濾波器組中每一個(gè)三角濾波器進(jìn)行Binning運(yùn)算；

(3) 求log，換算成對(duì)數(shù)率；

(4) 從對(duì)數(shù)率的濾波器組幅度，使用DCT變換求出MFCC系數(shù)。

　　本文中采用12階的MFCC，同時(shí)加過(guò)零率和delta能量共14維的語(yǔ)音參數(shù)。

1.2 DTW

　　語(yǔ)音識(shí)別中的模式匹配和模型訓(xùn)練技術(shù)主要有DTW(Dynamic TIme Warping，動(dòng)態(tài)時(shí)間彎折)、HMM(HideMarkov Model，隱馬爾科夫模型)和ANN(Artificial Neu-ral Network，人工神經(jīng)元網(wǎng)絡(luò))。

　　DTW是一種簡(jiǎn)單有效的方法。該算法基于動(dòng)態(tài)規(guī)劃的思想，解決了發(fā)音長(zhǎng)短不一的模板匹配問(wèn)題，是語(yǔ)音識(shí)別中出現(xiàn)較早、較為經(jīng)典的一種算法。DTW算法的原理是計(jì)算兩個(gè)長(zhǎng)度不同的語(yǔ)音之間的相似程度，即失真距離。

　　設(shè)測(cè)試語(yǔ)音和參考語(yǔ)音用T和R表示，他們分別含有N幀和M幀的語(yǔ)音參數(shù)。本文中每幀語(yǔ)音的特征參數(shù)為14維，因此T，R分別為N×14和M×14的矩陣。把測(cè)試語(yǔ)音的各個(gè)幀號(hào)x=1～N在一個(gè)二維直角坐標(biāo)系中的橫軸上標(biāo)出，把參考語(yǔ)音的各幀號(hào)y=1～M在縱軸上標(biāo)出，通過(guò)這些表示幀號(hào)的整數(shù)坐標(biāo)畫出一些縱橫線即可形成一個(gè)網(wǎng)格，網(wǎng)格中的每一個(gè)交叉點(diǎn)(x，y)表示測(cè)試模式中某一幀號(hào)與訓(xùn)練模式某一幀的交叉點(diǎn)，對(duì)應(yīng)于兩個(gè)14維向量的歐氏距離。DTW算法在于尋找一條通過(guò)此網(wǎng)格中若干交叉點(diǎn)的路徑，使得該路徑上節(jié)點(diǎn)的路徑和最小。算法示意圖如圖3所示。

2 系統(tǒng)硬件環(huán)境

　　本系統(tǒng)的核心芯片為TI公司的32位浮點(diǎn)數(shù)字信號(hào)處理器TMS320C6713。其時(shí)鐘頻率最高可達(dá)300 MHz，處理能力可以高達(dá)1 336 MIPS和1 000 MFLOPS。由于256 kB的片上RAM無(wú)法滿足多路信號(hào)處理時(shí)的空間需求，系統(tǒng)通過(guò)EMIF(External Memory Interface，外部存儲(chǔ)器接口)擴(kuò)展了32 MB的外部SDRAM，并采用EDMA(External Direct Memory Access，擴(kuò)展的直接存儲(chǔ)器訪問(wèn))方式對(duì)這些外部空間進(jìn)行訪問(wèn)。

　　TMS320C6713有2個(gè)McBSPs(Multi-channel Buff-ered Serial Port，多通道緩沖串口)，每個(gè)McBSP，可與多達(dá)128個(gè)通道進(jìn)行收發(fā)。本系統(tǒng)中采用McBSP0實(shí)現(xiàn)數(shù)字語(yǔ)音信號(hào)到DSP的輸入，DSP進(jìn)行實(shí)時(shí)判別后輸出結(jié)果。

3 軟件實(shí)現(xiàn)

　　由于TMS320C6x系列的C語(yǔ)言編譯器的效率可達(dá)匯編語(yǔ)言的70％～80％，并且C語(yǔ)言具有開(kāi)發(fā)周期短、可維護(hù)性好、可移植性好、可繼承性好等優(yōu)點(diǎn)，所以軟件采用C語(yǔ)言實(shí)現(xiàn)。

3.1 軟件流程

　　測(cè)試中采用10個(gè)參考模板，每個(gè)模板由相應(yīng)的參考語(yǔ)音中2 s的語(yǔ)音數(shù)據(jù)訓(xùn)練而成。識(shí)別策略為每路積累2 s的接收語(yǔ)音數(shù)據(jù)后與逐個(gè)參考模板進(jìn)行匹配，如果經(jīng)由DTW運(yùn)算所得的距離值小于特定的門限，就判決已匹配。如果不匹配，就繼續(xù)接收匹配，超過(guò)8 s匹配不上，就放棄。軟件流程框圖如圖5所示，其中語(yǔ)音數(shù)據(jù)的采樣率為8 000 Hz，每幀取256個(gè)采樣點(diǎn)，即32 ms的數(shù)據(jù)為一幀。

　　程序調(diào)試通過(guò)后，采用CCS對(duì)其實(shí)時(shí)性進(jìn)行分析。CCS(Code Composer Studio，代碼編譯器)是TI公司提供的軟件開(kāi)發(fā)環(huán)境。他擴(kuò)展了基本的代碼生成工具，集成了調(diào)試和實(shí)時(shí)分析功能。在CCS下，程序通過(guò)Wintech TDS510仿真器接到目標(biāo)板的JTAG口進(jìn)行硬件仿真測(cè)試。

　　測(cè)試發(fā)現(xiàn)1幀信號(hào)的處理時(shí)間為78 135 679個(gè)指令周期，即391 ms(TMS320C6713工作在200 MHz)，遠(yuǎn)遠(yuǎn)達(dá)不到實(shí)時(shí)處理的要求，必須對(duì)其進(jìn)行優(yōu)化。

3.2 代碼的優(yōu)化

　　首先根據(jù)TI公司提供的軟件開(kāi)發(fā)流程，從合作編譯器選項(xiàng)、使用內(nèi)聯(lián)函數(shù)、使用字訪問(wèn)短整型數(shù)據(jù)和使用軟件流水等方面對(duì)代碼進(jìn)行了優(yōu)化。具體實(shí)現(xiàn)中，采用-pm選項(xiàng)、-op3選項(xiàng)和-o3選項(xiàng)對(duì)程序進(jìn)行了重新編譯。展開(kāi)內(nèi)層循環(huán)，并通過(guò)#pragma MUST ITERATE()告訴編譯器循環(huán)執(zhí)行的次數(shù)，上述優(yōu)化后，處理一幀的時(shí)間從78 135 679個(gè)指令周期降到了50 364 683個(gè)指令周期，但是還是無(wú)法滿足實(shí)時(shí)性的要求。

　　進(jìn)一步對(duì)代碼進(jìn)行測(cè)試分析，提取MFCC參數(shù)的過(guò)程中，256點(diǎn)的實(shí)數(shù)FFT運(yùn)算占用了大量的時(shí)間。TI公司針對(duì)C6000系列的DSP提供了豐富的庫(kù)函數(shù)可以方便地調(diào)用。這里，從dsp67x.lib中調(diào)用DSPF_dp_cfftr4_dif()進(jìn)行256點(diǎn)實(shí)數(shù)的FFT運(yùn)算，把提取MFCC的時(shí)間降為了0.72 ms。

　　由于采用10個(gè)參考模板，每路數(shù)據(jù)一次識(shí)別就要進(jìn)行10次DTW的運(yùn)算，所以如何減少DTW的運(yùn)算時(shí)間是優(yōu)化的重點(diǎn)。對(duì)DTW的優(yōu)化從兩方面進(jìn)行，首先采用查表法縮小匹配時(shí)搜索的區(qū)域。

　　由于DTW匹配的過(guò)程中限定了彎折的斜率，因此好多格點(diǎn)實(shí)際上是達(dá)不到的，如圖6所示。因此菱形之外的格點(diǎn)對(duì)應(yīng)的幀匹配距離是不需要計(jì)算的。在本系統(tǒng)的應(yīng)用中，因?yàn)槊看味家? s和2 s的語(yǔ)音數(shù)據(jù)進(jìn)行匹配，M和N都固定是64幀，所以可以建一個(gè)表格儲(chǔ)存菱形區(qū)域內(nèi)的測(cè)試幀號(hào)和參考幀號(hào)，匹配時(shí)只計(jì)算表格中兩幀間的矢量距離，即歐氏距離，從而把歐氏距離的運(yùn)算從40 960次減少到了19 460次。

　　在采用DTW快速算法后，還需進(jìn)行了19 460次歐氏距離的運(yùn)算。測(cè)試可得，每次運(yùn)算耗時(shí)1 524個(gè)指令周期，所以這部分的運(yùn)算仍是影響識(shí)別速度的關(guān)鍵。為了進(jìn)一步提高代碼的性能，把這段代碼改為線性匯編來(lái)實(shí)現(xiàn)。

　　完成上述全部?jī)?yōu)化后，測(cè)試得到，處理一幀的時(shí)間為1 849 365個(gè)指令周期，其中TMS320C6713工作在200 MHz，即處理1幀的時(shí)間為1 849 365／200 000 000=9.25 ms，達(dá)到0.29倍實(shí)時(shí)。

4 實(shí)驗(yàn)及小結(jié)

　　為了測(cè)試上述系統(tǒng)的識(shí)別性能，對(duì)其進(jìn)行了固定文本的說(shuō)話人辨識(shí)實(shí)驗(yàn)。實(shí)驗(yàn)中，采用錄音設(shè)備錄制了10個(gè)人、3個(gè)不同時(shí)間所說(shuō)的同一句話，共30句，平均時(shí)間長(zhǎng)度為4.5 ms。從每個(gè)人的3句話中選擇頻譜最清晰的一句訓(xùn)練成模板，另外錄制20句由這10個(gè)人所說(shuō)的長(zhǎng)度接近但內(nèi)容不同的語(yǔ)音做測(cè)試語(yǔ)音。這樣模板庫(kù)中有10個(gè)模板，測(cè)試語(yǔ)音有50個(gè)。

　　首先通過(guò)各模板間的匹配，確定了判決門限0.2，然后把50句測(cè)試語(yǔ)音依次送入識(shí)別系統(tǒng)，所有語(yǔ)音全部正確匹配。

　　本文通過(guò)對(duì)DTW算法的改進(jìn)，結(jié)合TMS320C6713的特點(diǎn)對(duì)C代碼進(jìn)行了優(yōu)化，在保證識(shí)別率的情況下，用TMS320C6713成功地實(shí)現(xiàn)了語(yǔ)音信號(hào)的高速實(shí)時(shí)識(shí)別。

閱讀全文

上一頁(yè)1 2全文

本文導(dǎo)航

第 1 頁(yè)：基于DSP的高速實(shí)時(shí)語(yǔ)音識(shí)別系統(tǒng)的設(shè)計(jì)
第 2 頁(yè)：系統(tǒng)硬件環(huán)境

dsp(343840) dsp(343840)
tms320c6713(13338) tms320c6713(13338)

評(píng)論

相關(guān)推薦

基于DSP的語(yǔ)音識(shí)別系統(tǒng)的實(shí)現(xiàn)及分析

隨著DSP技術(shù)的快速發(fā)展及性能不斷完善，基于DSP的語(yǔ)音識(shí)別算法得到了實(shí)現(xiàn)，并且在費(fèi)用、功耗、速度、精確度和體積等方面有著PC機(jī)所不具備的優(yōu)勢(shì)，具有廣闊的應(yīng)用前景。

2013-04-27 11:14:43

9239

一種基于DSP的漢字語(yǔ)音識(shí)別系統(tǒng)設(shè)計(jì)

本漢語(yǔ)語(yǔ)音識(shí)別系統(tǒng)是一個(gè)非特定人的、孤立音語(yǔ)音識(shí)別系統(tǒng)。其中孤立音至少包括漢語(yǔ)的400多個(gè)調(diào)音節(jié)（不考慮聲調(diào)）以及一些常用的詞組。##測(cè)度估計(jì)技術(shù)可以采用動(dòng)態(tài)時(shí)間彎折DTW、隱馬爾可夫模型HMM

2014-12-16 13:44:37

3123

實(shí)時(shí)語(yǔ)音識(shí)別系統(tǒng)在家庭監(jiān)護(hù)機(jī)器人的實(shí)現(xiàn)

文中闡述的是家庭監(jiān)護(hù)機(jī)器人項(xiàng)目中語(yǔ)音識(shí)別系統(tǒng)設(shè)計(jì)的部分，通過(guò)DSP、DMA和ARM Cortex-A8的并行處理，利用雙緩沖的方法，在嵌入式Linux上實(shí)現(xiàn)了基于ATK的實(shí)時(shí)語(yǔ)音識(shí)別系統(tǒng)

2014-12-16 14:14:43

2752

語(yǔ)音識(shí)別技術(shù)原理及實(shí)用系統(tǒng)設(shè)計(jì)匯總

監(jiān)護(hù)機(jī)器人項(xiàng)目中語(yǔ)音識(shí)別系統(tǒng)設(shè)計(jì)的部分，通過(guò)DSP、 DMA和ARM Cortex-A8的并行處理，利用雙緩沖的方法，在嵌入式Linux上實(shí)現(xiàn)了基于ATK的實(shí)時(shí)語(yǔ)音識(shí)別系統(tǒng)。##本文

2014-12-19 13:50:54

17721

智能家庭應(yīng)用之語(yǔ)音識(shí)別系統(tǒng)

開(kāi)發(fā)基于自然語(yǔ)言的語(yǔ)音識(shí)別系統(tǒng)面臨許多技術(shù)挑戰(zhàn)，包括使用精確的語(yǔ)音識(shí)別引擎將機(jī)器聽(tīng)到的內(nèi)容翻譯成文字—以及一個(gè)綜合的自然語(yǔ)言處理器

2015-10-20 09:31:10

3998

1小時(shí)玩轉(zhuǎn)AI語(yǔ)音識(shí)別

`報(bào)名鏈接：http://t.elecfans.com/live/563.html直播主題及亮點(diǎn)本次直播講解AI語(yǔ)音識(shí)別核心技術(shù)知識(shí)以及語(yǔ)音識(shí)別系統(tǒng)架構(gòu)，現(xiàn)場(chǎng)實(shí)操寫代碼實(shí)現(xiàn)語(yǔ)音采集、語(yǔ)音傳輸與解析

2018-09-19 13:40:42

DSP技術(shù)在射頻識(shí)別系統(tǒng)開(kāi)發(fā)應(yīng)用應(yīng)注意什么？

以TMS320為代表的數(shù)字信號(hào)處理（DSP）芯片自80年代由TI公司推出以來(lái)，已提供了不同系列，各種品種的產(chǎn)品，并獲得了廣泛的應(yīng)用。微波射頻識(shí)別系統(tǒng)研究的起步較早，所以，早期產(chǎn)品沒(méi)有應(yīng)用該技術(shù)

2019-08-21 06:36:58

語(yǔ)音識(shí)別系統(tǒng)在智能家庭系統(tǒng)中的應(yīng)用是什么？

語(yǔ)音識(shí)別系統(tǒng)在智能家庭系統(tǒng)中的應(yīng)用是什么？

2021-05-31 06:54:34

FPGA和Nios_軟核的語(yǔ)音識(shí)別系統(tǒng)的研究

FPGA和Nios_軟核的語(yǔ)音識(shí)別系統(tǒng)的研究引言語(yǔ)音識(shí)別的過(guò)程是一個(gè)模式匹配的過(guò)程在這個(gè)過(guò)程中，首先根據(jù)說(shuō)話人的語(yǔ)音特點(diǎn)建立語(yǔ)音模型，對(duì)輸入的語(yǔ)音信號(hào)進(jìn)行分析，并提取所需的語(yǔ)音特征，在此基礎(chǔ)上建立

2012-08-11 11:47:15

【TL6748 DSP申請(qǐng)】基于DSP的車牌識(shí)別系統(tǒng)

有機(jī)會(huì)玩TMS320F項(xiàng)目描述：用TMS320C6748搭載攝像頭實(shí)現(xiàn)車牌自動(dòng)識(shí)別系統(tǒng)，基于模糊控制，圖像分割、模式識(shí)別等理論，通過(guò)對(duì)采集的數(shù)據(jù)進(jìn)行分析掃描，自動(dòng)補(bǔ)全不全或污損的車牌號(hào)碼，并對(duì)車輛進(jìn)出進(jìn)行記錄，數(shù)據(jù)備份到上位機(jī)，適于停車場(chǎng)，

2015-09-09 16:59:47

主動(dòng)式射頻識(shí)別系統(tǒng)的設(shè)計(jì)和實(shí)現(xiàn)

通信距離遠(yuǎn)、可靠性強(qiáng)、通信速率高等優(yōu)點(diǎn)適用于軍事、物流、交通、物品實(shí)時(shí)跟蹤定位等領(lǐng)域[1]。過(guò)去由于主動(dòng)式射頻識(shí)別系統(tǒng)的應(yīng)答器體積和功耗較大、電池壽命有限等因素，嚴(yán)重限制了主動(dòng)式RFID 系統(tǒng)

2019-05-29 07:41:40

使用緊急呼叫和DSP的語(yǔ)音識(shí)別系統(tǒng)

開(kāi)發(fā)并測(cè)試了安裝在汽車內(nèi)、使用簡(jiǎn)單離散字的特定發(fā)音人語(yǔ)音識(shí)別系統(tǒng)。

2019-11-04 07:23:41

分享一款不錯(cuò)的基于DSP的虹膜識(shí)別系統(tǒng)

本文提出了基于TMS320DM642 DSP的虹膜識(shí)別系統(tǒng)，給出了系統(tǒng)硬件和軟件的實(shí)現(xiàn)方案。

2021-04-20 06:14:51

基于DSP的漢字語(yǔ)音識(shí)別系統(tǒng)如何實(shí)現(xiàn)

基于DSP的漢字語(yǔ)音識(shí)別系統(tǒng)如何實(shí)現(xiàn)

2021-03-12 06:33:15

基于ATMEGAl28的語(yǔ)音識(shí)別系統(tǒng)設(shè)計(jì)

量大，一般在計(jì)算機(jī)上實(shí)現(xiàn)，即使是嵌入式方面，多數(shù)方案也需要運(yùn)算能力強(qiáng)的ARM或DSP，并且外擴(kuò)RAM、FLASH等資源，增加了硬件成本，這些特點(diǎn)無(wú)疑限制了語(yǔ)音識(shí)別技術(shù)的應(yīng)用，尤其是嵌入式領(lǐng)域。本系統(tǒng)

2014-03-17 13:31:40

基于AVR單片機(jī)的語(yǔ)音識(shí)別系統(tǒng)設(shè)計(jì)

　　基于AVR單片機(jī)的語(yǔ)音識(shí)別系統(tǒng)設(shè)計(jì)，系統(tǒng)以AVR單片機(jī)為控制核心，實(shí)現(xiàn)對(duì)人的語(yǔ)音的識(shí)別控制。系統(tǒng)采用的主控芯片為Atreel公司的ATMEGAl28，語(yǔ)音識(shí)別功能采用ICR oute公司的單芯片

2021-01-13 15:54:14

基于CMOS攝像頭的高速路車道識(shí)別系統(tǒng)如何實(shí)現(xiàn)？

基于CMOS攝像頭的高速路車道識(shí)別系統(tǒng)如何實(shí)現(xiàn)？

2012-07-01 15:25:27

基于HMM的語(yǔ)音識(shí)別系統(tǒng)是怎么訓(xùn)練的

基于HMM的語(yǔ)音識(shí)別系統(tǒng)是怎么訓(xùn)練的？有哪些步驟？

2021-12-23 06:16:50

基于LabVIEW的語(yǔ)音識(shí)別系統(tǒng)

基于LabVIEW的語(yǔ)音識(shí)別系統(tǒng)

2020-03-07 16:41:15

基于LabVIEW的語(yǔ)音識(shí)別系統(tǒng)

請(qǐng)大家?guī)蛶兔?，基于LabVIEW的語(yǔ)音識(shí)別系統(tǒng)，要求先錄幾個(gè)人的聲音做樣板，然后再讓其中一個(gè)人說(shuō)話，能辨別出是誰(shuí)說(shuō)的

2013-05-16 11:16:15

基于STM32嵌入式的孤立詞語(yǔ)音識(shí)別系統(tǒng)設(shè)計(jì)

語(yǔ)音識(shí)別是機(jī)器通過(guò)識(shí)別和理解過(guò)程把人類的語(yǔ)音信號(hào)轉(zhuǎn)變?yōu)橄鄳?yīng)文本或命令的技術(shù)，其根本目的是研究出一種具有聽(tīng)覺(jué)功能的機(jī)器。本設(shè)計(jì)研究孤立詞語(yǔ)音識(shí)別系統(tǒng)及其在STM32嵌入式平臺(tái)上的實(shí)現(xiàn)。識(shí)別流程是：預(yù)

2021-08-06 08:32:00

基于labview的語(yǔ)音識(shí)別

處理過(guò)程基本上是一致的。目前主流的語(yǔ)音識(shí)別技術(shù)是基于統(tǒng)計(jì)模式識(shí)別的基本理論。一個(gè)完整的語(yǔ)音識(shí)別系統(tǒng)可大致分為三部分：（1）語(yǔ)音特征提?。浩淠康氖菑?b class="flag-6" style="color: red">語(yǔ)音波形中提取出隨時(shí)間變化的語(yǔ)音特征序列。（2）聲學(xué)模型

2019-03-10 22:00:15

如何去實(shí)現(xiàn)一種特定人語(yǔ)音識(shí)別系統(tǒng)？

特定人語(yǔ)音識(shí)別的方法有哪些？特定人語(yǔ)音識(shí)別系統(tǒng)是由哪些部分組成的？如何去實(shí)現(xiàn)一種特定人語(yǔ)音識(shí)別系統(tǒng)？

2021-05-19 06:44:14

嵌入式語(yǔ)音識(shí)別系統(tǒng)中的電路設(shè)計(jì)是如何的

現(xiàn)在社會(huì)發(fā)展的這么快，什么高科技都涌現(xiàn)出來(lái)，什么智能機(jī)器人啦，智能手機(jī)等，有很多在這里就不一一列舉了，在這里我們要說(shuō)的就是語(yǔ)音識(shí)別系統(tǒng)了，現(xiàn)在嵌入式產(chǎn)品如此的多，就像一些智能空調(diào)啦，我們可以對(duì)著他說(shuō)

2021-12-20 07:52:03

嵌入式語(yǔ)音識(shí)別系統(tǒng)在生活中的應(yīng)用有哪些呢

嵌入式語(yǔ)音識(shí)別系統(tǒng)是什么？嵌入式語(yǔ)音識(shí)別系統(tǒng)在生活中的應(yīng)用有哪些呢？

2021-12-23 08:27:03

微軟語(yǔ)音識(shí)別系統(tǒng)錯(cuò)誤率僅為5.1%，達(dá)成新的精準(zhǔn)里程碑！

　　導(dǎo)讀：微軟今天宣布，其會(huì)話語(yǔ)音識(shí)別系統(tǒng)的誤率達(dá)到了5.1%，是目前為止最低的。 [img][/img] 　　這一數(shù)據(jù)超過(guò)了微軟人工智能和研究團(tuán)隊(duì)去年5.9%的誤差率，并將其準(zhǔn)確性與專業(yè)的人

2017-08-23 09:18:35

怎么實(shí)現(xiàn)基于MATLAB的車牌識(shí)別系統(tǒng)的設(shè)計(jì)？

一個(gè)完整的牌照識(shí)別系統(tǒng)包括哪些單元？怎么實(shí)現(xiàn)基于MATLAB的車牌識(shí)別系統(tǒng)的設(shè)計(jì)？

2021-05-12 07:04:46

怎么設(shè)計(jì)基于嵌入式系統(tǒng)的語(yǔ)音口令識(shí)別系統(tǒng)？

隨著計(jì)算機(jī)技術(shù)和信息技術(shù)的迅速發(fā)展，語(yǔ)音口令識(shí)別已經(jīng)成為了人機(jī)交互的一個(gè)重要方式之一。語(yǔ)音口令識(shí)別系統(tǒng)將根據(jù)人發(fā)出的聲音、音節(jié)或短語(yǔ)給出響應(yīng)，如通過(guò)語(yǔ)音口令控制一些執(zhí)行機(jī)構(gòu)、控制家用電器的運(yùn)行或做出

2019-09-03 08:27:23

怎樣去搭建一個(gè)基于kaldi的在線語(yǔ)音識(shí)別系統(tǒng)

(GMM+HMM+NGRAM)概述）。一段時(shí)間后老板就布置了具體任務(wù)：在我們公司自己的ARM芯片上基于kaldi搭建一個(gè)在線語(yǔ)音識(shí)別系統(tǒng)，三個(gè)人花三個(gè)月左右的時(shí)間完成。由于我們都是語(yǔ)音識(shí)別領(lǐng)域的小白，要求...

2021-07-29 08:59:19

怎樣去搭建一個(gè)基于kaldi的嵌入式語(yǔ)音識(shí)別系統(tǒng)呢

怎樣去搭建一個(gè)基于kaldi的嵌入式語(yǔ)音識(shí)別系統(tǒng)呢？

2021-12-23 09:30:05

怎樣去搭建一個(gè)基于kaldi的嵌入式在線語(yǔ)音識(shí)別系統(tǒng)

怎樣去搭建一個(gè)基于kaldi的嵌入式在線語(yǔ)音識(shí)別系統(tǒng)？分為哪幾個(gè)階段呢？

2021-10-28 08:37:01

怎樣去搭建一種基于嵌入式平臺(tái)的在線語(yǔ)音識(shí)別系統(tǒng)呢

怎樣去搭建一種基于嵌入式平臺(tái)的在線語(yǔ)音識(shí)別系統(tǒng)呢？有哪些階段？

2021-12-23 06:51:31

怎樣去設(shè)計(jì)一種基于LD3320芯片的嵌入式語(yǔ)音識(shí)別系統(tǒng)呢

LD3320語(yǔ)音識(shí)別芯片的工作原理是什么？LD3320語(yǔ)音識(shí)別芯片有何應(yīng)用？怎樣去設(shè)計(jì)一種基于LD3320芯片的嵌入式語(yǔ)音識(shí)別系統(tǒng)呢？

2021-12-23 09:50:11

怎樣去設(shè)計(jì)基于LD3320的嵌入式語(yǔ)音識(shí)別系統(tǒng)

摘要：語(yǔ)音交互系統(tǒng)是比較人性化的人機(jī)操作界面，它需要語(yǔ)音識(shí)別系統(tǒng)的支持。LD3320就是這樣一款語(yǔ)音識(shí)別芯片。介紹了該芯片的工作原理及應(yīng)用，給出了LD3320與微處理器的硬件接口電路及軟件程序。隨著

2021-07-21 09:31:27

怎樣去設(shè)計(jì)基于嵌入式Linux的語(yǔ)音識(shí)別系統(tǒng)

該設(shè)計(jì)運(yùn)用三星公司的S3C2440，結(jié)合ICRoute公司的高性能語(yǔ)音識(shí)別芯片LD3320，進(jìn)行了語(yǔ)音識(shí)別系統(tǒng)的硬件和軟件設(shè)計(jì)。在嵌入式Linux操作系統(tǒng)下，運(yùn)用多進(jìn)程機(jī)制完成了對(duì)語(yǔ)音識(shí)別芯片

2021-11-04 09:03:09

怎樣去設(shè)計(jì)并制作出基于STM32的孤立詞語(yǔ)音識(shí)別系統(tǒng)呢

語(yǔ)音識(shí)別是什么？怎樣去設(shè)計(jì)并制作出基于STM32的孤立詞語(yǔ)音識(shí)別系統(tǒng)呢？

2021-11-08 07:04:19

求一種基于TMS320VC5402的嵌入式音樂(lè)語(yǔ)音識(shí)別系統(tǒng)設(shè)計(jì)方案

音樂(lè)語(yǔ)音識(shí)別系統(tǒng)的硬件電路該如何去設(shè)計(jì)？音樂(lè)語(yǔ)音識(shí)別系統(tǒng)的軟件該如何去實(shí)現(xiàn)？

2021-12-23 08:50:56

瘋殼AI語(yǔ)音及人臉識(shí)別系統(tǒng)開(kāi)發(fā)文檔教程pdf

瘋殼AI語(yǔ)音及人臉識(shí)別系統(tǒng)開(kāi)發(fā)文檔教程pdf

2019-02-25 19:56:19

轉(zhuǎn)：基于Arduino的智能家居語(yǔ)音識(shí)別系統(tǒng)設(shè)計(jì)

構(gòu)架的 Arduino 開(kāi)發(fā)板 Intel Galileo開(kāi)源資料）。接下來(lái)介紹的是基于Arduino的智能家居語(yǔ)音識(shí)別系統(tǒng)設(shè)計(jì)。設(shè)計(jì)思路起源：晚上回到家，家里黑漆漆一片，得找到開(kāi)燈的按鈕才算完事

2016-07-29 09:58:06

基于SPCE061A的語(yǔ)音識(shí)別系統(tǒng)的設(shè)計(jì)

系統(tǒng)采用凌陽(yáng)SPCE061A 單片機(jī)作為語(yǔ)音識(shí)別系統(tǒng)的主控芯片。通過(guò)硬件電路設(shè)計(jì)和軟件代碼部分成功的設(shè)計(jì)并實(shí)現(xiàn)了一種具有語(yǔ)音識(shí)別功能、語(yǔ)音提示(語(yǔ)音合成)及語(yǔ)音回放(語(yǔ)音編

2009-05-26 10:54:08

基于ARM的語(yǔ)音識(shí)別系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)

語(yǔ)音識(shí)別技術(shù)是語(yǔ)音處理領(lǐng)域的一個(gè)關(guān)鍵技術(shù)。在研究了語(yǔ)音識(shí)別技術(shù)原理的基礎(chǔ)上，本文提出了一種基于ARM 處理器的孤立詞語(yǔ)音識(shí)別系統(tǒng)的設(shè)計(jì)方案，包括系統(tǒng)硬件設(shè)計(jì)、軟件

2009-09-03 10:52:49

基于DSP的虹膜識(shí)別系統(tǒng)設(shè)計(jì)

本文設(shè)計(jì)了一種用于身份鑒別的虹膜識(shí)別系統(tǒng)。它以TI 的TMS320DM642 DSP 為中央處理器，配合以A/D 轉(zhuǎn)換器和存儲(chǔ)器等，完成虹膜圖像的采集、處理和存儲(chǔ)。主程序運(yùn)行在DSP 中，完

2009-09-08 10:28:04

基于DSP的孤立詞語(yǔ)音識(shí)別系統(tǒng)的設(shè)計(jì)

本文提出了基于TMS320VC5402的語(yǔ)音識(shí)別系統(tǒng)方案。整個(gè)系統(tǒng)以TMS320VC5402為核心電路進(jìn)行設(shè)計(jì)，由TLC320AD50C進(jìn)行A/D轉(zhuǎn)換，由TMS320VC5402識(shí)別語(yǔ)音信號(hào)，然后和機(jī)器人通信，并由AT89S52控制 LCD

2010-07-27 17:36:56

基于USB與DSP的指紋識(shí)別系統(tǒng)的設(shè)計(jì)實(shí)現(xiàn)

摘要：介紹一種以高速的DSP芯片TMS320VC5402為平臺(tái)對(duì)指紋圖像進(jìn)行實(shí)時(shí)處理的指紋識(shí)別系統(tǒng)，用USB接口芯片與主機(jī)進(jìn)行通信。介紹了系統(tǒng)的硬件、固件、設(shè)備驅(qū)動(dòng)程序和

2006-03-11 17:39:59

775

孤立詞語(yǔ)音識(shí)別系統(tǒng)的DSP實(shí)現(xiàn)

孤立詞語(yǔ)音識(shí)別系統(tǒng)的DSP實(shí)現(xiàn) 0 引言在孤立詞語(yǔ)音識(shí)別中，最為簡(jiǎn)單有效的方法是采用動(dòng)態(tài)時(shí)間規(guī)整(Dynamic Time Warping，DTW)算法，該算法解決了發(fā)音長(zhǎng)

2009-11-10 09:25:37

934

DSP嵌入式說(shuō)話人識(shí)別系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)

DSP嵌入式說(shuō)話人識(shí)別系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn) 0 引言說(shuō)話人身份識(shí)別屬于生物認(rèn)證技術(shù)的一種，是一項(xiàng)根據(jù)語(yǔ)音中反映說(shuō)話人生理和行為特征的語(yǔ)音參數(shù)來(lái)

2009-12-28 17:55:54

581

DSP嵌入式說(shuō)話人識(shí)別系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)

DSP嵌入式說(shuō)話人識(shí)別系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn) 　0 引言　　說(shuō)話人身份識(shí)別屬于生物認(rèn)證技術(shù)的一種，是一項(xiàng)根據(jù)語(yǔ)音中反映說(shuō)話人生理和行為特征的語(yǔ)音參數(shù)來(lái)自動(dòng)

2010-01-06 14:07:54

539

劃片機(jī)視覺(jué)識(shí)別系統(tǒng)設(shè)計(jì)原理分析

劃片機(jī)視覺(jué)識(shí)別系統(tǒng)設(shè)計(jì)原理分析 1 視覺(jué)識(shí)別系統(tǒng)構(gòu)成劃片機(jī)的視覺(jué)識(shí)別系統(tǒng)是以計(jì)算機(jī)為主的實(shí)時(shí)圖像處理系統(tǒng)。如圖1所示：

2010-04-21 09:20:54

2838

DSP在焊縫識(shí)別系統(tǒng)中的應(yīng)用

摘要：一種基于DSP的視覺(jué)焊縫識(shí)別系統(tǒng).采用ADSP21160實(shí)現(xiàn)了焊接圖像焊縫識(shí)別算法,滿足了信號(hào)實(shí)時(shí)處理的要求. 關(guān)鍵詞:焊縫識(shí)別系統(tǒng); ADSP2116; 焊縫識(shí)別算法;仿真運(yùn)算

2011-03-01 01:09:52

基于HMM的連續(xù)小詞量語(yǔ)音識(shí)別系統(tǒng)

采用ARMS3C2410微處理器作為主控制模塊，采用UDA1314TS音頻處理芯片作為語(yǔ)音識(shí)別模塊，利用HMM聲學(xué)模型及Viterbi算法進(jìn)行模式訓(xùn)練和識(shí)別，設(shè)計(jì)了一種連續(xù)的、小詞量的語(yǔ)音識(shí)別系統(tǒng)

2011-07-12 11:34:58

2900

指紋識(shí)別的DSP實(shí)現(xiàn)方案

本文提出了一種新型基于DSP的指紋識(shí)別系統(tǒng)，硬件上利用DSP的高速處理能力，構(gòu)建高速的數(shù)據(jù)處理平臺(tái)，軟件上參考DSP和硬件邏輯的處理特點(diǎn)，對(duì)傳統(tǒng)的指紋算法進(jìn)行改進(jìn)，滿足實(shí)時(shí)性

2011-08-17 10:57:24

1444

語(yǔ)音識(shí)別系統(tǒng)在家庭監(jiān)護(hù)機(jī)器人的實(shí)現(xiàn)

文中對(duì)該系統(tǒng)的軟硬件進(jìn)行了設(shè)計(jì)。在硬件方面，給出語(yǔ)音識(shí)別系統(tǒng)的硬件組成原理，并提供了關(guān)鍵部分原理圖；在軟件方面，提出實(shí)時(shí)語(yǔ)音識(shí)別的方法，給出應(yīng)用程序?qū)崿F(xiàn)流程。最后

2012-05-09 15:10:23

234

ADSP-BF531在嵌入式語(yǔ)音識(shí)別系統(tǒng)中的應(yīng)用

設(shè)計(jì)了一個(gè)嵌入式語(yǔ)音識(shí)別系統(tǒng)，該系統(tǒng)硬件平臺(tái)以ADSP-BF531為核心，采用離散隱馬爾可夫模型(DHMM)檢測(cè)和識(shí)別算法完成了對(duì)非特定人的孤立詞語(yǔ)音識(shí)別。試驗(yàn)結(jié)果表明，該系統(tǒng)對(duì)非特定

2012-07-12 14:02:32

基于LD3320的嵌入式語(yǔ)音識(shí)別系統(tǒng)設(shè)計(jì)

語(yǔ)音交互系統(tǒng)是比較人性化的人機(jī)操作界面，它需要語(yǔ)音識(shí)別系統(tǒng)的支持。LD3320就是這樣一款語(yǔ)音識(shí)別芯片。介紹了該芯片的工作原理及應(yīng)用，給出了LD3320與微處理器的硬件接口電路及

2012-12-21 12:00:33

27635

基于STM32的語(yǔ)音識(shí)別系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)

基于STM32的語(yǔ)音識(shí)別系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)

2015-11-09 18:03:00

FPGA和Nios_軟核的語(yǔ)音識(shí)別系統(tǒng)的研究

FPGA和Nios_軟核的語(yǔ)音識(shí)別系統(tǒng)的研究。

2016-05-10 10:46:40

基于DSP平臺(tái)的人民幣編號(hào)識(shí)別系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)

基于DSP平臺(tái)的人民幣編號(hào)識(shí)別系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)。

2016-05-10 16:31:07

科大訊飛新一代語(yǔ)音識(shí)別系統(tǒng)解讀

今天，我們就為大家從技術(shù)上揭秘科大訊飛的新一代語(yǔ)音識(shí)別系統(tǒng)。

2016-08-17 14:31:02

3245

LD3320的嵌入式語(yǔ)音識(shí)別系統(tǒng)的應(yīng)用

基于LD3320語(yǔ)音識(shí)別系統(tǒng)的學(xué)習(xí)

2016-12-31 15:06:59

基于語(yǔ)音特征聚類的HMM語(yǔ)音識(shí)別系統(tǒng)研究姚敏鋒

基于語(yǔ)音特征聚類的HMM語(yǔ)音識(shí)別系統(tǒng)研究_姚敏鋒

2017-03-15 08:00:00

基于Cortex_DSP的指紋識(shí)別系統(tǒng)設(shè)計(jì)與實(shí)現(xiàn)

基于Cortex_DSP的指紋識(shí)別系統(tǒng)設(shè)計(jì)與實(shí)現(xiàn)

2017-09-28 08:55:04

語(yǔ)音識(shí)別系統(tǒng)硬軟件方案分析

2017-10-15 10:53:42

基于DSP虹膜識(shí)別系統(tǒng)中Flash燒寫方法的研究

基于DSP虹膜識(shí)別系統(tǒng)中Flash燒寫方法的研究

2017-10-19 14:41:26

DSP在射頻識(shí)別系統(tǒng)中的應(yīng)用分析詳解

引言以TMS320為代表的數(shù)字信號(hào)處理（DSP）芯片自80年代由TI公司推出以來(lái)，已提供了不同系列，各種品種的產(chǎn)品，并獲得了廣泛的應(yīng)用。微波射頻識(shí)別系統(tǒng)研究的起步較早，所以，早期產(chǎn)品沒(méi)有

2017-10-20 10:02:06

ATK實(shí)時(shí)語(yǔ)音識(shí)別系統(tǒng)在監(jiān)護(hù)機(jī)器人中的應(yīng)用分析

多媒體時(shí)代的來(lái)臨，迫切要求語(yǔ)音識(shí)別系統(tǒng)從實(shí)驗(yàn)室走向?qū)嵱?。許多發(fā)達(dá)國(guó)家如美國(guó)、日本、韓國(guó)以及IBM、Apple、ATT、NTT等著名公司都為語(yǔ)音識(shí)別系統(tǒng)的實(shí)用化開(kāi)發(fā)研究投以巨資。IBM公司于1997年開(kāi)發(fā)出漢語(yǔ)ViaVoice語(yǔ)音識(shí)別系統(tǒng)，次年又開(kāi)發(fā)出

2017-10-24 10:35:08

基于嵌入式系統(tǒng)的語(yǔ)音口令識(shí)別系統(tǒng)的實(shí)現(xiàn)

引言隨著計(jì)算機(jī)技術(shù)和信息技術(shù)的迅速發(fā)展，語(yǔ)音口令識(shí)別已經(jīng)成為了人機(jī)交互的一個(gè)重要方式之一。語(yǔ)音口令識(shí)別系統(tǒng)將根據(jù)人發(fā)出的聲音、音節(jié)或短語(yǔ)給出響應(yīng)，如通過(guò)語(yǔ)音口令控制一些執(zhí)行機(jī)構(gòu)、控制家用電器的運(yùn)行

2017-12-02 09:09:01

706

以DSP為核心的紙幣識(shí)別系統(tǒng)設(shè)計(jì)

。國(guó)產(chǎn)紙幣清分機(jī)很少,而且功能都很有限,很難滿足高速實(shí)時(shí)性的要求,尤其是能夠用圖像處理的方法來(lái)識(shí)別紙幣的紙幣清分機(jī)還剛剛起步。為此，設(shè)計(jì)了一種紙幣識(shí)別系統(tǒng)。該系統(tǒng)以DSP為核心處理器,結(jié)合圖像

2018-03-22 10:54:01

1740

Python語(yǔ)音識(shí)別系統(tǒng)的優(yōu)勢(shì)和安裝使用手冊(cè)

語(yǔ)音識(shí)別源于 20 世紀(jì) 50 年代早期在貝爾實(shí)驗(yàn)室所做的研究。早期語(yǔ)音識(shí)別系統(tǒng)僅能識(shí)別單個(gè)講話者以及只有約十幾個(gè)單詞的詞匯量?，F(xiàn)代語(yǔ)音識(shí)別系統(tǒng)已經(jīng)取得了很大進(jìn)步，可以識(shí)別多個(gè)講話者，并且擁有識(shí)別

2018-04-25 17:43:30

5072

一種基于嵌入式系統(tǒng)的語(yǔ)音口令識(shí)別系統(tǒng)的設(shè)計(jì)

2019-04-23 15:52:53

863

嵌入式語(yǔ)音識(shí)別系統(tǒng)是什么

嵌入式語(yǔ)音識(shí)別系統(tǒng)分為封閉域識(shí)別和開(kāi)放域識(shí)別，封閉域識(shí)別范圍圍繞指定的字/詞語(yǔ)集合，也就是說(shuō)在開(kāi)發(fā)系統(tǒng)的時(shí)候會(huì)設(shè)定好應(yīng)識(shí)別的字或詞語(yǔ)，對(duì)范圍外的詞語(yǔ)語(yǔ)音系統(tǒng)不會(huì)識(shí)別。

2019-06-12 11:38:09

2859

語(yǔ)音識(shí)別系統(tǒng)功能_語(yǔ)音識(shí)別系統(tǒng)的應(yīng)用

對(duì)比語(yǔ)音識(shí)別技術(shù)的兩個(gè)發(fā)展方向，由于基于不同的運(yùn)算平臺(tái)，因此具有不同的特點(diǎn)。大詞匯量連續(xù)語(yǔ)音識(shí)別系統(tǒng)一般都是基于PC機(jī)平臺(tái)，而語(yǔ)音識(shí)別專用芯片的中心運(yùn)算處理器則只是一片低功耗、低價(jià)位的智能芯片

2019-10-01 09:21:00

5253

醫(yī)療智能語(yǔ)音識(shí)別系統(tǒng)的研發(fā)與應(yīng)用

結(jié)合語(yǔ)音識(shí)別技術(shù)構(gòu)建醫(yī)療智能語(yǔ)音識(shí)別系統(tǒng)，達(dá)到減輕醫(yī)護(hù)人員日常工作負(fù)擔(dān)，減少重復(fù)性勞動(dòng)，提高診療質(zhì)量的目的。基于語(yǔ)音識(shí)別的關(guān)鍵技術(shù)和海量的醫(yī)療數(shù)據(jù)，開(kāi)發(fā)電子病歷與檢查報(bào)告智能語(yǔ)音錄入、移動(dòng)護(hù)理智能語(yǔ)音錄入、非接觸式智能語(yǔ)音數(shù)據(jù)交互系統(tǒng)。

2019-10-21 16:46:27

3262

語(yǔ)音識(shí)別設(shè)置能刪除嗎_語(yǔ)音識(shí)別系統(tǒng)工作流程

本文首先介紹了語(yǔ)音識(shí)別設(shè)置的刪除，其次闡述了語(yǔ)音識(shí)別系統(tǒng)工作流程，最后介紹了語(yǔ)音識(shí)別系統(tǒng)的實(shí)現(xiàn)。

2020-04-01 09:47:40

3749

基于JuliUS語(yǔ)音識(shí)別引擎實(shí)現(xiàn)機(jī)器人孤立詞語(yǔ)音識(shí)別系統(tǒng)的設(shè)計(jì)

語(yǔ)音識(shí)別系統(tǒng)是一種模式識(shí)別系統(tǒng)，系統(tǒng)首先對(duì)語(yǔ)音信號(hào)進(jìn)行分析，得到語(yǔ)音的特征參數(shù)，然后對(duì)這些參數(shù)進(jìn)行處理，形成標(biāo)準(zhǔn)的模板。這個(gè)過(guò)程稱為訓(xùn)練或?qū)W習(xí)。當(dāng)有測(cè)試語(yǔ)音進(jìn)入系統(tǒng)時(shí)，系統(tǒng)將對(duì)這些語(yǔ)音信號(hào)進(jìn)行處理，然后進(jìn)行參考模板的匹配，得出結(jié)果。此時(shí)便完成了語(yǔ)音識(shí)別的過(guò)程。

2020-04-06 17:13:00

1524

已全部加載完成

搜索歷史

基于DSP的高速實(shí)時(shí)語(yǔ)音識(shí)別系統(tǒng)的設(shè)計(jì) - 全文

本文導(dǎo)航

評(píng)論