手機(jī)語音識別應(yīng)用中DSP的選擇

　　隨著DSP技術(shù)的進(jìn)步，計算能力更強(qiáng)、功耗更低和體積更小的DSP已經(jīng)出現(xiàn)，使3G手機(jī)上植入更更復(fù)雜的自動語音識別（ASR）功能成為可能。目前，基本ASR應(yīng)用可以分成三大類：1. 語音-文本轉(zhuǎn)換（語音輸入）；2. 講者識別；3. 語音命令控制（語音控制）。

　　這三類功能包含了3G所需的眾多ASR性能。語音-文本轉(zhuǎn)換的典型實(shí)例是語音撥號和電子郵件聽寫。講者識別功能可以通過語音識別安全地讀出存儲器中的個人數(shù)據(jù)，從而滿足*定購和銀行服務(wù)等保密性高的應(yīng)用需要。語音命令控制功能包括連接語音擴(kuò)展標(biāo)記語言（VXML）網(wǎng)站內(nèi)容的語音接口，它支持財經(jīng)服務(wù)與目錄助理等業(yè)務(wù)。目前VXML被用于規(guī)范網(wǎng)站內(nèi)容的語音標(biāo)簽。

　　語音識別的兩種方法

　　3G手機(jī)的ASR應(yīng)用設(shè)計可分為兩類，即以終端為中心和以客戶/服務(wù)器為中心的應(yīng)用。如圖1所示為以終端為中心的設(shè)計方法，3G手機(jī)（終端）執(zhí)行整個語音識別過程并送出識別結(jié)果。在圖2所示的客戶/服務(wù)器方法中，終端只是執(zhí)行預(yù)處理特征提取，然后通過一個誤碼受保護(hù)的數(shù)據(jù)信道將這些參數(shù)發(fā)送給中心服務(wù)器，中心服務(wù)器終完成語音識別。如果采用以客戶/服務(wù)器為中心的設(shè)計方法，3G手機(jī)應(yīng)使用數(shù)據(jù)信道而非移動信道來將語音發(fā)送給服務(wù)器進(jìn)行識別，因?yàn)橐苿有诺浪玫牡退俾收Z音編碼會嚴(yán)重影響語音識別的性能。

　　各種ASR系統(tǒng)的差異主要體現(xiàn)在詞匯量上。一個簡單的網(wǎng)絡(luò)設(shè)備可能只需要16字的詞庫就能實(shí)現(xiàn)所要求的語音識別功能，而3G移動手機(jī)則需要更大的詞庫。這些詞匯可以跟講者相關(guān)（訓(xùn)練語音識別設(shè)備使之熟悉用戶的聲音特征）或跟講者無關(guān)（語音識別設(shè)備可以識別任何人的聲音），DSP的計算負(fù)荷就隨著詞匯量和訓(xùn)練數(shù)據(jù)的增加而增大。

　　例如，根據(jù)隱性馬爾可夫模型（HMM）可以分析一個典型的跟講者無關(guān)的100條命令識別的應(yīng)用實(shí)例。假設(shè)HMM模型從左到右沒有跳躍地順序擺放，共有6個狀態(tài)、5個具有對角協(xié)方差的混合高斯分布，包含39個特征（13嘜-頻率對數(shù)系數(shù)或MFCC，及其一階和二階差分），具有16位，那么，HMM聲學(xué)模型的大小就是100×5×5×（39+2）×2=240kB。

　　為了實(shí)現(xiàn)輸入語音樣本差分、窗口截獲、MFCC抽取、概率計算和維特比搜索等運(yùn)算的實(shí)時性，典型情況下需要消耗DSP的1千萬個乘法-累加周期（MMAC）。對于連續(xù)語音識別來說，上千個三音素模型和多種語法模型需要更多的存儲空間，也需要更快的DSP處理速度。

　　因此，移動電話中ASR系統(tǒng)的成敗很大程度上取決于DSP的功能和設(shè)計。第三代系統(tǒng)本身就需要比第二代系統(tǒng)更強(qiáng)性能的DSP，而增加ASR功能就對DSP提出了更高的要求。從結(jié)構(gòu)角度看，對DSP性能的要求是處理速度快、功耗低和代碼密度高。

　　采用高速DSP是關(guān)鍵

　　由于系統(tǒng)要實(shí)時對語音進(jìn)行處理和取樣，因此語音識別系統(tǒng)需要具有巨大的計算能力。下面的數(shù)字和計算假設(shè)采用的是圍繞終端的設(shè)計方法。如果將DSP計算資源的20%分配給一個10MMAC的語音識別系統(tǒng)使用，那么就需要一個具有50MMAC的DSP才能滿足這一功能需要，并可提供足夠的空間執(zhí)行3G手機(jī)所需的其它DSP任務(wù)，如處理軟貓。如果采用較慢的DSP，如25MMAC的DSP，那么詞匯表中的命令數(shù)量就要減半，或減少HMM參數(shù)，這樣會降低整個系統(tǒng)性能。

　　DSP的速度決定了語音識別系統(tǒng)的復(fù)雜性和性能。舉例來說，如果一個基本的跟講者無關(guān)的連續(xù)語音識別系統(tǒng)需要100MMAC，DSP計算資源的50%用于滿足3G手機(jī)的其它DSP任務(wù)的需求，那么DSP的處理速度就需要達(dá)到200MMAC。

　　成本、性能和效率的折衷

　　DSP的速度越快，就越便于利用現(xiàn)代的HMM技術(shù)，如信道匹配和聲域匹配技術(shù)，因此，理論上講，DSP速度越快，ASR系統(tǒng)的性能就越好。然而，并行處理方法在提高ASR系統(tǒng)吞吐量中也扮演著重要角色。例如，一個具有4 ALU（算術(shù)邏輯單元）的200MHz DSP比只有1 ALU但運(yùn)行于400MHz的DSP具有更高的吞吐量。根據(jù)具體應(yīng)用的不同，2到3個單ALU DSP提供的性能與一個具有4 ALU的DSP相仿。相對一個具有4 ALU的DSP處理器方案來說，多個單ALU的DSP會提高手機(jī)的成本，因此對于適銷對路產(chǎn)品要充分權(quán)衡成本與性能之間的折衷。

　　總之，當(dāng)比較一個600MHz的單ALU DSP和一個300MHz但有4 ALU的DSP時，設(shè)計工程師始終應(yīng)把握的終目標(biāo)是高效的運(yùn)算吞吐量，具有多個ALU的DSP也許是的解決方案。

　　性能與功耗

　　性能的DSP采用并行結(jié)構(gòu)來獲得的性能空間。有個的平衡型并行結(jié)構(gòu)StarCore SC140就采用了指令級并行結(jié)構(gòu)，它具有4個并行ALU以及一個稱為變長執(zhí)行集（VLES）的改進(jìn)型甚長指令字模型。VLES的優(yōu)點(diǎn)在于它支持在內(nèi)存中完成高效的指令調(diào)度、執(zhí)行和打包。它能通過一個指令隊列對前端提供反饋，并通過調(diào)度器控制后端，因此除非需要執(zhí)行計算，VLES處理一般不消耗功率。

　　在并行VLES結(jié)構(gòu)中，一些特殊指令需要成組以避免空操作（Nop），由于減少了時鐘周期，處理時間也相應(yīng)減少了。比較而言，在甚長指令字計算中，所有執(zhí)行步驟都必須按順序排列，因此在一個8字節(jié)的執(zhí)行集甚至是1字節(jié)數(shù)據(jù)時，系統(tǒng)就需要7個占位符（placeholder）或Nop。

　　由于VLES結(jié)構(gòu)不需要Nop，VLES設(shè)計中的復(fù)雜性從硬件或編程器轉(zhuǎn)移到了編譯器。由于每個周期都充滿了數(shù)據(jù)，因此每個周期就具有更高的效率，從而也提高了電源與內(nèi)存的使用效率。

　　電源管理

　　由于ASR系統(tǒng)需要連續(xù)處理語音數(shù)據(jù)，會使DSP成為消耗電能的主要部件，因此高效利用電源對設(shè)備成功走向市場至關(guān)重要。

　　在高性能DSP中，選擇16位指令集而非32位指令集能提高代碼密度，進(jìn)一步減少對內(nèi)存、功耗和體積的需求，一部分原因是由于更短的16位指令集可以減少寄存器和數(shù)據(jù)線數(shù)量。例如在ASR應(yīng)用中，存儲的詞匯量可能達(dá)到2.5MB（對于1024簇的三音素狀態(tài)，5個合成和39個參數(shù)來說，聲學(xué)HMM狀態(tài)模型是400KB；一本有1萬個三態(tài)三音素代碼本是60KB；三音素狀態(tài)轉(zhuǎn)移概率矩陣是500KB；一個具有40個雜亂態(tài)2萬字的雙字母組是1.6MB）。如果DSP具有高的代碼密度，能為ASR系統(tǒng)提供固定數(shù)量的存儲器，那么就可以獲得更好更大的聲學(xué)和語言模型。

　　片上和片外存儲器

　　對于ASR系統(tǒng)中使用的DSP來說，有效地利用片上和片外存儲器是另外一個重要的課題。由于ASR系統(tǒng)需要大量的存儲空間用于詞匯與模式識別數(shù)據(jù)的存儲，一個靈活的存儲結(jié)構(gòu)在這里將顯得特別重要。例如，一個具備統(tǒng)一尋址存儲器的DSP能使設(shè)計工程師很好地平衡程序和數(shù)據(jù)，還能平衡系統(tǒng)算法的復(fù)雜性與聲學(xué)和語言模型的大小以獲得化的性能。

　　例如，如果具有100條命令的識別系統(tǒng)模型只有100kB的片上系統(tǒng)內(nèi)存，總共內(nèi)存空間需求是240kB，那么采用二次識別方法能更有效地利用片上快速存儲器。

　　次（原始識別階段）只使用39個參數(shù)中的13個MFCC，因此模型大小為80kB，可以載入片上內(nèi)存。原始識別階段的候選命令數(shù)量要比原來的100個少，比方說是33個命令，但可信度高達(dá)99.9%。

　　第二次（識別階段）把33個候選命令的39個參數(shù)作為模型使用，大小是80kB，因此又可以把該模型裝載入片上內(nèi)存。這種二次識別方法會引入一些延時，但延時非常小，大約只有10ms，說話人一般不會覺察到。

　　統(tǒng)一尋址存儲器能夠支持較大的詞匯庫或命令集，還能支持較大的HMM模型或神經(jīng)網(wǎng)絡(luò)系數(shù)，因此能簡單化實(shí)時任務(wù)。例如為ASR系統(tǒng)的程序和數(shù)據(jù)準(zhǔn)備100kB的存儲器，設(shè)計工程師就能平衡好算法復(fù)雜性與詞匯量或命令集大小之間的關(guān)系。如果程序要占50kB，那么數(shù)據(jù)只能是50kB。如果允許降低識別而將程序代碼壓縮到20kB，那么命令集就能用到80kB，也就是增加了詞匯庫容量。

　　在ASR系統(tǒng)中，高度并行化、高代碼密度和有效利用存儲器等優(yōu)點(diǎn)還能使DSP完成語音識別以外的任務(wù)。在大多數(shù)情況下，設(shè)計工程師可以將部分計算資源分配給語音識別之用，而將剩余資源用來執(zhí)行信道處理系統(tǒng)中所需的其它任務(wù)。

　　在選中化的DSP后，要想獲得高性能的ASR用系統(tǒng)級芯片還需要增加一些功能，例如快速緩存或快速指令/數(shù)據(jù)存取以及實(shí)時操作系統(tǒng)（RTOS）才能使ASR系統(tǒng)真正完成實(shí)時性能。多任務(wù)RTOS能使系統(tǒng)同時運(yùn)行多個應(yīng)用如雙通道語音識別，因此能極大地提高系統(tǒng)性能。

　　復(fù)雜SoC應(yīng)用（如信道處理系統(tǒng)）設(shè)計工程師能從使用高效的語言編譯器的DSP和SoC中獲益，因?yàn)檫@些編譯器允許設(shè)計工程師使用C或C++語言進(jìn)行編程。采用增強(qiáng)的片上仿真和調(diào)試功能還可以進(jìn)一步縮短設(shè)計時間。對于3G移動手機(jī)應(yīng)用中各層次的元器件與系統(tǒng)設(shè)計來說，除了實(shí)時性能和簡化設(shè)計流程外，功率管理控制同樣非常重要。在設(shè)計SoC時，選擇具有可調(diào)功率功能的內(nèi)核將獲益非淺。例如當(dāng)移動用戶在說話時，DSP需要全速運(yùn)行（如300MHz）。當(dāng)未使用ASR功能時，SoC電源管理電路可以逐步降低到較低的時鐘速度（如100MHz），從而有效地降低漏電和功耗。

　　由于ASR系統(tǒng)對計算速度的需求會根據(jù)識別特征的差異產(chǎn)生很大變化，例如孤字識別或連續(xù)語音識別、詞匯量和跟講者無關(guān)的語音識別等，因此，能支持ASR功能的信道處理系統(tǒng)的復(fù)雜性變化也很大。

　　SoC非常適合于構(gòu)造芯片的基礎(chǔ)架構(gòu)，因此在以客戶/服務(wù)器系統(tǒng)為中心的設(shè)計中是非常理想的選擇，但SoC器件由于功能太強(qiáng)大，因此并不非常適合于用戶端以終端為中心的設(shè)計。然而，隨著ASR系統(tǒng)的逐漸成熟以及3G手機(jī)支持越來越復(fù)雜的應(yīng)用和復(fù)雜ASR，這類功能強(qiáng)大的SoC也能成功地運(yùn)用到用戶端。

　　在SoC上使用多個DSP能使系統(tǒng)在完成語音識別的同時更容易地執(zhí)行其它任務(wù)。例如三個內(nèi)核中的一個可以專門指定用來完成多信道的服務(wù)器端ASR，而其它二個內(nèi)核用于執(zhí)行像語音信道和互聯(lián)網(wǎng)數(shù)據(jù)處理這樣的任務(wù)。將來如果手機(jī)鍵盤不復(fù)存在的話，ASR將成為用戶與手機(jī)之間的接口，到時這一功能將占用大部分的工作時間。

　　采用多個DSP內(nèi)核還能提供強(qiáng)大的計算能力，從而使執(zhí)行非常復(fù)雜的ASR任務(wù)成為可能，如電子郵件聽寫中的連續(xù)語音識別、安全交易和VXML中的“口令+講者驗(yàn)證”等。多個DSP再加上統(tǒng)一的大型片上存儲器可以極大地縮短跟講者無關(guān)的訓(xùn)練過程，因?yàn)樵诮y(tǒng)計型ASR中訓(xùn)練過程的計算負(fù)載比識別處理過程的負(fù)載重得多。

　　本文小結(jié)

　　盡管3G手機(jī)要想贏得市場，人們對其功能和設(shè)計仍將拭目以待，但這些系統(tǒng)需要高性能的信號處理平臺以滿足多媒體任務(wù)需求是不容置疑的，而隨著ASR系統(tǒng)的不斷普及，3G手機(jī)肯定需要具備運(yùn)行多任務(wù)能力的多DSP SoC作為解決方案。

閱讀全文

dsp(343840) dsp(343840)
3G手機(jī)(31417) 3G手機(jī)(31417)
服務(wù)器(82166) 服務(wù)器(82166)

基于DSP的語音識別系統(tǒng)的實(shí)現(xiàn)及分析

隨著DSP技術(shù)的快速發(fā)展及性能不斷完善，基于DSP的語音識別算法得到了實(shí)現(xiàn)，并且在費(fèi)用、功耗、速度、精確度和體積等方面有著PC機(jī)所不具備的優(yōu)勢，具有廣闊的應(yīng)用前景。

2013-04-27 11:14:43

9239

基于DSP的高速實(shí)時語音識別系統(tǒng)的設(shè)計

實(shí)時語音識別系統(tǒng)中，由于語音的數(shù)據(jù)量大，運(yùn)算復(fù)雜，對處理器性能提出了很高的要求，適于采用高速DSP實(shí)現(xiàn)。雖然DSP提供了高速和靈活的硬件設(shè)計，但是在實(shí)時處理系統(tǒng)中，還需結(jié)

2011-10-03 11:10:53

1895

完善語音識別 Intel為Broadwell處理器配備專用DSP

國外媒體報道稱，Intel計劃在未來將要推出的Broadwell處理器上解決目前語音識別功能不盡人意的現(xiàn)狀，解決方案就是通過集成的智能聲音技術(shù)（Smart Sound Technology）DSP

2013-10-16 09:36:05

1338

解析語音識別技術(shù)在手機(jī)中的應(yīng)用

當(dāng)語音識別技術(shù)應(yīng)用到計算機(jī)桌面的時候，這看起來似乎是一個好主意。但是，對于大多數(shù)人來說，語音識別還不能取代鍵盤和鼠標(biāo)?，F(xiàn)在，語音技術(shù)正用于一個全新的環(huán)境：手機(jī)。##相關(guān)的應(yīng)用程序。

2014-07-16 09:34:15

5236

基于DSP的語音識別計算器電路設(shè)計

語音識別技術(shù)是人機(jī)最自然、最簡潔的交流方式，它就是讓機(jī)器能夠自動識別并理解說話人要表達(dá)的意思，將語音信號轉(zhuǎn)變?yōu)檎_的文本或者命令的高科技技術(shù)。

2014-10-23 15:18:55

6095

鎖定語音識別商機(jī) ADI強(qiáng)攻DSP應(yīng)用

ADI公司DSP亞洲業(yè)務(wù)區(qū)域經(jīng)理陸磊指出，DSP作為運(yùn)行語音識別的算法運(yùn)行的載體，需要提供足夠的性能，以及低功耗、低成本的產(chǎn)品。

2015-07-22 14:24:54

1162

手機(jī)語音識別應(yīng)用中DSP該怎么選擇？

　　隨著DSP技術(shù)的進(jìn)步，計算能力更強(qiáng)、功耗更低和體積更小的DSP已經(jīng)出現(xiàn)，使3G手機(jī)上植入更精確更復(fù)雜的自動語音識別(ASR)功能成為可能。目前，基本ASR應(yīng)用可以分成三大類：1. 語音-文本轉(zhuǎn)換(語音輸入)；2. 講者識別；3. 語音命令控制(語音控制)。　

2019-09-02 07:03:35

語音識別

做了一個語音識別的，很不準(zhǔn)確，誰有厲害一點(diǎn)的算法

2020-03-16 21:25:17

語音識別技術(shù)的基本原理及應(yīng)用是什么？

語音識別技術(shù)的基本原理是什么？語音識別技術(shù)的應(yīng)用是什么？

2021-05-31 06:50:58

語音識別技術(shù)的概念及應(yīng)用前景

前還是需要使用手機(jī)等設(shè)備作為中心，在實(shí)際使用中特別是當(dāng)設(shè)備就在眼前時，用手機(jī)啟動并不是最方便的操控方式，而且當(dāng)手機(jī)等中心設(shè)備有故障時，各個設(shè)備之間缺乏控制方式無法使用，存在一定的局限性。當(dāng)前語音作為

2023-05-27 09:41:03

語音識別模塊

目前市面上語音識別模塊哪家識別率比較高，又帶語音合成功能？

2015-09-01 15:20:15

語音識別的現(xiàn)狀如何？

語音識別技術(shù)的最重大突破是隱含馬爾科夫模型Hidden Markov Model的應(yīng)用。從Baum提出相關(guān)數(shù)學(xué)推理，經(jīng)過Labiner等人的研究，卡內(nèi)基梅隆大學(xué)的李開復(fù)最終實(shí)現(xiàn)了第一個基于隱馬爾科夫模型的大詞匯量語音識別系統(tǒng)Sphinx。此后嚴(yán)格來說語音識別技術(shù)并沒有脫離HMM框架。

2019-10-08 14:29:52

語音識別系統(tǒng)在智能家庭系統(tǒng)中的應(yīng)用是什么？

2021-05-31 06:54:34

語音識別芯片聲控芯片 LD3320 非特定人/單芯片/動態(tài)編輯識別列表 ICRoute

，芯片在出廠后無法修改識別的條目只能識別出廠前預(yù)制的識別內(nèi)容，并且識別率低?；蛘呤腔?DSP+RAM+Flash+加密芯片的方式，由DSP運(yùn)行存儲在Flash中的軟件來實(shí)現(xiàn)語音識別功能。這樣的模塊由于

2009-12-16 12:00:28

語音信號識別

有償求基于TMS320C5509A的語音信號識別的算法源程序

2016-05-03 08:03:52

語音控制系統(tǒng)中的功耗降低

僅使用語音來控制機(jī)器的能力已成為許多商業(yè)和消費(fèi)者系統(tǒng)中的流行功能。但是語音控制的問題在于設(shè)備必須始終處于監(jiān)聽狀態(tài)，這意味著必須始終為其供電。不過，新的選擇正在不斷涌現(xiàn)，它們可以幫助設(shè)計人員減少語音

2021-03-03 10:44:01

CES熱門技術(shù)：語音識別

)就可以上網(wǎng)沖浪，動動手就可以瀏覽網(wǎng)頁、選擇搜索結(jié)果或者提高音量。聯(lián)想集團(tuán)也表示，其首次面世的智能電視ideatv，也提供語音輸入和控制、體感游戲、人臉識別等多種交互方式。

2012-02-06 13:27:58

FPGA和Nios_軟核的語音識別系統(tǒng)的研究

FPGA和Nios_軟核的語音識別系統(tǒng)的研究引言語音識別的過程是一個模式匹配的過程在這個過程中，首先根據(jù)說話人的語音特點(diǎn)建立語音模型，對輸入的語音信號進(jìn)行分析，并提取所需的語音特征，在此基礎(chǔ)上建立

2012-08-11 11:47:15

MSP432用MCU實(shí)現(xiàn)語音識別

在萬物互聯(lián)的世界中，越來越多能夠理解語音內(nèi)容的電子設(shè)備逐漸進(jìn)入我們的視線。在智能手機(jī)、平板電腦和筆記本等擁有Siri或Cortana應(yīng)用程序的設(shè)備中，語音識別能夠幫助用戶搜索答案或控制周圍的電子器件

2019-07-12 06:06:08

TWEN-ASR ONE 語音識別系列教程（1）——運(yùn)行第一個語音程序

文章目錄前言一、TWEN-ASR開發(fā)板介紹二、程序編寫、下載、調(diào)試三、運(yùn)行測試四、總結(jié)前言????語音識別這個詞，相信大家都不陌生，現(xiàn)在流行的智能音箱基本都有語音識別功能，如Alex、小愛音箱、天

2021-06-16 18:10:07

labview實(shí)現(xiàn)語音識別

發(fā)出語音命令后通過語音識別軟件識別，然后調(diào)用labview程序，在labview程序中調(diào)用API函數(shù)，實(shí)現(xiàn)對鼠標(biāo)的控制，現(xiàn)在的問題是如何使軟件與labview銜接（必須用到labview平臺）如果有大神可以直接用labview做出語音識別，希望是效果好的成品，也可以求大神幫助，不勝感激

2012-02-21 17:31:47

proteus中關(guān)于語音識別的元件

2016-07-03 10:20:18

【語音識別】你知道什么是離線語音識別和在線語音識別嗎?

是：語音庫,它作為識別過程中對比的數(shù)據(jù)在線的語音庫在云端,存儲的數(shù)據(jù)是非常龐大的；而離線的語音庫在本地,空間是有限的,那樣對比的數(shù)據(jù)樣本差異就比較大,假設(shè)輸入的語音“打開燈”,那么識別的過程就會

2021-04-01 17:11:18

【NXP LPC54110試用申請】語音識別與智能門鎖控制

項目名稱：語音識別與智能門鎖控制試用計劃：申請理由：語音識別與控制一般情況下都是很高大尚的DSP芯片，一般民用的場慢下都是用不上，偶遇這塊神塊，性價比都是比較合適，同時資源豐富，滿足民用的場合。希望

2017-09-27 11:18:47

【Nuvoton ISD9160語音識別試用體驗(yàn)】ISD9160語音識別代碼分析

twowinter，轉(zhuǎn)載請注明：http://blog.csdn.net/iotisan/## 功能分析語音識別例程中做了21條語音識別模型，只要識別到對應(yīng)的語音，就從串口輸出對應(yīng)模型的命令I(lǐng)D。具體21條命令

2016-12-22 00:53:46

【Nuvoton ISD9160語音識別試用體驗(yàn)】Nuvoton ISD9160語音識別物聯(lián)網(wǎng)開發(fā)套件P16-008 Oscar-Numaker Plus

上傳到手機(jī)APP或者微信。 3) 語音播報，語音錄放，語音識別功能操作手冊上說P16-008 Oscar-Numaker Plus板卡有這三點(diǎn)功能。接下來我會一一先去驗(yàn)證這些功能。圖一、第一次上電效果圖

2016-10-29 22:18:58

【Nuvoton ISD9160語音識別試用體驗(yàn)】結(jié)項總結(jié) 語音識別智能抽屜控制~~~~~~~~~

里看到那些盛放中藥的密密麻麻的小抽屜，工作人員往往為尋找某一味中藥而傷透腦筋，而通過在設(shè)定不同的識別語句，利用非特定語音識別控制的智能抽屜完全可以解決此類問題。利用程序中預(yù)設(shè)值的語音識別語句即可完成

2016-12-23 09:19:55

【TL6748 DSP申請】基于DSP的語音識別技術(shù)研究及實(shí)現(xiàn)

申請理由：在校大三學(xué)生，電子信息工程信號處理方向，特別想學(xué)習(xí)一下DSP信號處理技術(shù)。學(xué)習(xí)過隨機(jī)信號分析、信號系統(tǒng)課程并且正在學(xué)習(xí)數(shù)字信號處理課程。希望能夠深入學(xué)習(xí)語音信號識別處理技術(shù)，需要TI

2015-10-09 15:08:40

【TL6748 DSP申請】方言語音采集處理系統(tǒng)

申請理由：正好在做這個方面的項目，正好要使用DSP對語音數(shù)據(jù)進(jìn)行處理，也正好想買了創(chuàng)龍的FPGA數(shù)據(jù)采集卡，就想申請一下創(chuàng)龍的DSP試試效果怎么樣項目描述：方言語音采集就是通過設(shè)備采集當(dāng)?shù)氐姆窖?，運(yùn)用DSP對語音進(jìn)行處理找出各個方言的特征，為以后的方言識別提供數(shù)據(jù)資料。

2015-11-06 09:58:46

【大聯(lián)大品佳 Nuvoton ISD9160語音識別試用申請】語音識別無線墻壁開關(guān)

，能通過開燈，關(guān)燈，調(diào)亮基本語音指令，另外可以通過藍(lán)牙連接手機(jī)。最好可以開關(guān)通過wifi能連接云，阿里云或者亞馬遜AWS。項目計劃：先把 Nuvoton ISD9160 語音識別開發(fā)板基本功能熟悉

2020-08-10 17:49:03

【龍邱Lark7618試用體驗(yàn)】—Lark7618語音識別Wifi模塊

人可供選擇，在開發(fā)過程中使用不同發(fā)音人發(fā)音，大大增加了開發(fā)的樂趣，讓你遠(yuǎn)離枯燥的開發(fā)過程。同時不同的發(fā)音人對客戶也有莫大的吸引力。模塊外延開發(fā)：對于Lark7618語音識別wifi模塊，不止我們

2016-05-11 16:39:49

【龍邱Lark7618試用體驗(yàn)】開箱測評語音識別開發(fā)板套件手冊

Lark7618集成云端語音識別、語音合成、語音喚醒和MP3解碼等功能于一身。智能識別數(shù)字符號，多音字，姓氏等，并智能合成發(fā)音。模塊集成了語音識別，語音合成，MP3播放，WIFI模塊等；提供手機(jī)

2016-07-30 16:53:07

什么是語音接口？

? DSP系列產(chǎn)品，這些產(chǎn)品都具備語音處理的能力。兩種系列的產(chǎn)品各有千秋，分別適用于不同的應(yīng)用。在選擇DSP和ARM這兩種解決方案時，考慮的關(guān)鍵因素在于這款設(shè)備能否或?qū)⑷绾卫迷?b class="flag-6" style="color: red">語音平臺。當(dāng)中有三種

2019-03-04 06:45:05

會物體識別和語音識別的nao機(jī)器人

的“say”指令盒中，您可插入文字，并根據(jù)需要調(diào)整聲音參數(shù)。隨后，nao機(jī)器人就會以恰當(dāng)?shù)恼Z調(diào)抑揚(yáng)頓挫地說出這段文字。自動語音識別語音識別是人類與機(jī)器人互動的核心元素。因此，我們選擇了這方面的佼佼者

2015-02-13 14:09:50

使用緊急呼叫和DSP的語音識別系統(tǒng)

開發(fā)并測試了安裝在汽車內(nèi)、使用簡單離散字的特定發(fā)音人語音識別系統(tǒng)。

2019-11-04 07:23:41

基于DSP的漢字語音識別系統(tǒng)如何實(shí)現(xiàn)

基于DSP的漢字語音識別系統(tǒng)如何實(shí)現(xiàn)

2021-03-12 06:33:15

基于語音識別做一款能識別語音的App

最近做了一款語音識別的App，想著利用手機(jī)控制arduino實(shí)現(xiàn)RGB的調(diào)節(jié)，開發(fā)思路：基于訊飛語音識別做一款能識別我們語音的App，識別出文本之后，對應(yīng)的文字轉(zhuǎn)UTF-8編碼，通過藍(lán)牙串口通訊發(fā)送到arduino，實(shí)現(xiàn)對RGB的控制。...

2022-03-01 07:05:08

基于語音識別的人機(jī)交互方式淺析

量大，一般在計算機(jī)上實(shí)現(xiàn)，即使是嵌入式方面，多數(shù)方案也需要運(yùn)算能力強(qiáng)的 ARM 或 DSP，并且外擴(kuò) RAM、FLASH 等資源，增加了硬件成本，這些特點(diǎn)無疑限制了語音識別技術(shù)的應(yīng)用，尤其是嵌入式領(lǐng)域。...

2022-01-25 07:00:22

基于語音識別的微博簽到系統(tǒng)

;LD_ReadReg(0xbf)==0×35)// 中斷請求編號寄存器0x2B第4位：讀取值為1表示語音識別有結(jié)果產(chǎn)生；MCU可清零。ASR過程中DSP忙閑狀態(tài)寄存器0xb2,讀取到0×21 表示閑，查詢到

2014-11-10 17:09:03

基于ATMEGAl28的語音識別系統(tǒng)設(shè)計

量大，一般在計算機(jī)上實(shí)現(xiàn)，即使是嵌入式方面，多數(shù)方案也需要運(yùn)算能力強(qiáng)的ARM或DSP，并且外擴(kuò)RAM、FLASH等資源，增加了硬件成本，這些特點(diǎn)無疑限制了語音識別技術(shù)的應(yīng)用，尤其是嵌入式領(lǐng)域。本系統(tǒng)

2014-03-17 13:31:40

基于Cirrus Logic公司推出全新系列的語音處理器

增強(qiáng)智能手機(jī)、平板電腦和可穿戴設(shè)備的語音識別準(zhǔn)確度。Cirrus Logic推出提升用戶體驗(yàn)的全新語音處理器?！　橹圃焐烫峁┩暾挠布颓度胧杰浖a(chǎn)品，從而帶給用戶在耳機(jī)或免提揚(yáng)聲器模式下語音識別

2018-11-29 17:12:11

基于MSP432 MCU的語音識別設(shè)計概述

2019-07-30 04:45:12

基于TI嵌入式語音識別庫的TIDEP0066參考設(shè)計

基于 C5535 eZdsp? 的語音識別參考設(shè)計描述TIDEP0066 參考設(shè)計采用 TI 嵌入式語音識別 (TIesr) 庫，突出了 C5535 和 C5545 DSP 器件的語音識別能力；并且

2019-03-01 09:52:42

基于labview的語音識別

`1系統(tǒng)概述語音識別技術(shù)是二十世紀(jì)信息技術(shù)領(lǐng)域十大重要的科技發(fā)展技術(shù)之一。語音識別是一門交叉學(xué)科，語音識別正逐步成為信息技術(shù)中人機(jī)交互的關(guān)鍵技術(shù)，語音識別技術(shù)與語音合成技術(shù)結(jié)合使人們能夠甩掉鍵盤

2019-03-10 22:00:15

如何利用MCU實(shí)現(xiàn)語音識別？

人們對于微控制器（MCU）因過小而無法識別語音常常有誤解，如何利用MCU實(shí)現(xiàn)語音識別呢？

2021-04-02 07:20:41

如何利用MCU實(shí)現(xiàn)語音識別？

在萬物互聯(lián)的世界中，越來越多能夠理解語音內(nèi)容的電子設(shè)備逐漸進(jìn)入我們的視線。在智能手機(jī)、平板電腦和筆記本等擁有Siri或Cortana應(yīng)用程序的設(shè)備中，語音識別能夠幫助用戶搜索答案或控制周圍的電子器件等。

2019-10-11 06:58:43

如何在dsp中添加自己的識別算法？

大家好：我現(xiàn)在使用的DM8127 RDK3.2版本，想在dsp中添加自己的識別算法。請問怎樣調(diào)試?。咳绻褂肅CS的話應(yīng)該使用哪個版本的？在這個RDK版本中DSP/BIOS對應(yīng)哪個版本？能提供個對應(yīng)DSP_BIOSUsers guide的連接嗎？謝謝了！

2020-08-17 11:20:54

如何采用ADSP2181實(shí)現(xiàn)語音信號的識別？

本文介紹采用AD公司的定點(diǎn)DSP處理芯片ADSP2181實(shí)現(xiàn)了語音信號的識別。

2021-06-07 06:47:57

嵌入式語音識別技術(shù)在80251內(nèi)核中該如何去實(shí)現(xiàn)呢

語音識別技術(shù)有哪些應(yīng)用？嵌入式語音識別技術(shù)在80251內(nèi)核中該如何去實(shí)現(xiàn)呢？

2021-12-23 07:42:08

嵌入式語音識別系統(tǒng)中的電路設(shè)計是如何的

現(xiàn)在社會發(fā)展的這么快，什么高科技都涌現(xiàn)出來，什么智能機(jī)器人啦，智能手機(jī)等，有很多在這里就不一一列舉了，在這里我們要說的就是語音識別系統(tǒng)了，現(xiàn)在嵌入式產(chǎn)品如此的多，就像一些智能空調(diào)啦，我們可以對著他說

2021-12-20 07:52:03

嵌入式語音識別系統(tǒng)在生活中的應(yīng)用有哪些呢

嵌入式語音識別系統(tǒng)是什么？嵌入式語音識別系統(tǒng)在生活中的應(yīng)用有哪些呢？

2021-12-23 08:27:03

怎么設(shè)計基于嵌入式系統(tǒng)的語音口令識別系統(tǒng)？

回答等。在數(shù)字信號處理芯片上已經(jīng)實(shí)現(xiàn)了語音口令識別系統(tǒng)或語音口令識別系統(tǒng)的部分功能，然而隨著嵌入式微處理器處理能力的大幅度提高，計算量大的語音口令識別算法已經(jīng)能夠通過嵌入式微處理器來完成，將語音口令識別系統(tǒng)與嵌入式系統(tǒng)相結(jié)合，發(fā)揮語音識別系統(tǒng)的潛力，使語音識別系統(tǒng)能夠廣泛應(yīng)用于便攜式設(shè)備中?！　?/div>

2019-09-03 08:27:23

智能肩頸按摩儀離線語音識別芯片方案

、語音識別主控、識別芯片外掛flash，而現(xiàn)在單片機(jī)市場競爭日益激烈和貨源短缺的市場行情中，這三個主要元器件的市場價格高，供貨不穩(wěn)定，導(dǎo)致我們的生產(chǎn)變得困難，面臨成本高等問題。九芯電子在研發(fā)語音識別

2022-06-16 11:45:50

用語音識別芯片/聲控芯片 LD3320 實(shí)現(xiàn)語音控制機(jī)頂盒遙控器

，并且識別率低?；蛘呤腔?DSP+RAM+Flash+加密芯片的方式，由DSP運(yùn)行存儲在Flash中的軟件來實(shí)現(xiàn)語音識別功能。這樣的模塊由于是由多個芯片和PCB組成，成本高，外圍電路復(fù)雜，二次開發(fā)

2009-12-16 11:59:08

百度API調(diào)用（三）——語音識別精選資料推薦

python 調(diào)用百度語音識別API 一、開通百度語音技術(shù)接口服務(wù)基本過程：1、打開百度ai開放平臺 https://ai.baidu.com/2、打開控制臺3、選擇語音技術(shù)4、選擇創(chuàng)建應(yīng)用5、選擇

2021-08-18 06:44:16

離線語音識別及控制是怎樣的技術(shù)？

了對網(wǎng)絡(luò)依賴的程度。　二、離線語音識別技術(shù)的優(yōu)勢　離線語音識別的優(yōu)勢主要體現(xiàn)在以下幾個方面：　1. 隱私保護(hù)：離線語音識別在處理過程中不需要將語音數(shù)據(jù)上傳至云端，可以在本地設(shè)備上進(jìn)行處理，有效

2023-11-24 17:41:39

離線語音識別和控制的工作原理及應(yīng)用

　　在匹配階段，將提取的特征向量與預(yù)定義的詞典中的詞進(jìn)行匹配。最常用的匹配算法是動態(tài)時間規(guī)整（DTW），它能有效地解決語音信號的時間扭曲問題。　　二、離線語音識別使用的技術(shù) 　　離線語音識別主要使用深度

2023-11-07 18:01:32

離線語音Snowboy熱詞喚醒語音識別

離線語音Snowboy熱詞喚醒語音識別現(xiàn)在有非常廣泛的應(yīng)用場景,如手機(jī)的語音助手,智能音響(小愛,叮咚,天貓精靈...)等.語音識別一般包含三個階段:熱詞喚醒,語音錄入,識別和邏輯控制階段.熱詞喚醒

2021-07-30 08:06:37

自制基于ESP32的語音識別模塊

來調(diào)試模塊，也可以通過UART接口對接單片機(jī)、arduino、DSP、FPGA等硬件，方便您實(shí)現(xiàn)語音識別功能。語音識別模塊背面語音識別模塊正面硬件接口簡介：語音識別模塊對用戶提供一個UART接口波特率

2021-08-24 15:03:47

自動語音識別的原理是什么？

自動語音識別的原理是什么？如何利用WaveNet實(shí)現(xiàn)自動語音識別？

2021-06-15 09:14:07

藍(lán)牙語音識別芯片在智能家居控制與管理系統(tǒng)中的作用是什么？

門禁語音識別芯片為什么會興起？藍(lán)牙語音識別芯片在智能家居控制與管理系統(tǒng)中的作用是什么？

2021-06-27 06:57:51

詳解語音識別技術(shù)原理

什么，識別出的結(jié)果必然是這兩個句子中的一句。那如果想識別任意文本呢？把這個網(wǎng)絡(luò)搭得足夠大，包含任意文本的路徑就可以了。但這個網(wǎng)絡(luò)越大，想要達(dá)到比較好的識別準(zhǔn)確率就越難。所以要根據(jù)實(shí)際任務(wù)的需求，合理選擇網(wǎng)絡(luò)

2020-05-30 07:41:12

請問語音識別如何停止？

我現(xiàn)在整合了語音識別和音樂播放器的功能，識別到喚醒詞我就把音樂播放關(guān)閉，并且保存播放的斷點(diǎn)信息。然后語音識別完成之后系統(tǒng)返回AUDIO_REC_WAKEUP_END事件就恢復(fù)之前的音樂播放。這些功能

2023-03-10 08:31:21

誰做過DSP語音識別相關(guān)的工程，交流一下！

求助，誰做過DSP語音識別相關(guān)的工程，交流一下！

2017-03-12 22:05:53

基于嵌入式與DSP的語音識別機(jī)器人研究

本文探討和研究了基于嵌入式系統(tǒng)以及DSP 的語音識別工業(yè)機(jī)器人系統(tǒng)設(shè)計與實(shí)現(xiàn)。系統(tǒng)采用嵌入式＋DSP 的方案使機(jī)器人的性能、成本、可配置性和可擴(kuò)展性達(dá)到一個更佳的平衡

2009-12-16 16:21:48

基于TMS320C6711 DSP的非特定人、孤立詞語音識別

本文介紹了一種基于TMS320C6711 DSP的非特定人、孤立詞語音識別系統(tǒng)。本文首先介紹了語音識別技術(shù)的基本原理，然后對不同的識別算法在多種嵌入式系統(tǒng)平臺上進(jìn)行性能分析和比較

2010-07-27 17:49:13

孤立詞語音識別系統(tǒng)的DSP實(shí)現(xiàn)

孤立詞語音識別系統(tǒng)的DSP實(shí)現(xiàn) 0 引言在孤立詞語音識別中，最為簡單有效的方法是采用動態(tài)時間規(guī)整(Dynamic Time Warping，DTW)算法，該算法解決了發(fā)音長

2009-11-10 09:25:37

934

語音識別技術(shù),語音識別技術(shù)是什么意思

語音識別技術(shù),語音識別技術(shù)是什么意思　語音識別技術(shù)，也被稱為自動語音識別Automatic Speech Recognition，(ASR)，其目標(biāo)是將人類的語音

2010-03-06 11:16:45

2783

語音識別,什么是語音識別

語音識別,什么是語音識別語音識別　與機(jī)器進(jìn)行語音交流，讓機(jī)器明白你說什么，這是人們長期以來

2010-03-06 11:19:25

2537

3G手機(jī)語音識別應(yīng)用中DSP的選擇策略

3G手機(jī)語音識別應(yīng)用中DSP的選擇策略隨著DSP技術(shù)的進(jìn)步，計算能力更強(qiáng)、功耗更低和體積更小的DSP已經(jīng)出現(xiàn)，使3G手機(jī)上植入更精確更復(fù)雜的自動語音識別(ASR)功能成為

2010-03-29 08:58:15

674

基于DSP的語音識別計算器設(shè)計

基于DSP的語音識別

2011-01-07 11:14:01

智能手機(jī)的超性能語音識別技術(shù)

語音識別技術(shù)在手機(jī)中的應(yīng)用將進(jìn)一步推動這種技術(shù)向新的方向發(fā)展和應(yīng)用。這是語音識別技術(shù)在臺式電腦應(yīng)用中從來沒有涉足的方向。

2011-03-26 11:00:50

1290

#硬聲創(chuàng)作季 #語音識別語音識別實(shí)戰(zhàn)-08-3-制作json標(biāo)注數(shù)據(jù)

語音識別

水管工發(fā)布于 2022-12-07 18:57:55

#硬聲創(chuàng)作季 #語音識別語音識別實(shí)戰(zhàn)-16-3-語音特征提取

語音識別

水管工發(fā)布于 2022-12-07 19:01:33

#硬聲創(chuàng)作季 #語音識別語音識別實(shí)戰(zhàn)-20-1-數(shù)據(jù)與項目文件解讀

語音識別

水管工發(fā)布于 2022-12-07 19:03:22

#硬聲創(chuàng)作季 #語音識別語音識別實(shí)戰(zhàn)-31-2-經(jīng)典語音分離模型概述

語音識別

水管工發(fā)布于 2022-12-07 19:08:29

#硬聲創(chuàng)作季 #語音識別語音識別實(shí)戰(zhàn)-34-5-DW卷積的作用與效果

語音識別

水管工發(fā)布于 2022-12-07 19:09:47

#硬聲創(chuàng)作季 #語音識別語音識別實(shí)戰(zhàn)-43-1-語音合成項目所需環(huán)境配置

語音識別

水管工發(fā)布于 2022-12-07 19:13:59

廚房秤也能語音控制？#語音控制 #語音模塊 #語音識別 #離線語音識別

芯片語音識別

輕生活科技語音模塊發(fā)布于 2023-10-19 16:36:15

在線和離線語音控制你會怎么選擇呢？#語音模塊 #語音控制 #語音識別 #離線語音

芯片語音識別

輕生活科技語音模塊發(fā)布于 2023-10-26 14:29:47

嵌入式與DSP的語音識別機(jī)器人研究

嵌入式與DSP的語音識別機(jī)器人研究

2017-10-21 08:44:35

基于DSP的3G手機(jī)語音識別應(yīng)用分析

隨著DSP技術(shù)的進(jìn)步，計算能力更強(qiáng)、功耗更低和體積更小的DSP已經(jīng)出現(xiàn)，使3G手機(jī)上植入更精確更復(fù)雜的自動語音識別（ASR）功能成為可能。目前，基本ASR應(yīng)用可以分成三大類：1. 語音-文本轉(zhuǎn)換

2017-11-02 10:23:14

淺談手機(jī)語音識別應(yīng)用中選擇DSP的策略

2017-11-06 11:46:10

3G手機(jī)語音識別的兩種方法分析

2017-12-12 03:50:32

1222

語音識別技術(shù)的應(yīng)用及參考設(shè)計

1.3 TI C5000、C6000 DSP 產(chǎn)品及語音識別參考設(shè)計概覽

2018-08-13 02:28:00

2984

語音識別的應(yīng)用場景

在西方經(jīng)濟(jì)發(fā)達(dá)國家，大量的語音識別產(chǎn)品已經(jīng)進(jìn)入市場和服務(wù)領(lǐng)域。一些用戶交換機(jī)、電話機(jī)、手機(jī)已經(jīng)包含了語音識別撥號功能、語音記事本、語音智能玩具等產(chǎn)品，同時也包括語音識別與語音合成功能。人們可以通過電話網(wǎng)絡(luò)用語音識別口語對話系統(tǒng)查詢有關(guān)的機(jī)票、旅游、銀行信息。下面一起來看看語音識別的應(yīng)用場景：

2019-03-27 15:04:58

19308

如何使用FPGA實(shí)現(xiàn)語音識別系統(tǒng)的設(shè)計資料說明

近年來，語音識別研究大部分集中在算法設(shè)計和改進(jìn)等方面，而隨著半導(dǎo)體技術(shù)的高速發(fā)展，集成電路規(guī)模的不斷增大與各種研發(fā)技術(shù)水平的不斷提高，新的硬件平臺的推出，語音識別實(shí)現(xiàn)平臺有了更多的選擇。語音識別技術(shù)在與DSP、FPGA、ASIC等器件為平臺的嵌入式系統(tǒng)結(jié)合后，逐漸向?qū)嵱没?、小型化方向發(fā)展。

2019-06-10 08:00:00

語音識別芯片的原理_語音識別芯片有哪些

語音識別芯片也叫語音識別IC，與傳統(tǒng)的語音芯片相比，語音識別芯片最大的特點(diǎn)就是能夠語音識別，它能讓機(jī)器聽懂人類的語音，并且可以根據(jù)命令執(zhí)行各種動作，如眨眼睛、動嘴巴（智能娃娃）。除此之外，語音識別芯片還具有高品質(zhì)、高壓縮率錄音放音功能，可實(shí)現(xiàn)人機(jī)對話。

2019-10-01 08:46:00

4911

怎么實(shí)現(xiàn)語音識別_手機(jī)語音識別怎么設(shè)置

很多時候我們都需要將一些語音文件轉(zhuǎn)換為文字的形式進(jìn)行使用，那么這時我們就需要對語音文件進(jìn)行識別了。那么我們應(yīng)該怎樣在線實(shí)現(xiàn)語音識別的問題呢？下面我們就一起來看一下吧。

2020-04-01 09:34:30

12537

514

已全部加載完成

搜索歷史

手機(jī)語音識別應(yīng)用中DSP的選擇

評論