基于WT2605C-32N音頻藍(lán)牙語音芯片的實(shí)時(shí)錄音上傳技術(shù)方案介紹
現(xiàn)代社會(huì),信息技術(shù)的發(fā)展尤其迅速,信息和數(shù)據(jù)的重要性和安全性日漸深刻,在某些特殊場(chǎng)合,因?yàn)楣ぷ魃系男枰蛘呷粘I畹男枨?,往往需要記錄和保留一些重要的聲音。在某些時(shí)刻,錄音成為記錄生活,保存證據(jù)的重要手段,可見,錄音技術(shù)對(duì)于我們現(xiàn)代生活尤為重要。
而隨著錄音技術(shù)的發(fā)展,一種實(shí)時(shí)錄音技術(shù)受到更多人的青睞,相比較于傳統(tǒng)錄音而言,實(shí)時(shí)錄音技術(shù)突破了設(shè)備的限制,從單純的錄音設(shè)備擴(kuò)展到我們的云端,隨時(shí)隨地即可分享,實(shí)現(xiàn)了我們錄音數(shù)據(jù)的可交互性,在實(shí)際應(yīng)用中給提升了我們產(chǎn)品的應(yīng)用價(jià)值,給用戶帶來更完美的體驗(yàn)感受。
唯創(chuàng)知音一直致力于成為語音物聯(lián)網(wǎng)界的領(lǐng)導(dǎo)者,自主研發(fā)了一種實(shí)時(shí)錄音技術(shù)上傳技術(shù),在錄音筆,錄音耳機(jī)等錄音設(shè)備上面應(yīng)用廣泛,這種實(shí)時(shí)錄音技術(shù),具有數(shù)據(jù)量小,失真率低,降噪效果明顯等特點(diǎn),通過外部藍(lán)牙設(shè)備,即可實(shí)現(xiàn)云端存儲(chǔ),云端即時(shí)播放等功能。不僅如此,這種錄音上傳技術(shù)因?yàn)槠渫ㄓ眯詮?qiáng),廣泛應(yīng)用于唯創(chuàng)知音自主研發(fā)的各類藍(lán)牙芯片上,下面我們以其中一種方案作簡(jiǎn)單的介紹:
WT2605C-32N錄音上傳方案介紹
1. 方案概述
錄音上傳技術(shù)近些年在錄音筆,錄音耳機(jī)中應(yīng)用廣泛,實(shí)現(xiàn)了移動(dòng)錄音設(shè)備和云端的互聯(lián),即時(shí)播放,即時(shí)翻譯,同聲傳譯成為產(chǎn)品一大亮點(diǎn),極大方便了我們的生活。而要保證這些功能的實(shí)現(xiàn),就離不開高品質(zhì)的錄音效果,和高壓縮的錄音數(shù)據(jù),本方案錄音采用IMA-ADPCM壓縮算法。IMA-ADPCM (ADPCM Adaptive Differential Pulse Code Modulation), 是一種針對(duì) 16bit聲音波形數(shù)據(jù)的一種有損壓縮算法, 它將聲音流中每次采的16bit 數(shù)據(jù)以 4bit 存儲(chǔ), 所以壓縮比為1:4。而壓縮/解壓縮算法非常的簡(jiǎn)單, 所以是一種低空間消耗,高質(zhì)量聲音獲得的好途徑。
2. 方案框圖
本方案采用WT2605C-32N芯片,可外掛本地存儲(chǔ)設(shè)備,通過串口與藍(lán)牙透?jìng)餍酒M(jìn)行通信,將錄音數(shù)據(jù)上發(fā)給云端設(shè)備。
3. 方案原理圖
4. 用戶協(xié)議
4.1.協(xié)議命令格式
通訊數(shù)據(jù)格式是:起始位:1位;數(shù)據(jù)位:8位;奇偶位:無;停止位:1位。發(fā)送的指令都為十六進(jìn)制的格式,默認(rèn)波特率為115200,可進(jìn)行修改,但不可小于115200波特率。使用電腦串口調(diào)試助手,需要正確設(shè)置串口的參數(shù),設(shè)置如圖:
注意:“長(zhǎng)度”是指長(zhǎng)度+命令碼+參數(shù)+校驗(yàn)和的長(zhǎng)度,“累加和校驗(yàn)”是指長(zhǎng)度+命令碼+參數(shù)的累加和的第八位。
4.2.返回碼格式
參數(shù):00 :表示執(zhí)行成功, 開始錄音
01 :表示執(zhí)行錯(cuò)誤
02 : 表示文件不存在
4.3.命令列表
4.3.1. 錄音開始命令(D6)
APP發(fā)送此條指令,控制錄音芯片開始錄音,此時(shí)錄音芯片會(huì)返回開始錄音成功返回碼,錄音過程中發(fā)送此條命令返回錯(cuò)誤;
開始錄音返回碼:
APP收到開始錄音返回碼,則開始準(zhǔn)備處理接收到的錄音數(shù)據(jù),此時(shí)芯片進(jìn)入錄音狀態(tài),同時(shí)開始發(fā)送錄音數(shù)據(jù)包。
首先錄音芯片會(huì)發(fā)送一包60個(gè)字節(jié)的音頻數(shù)據(jù)包,該包數(shù)據(jù)為IMA-ADPCM格式音頻數(shù)據(jù)的音頻頭,前面包含“RIFF”標(biāo)志和文件大小,注意此時(shí)ChunkSize 為0X00000034不包含當(dāng)前音頻數(shù)據(jù)包的長(zhǎng)度,因此整個(gè)音頻數(shù)據(jù)包的頭長(zhǎng)度為0X08+0X34,也就是60個(gè)字節(jié)的長(zhǎng)度。客戶需要錄音結(jié)束并接收完整個(gè)數(shù)據(jù)包之后,重寫這個(gè)位置。
例如,當(dāng)前文件的音頻頭標(biāo)識(shí)如下:
接下來的音頻頭包含F(xiàn)ormat Chunk 塊和Fact Chunk,客戶不用關(guān)心實(shí)際數(shù)據(jù)情況。
最后的音頻數(shù)據(jù)頭包含Data Chunk 客戶需要錄音結(jié)束并接收完整個(gè)數(shù)據(jù)包之后,重寫DataChunkSize這個(gè)位置
音頻數(shù)據(jù)頭發(fā)送完畢后,緊接著會(huì)發(fā)送音頻數(shù)據(jù)包,按照目前設(shè)置,每個(gè)數(shù)據(jù)包C長(zhǎng)度為256個(gè)字節(jié),受限于每個(gè)手機(jī)藍(lán)牙MTU限制,每包數(shù)據(jù)量不能超過手機(jī)默認(rèn)的MTU值,所以這里按照最小MTU值128字節(jié)進(jìn)行配置,將數(shù)據(jù)包C分兩包A+B數(shù)據(jù)包發(fā)送,A和B每包數(shù)據(jù)量為128字節(jié), 每包數(shù)據(jù)的間隔為10MS左右, 每個(gè)C包數(shù)據(jù)包間隔為60MS左右(根據(jù)錄音碼率決定,不可更改),即每一個(gè)C包數(shù)據(jù)包含整個(gè)nBlockAlign ,發(fā)送過程中即使某包數(shù)據(jù)丟失,也不會(huì)影響整個(gè)文件的播放。
當(dāng)客戶開始接收音頻數(shù)據(jù)包的時(shí)候,客戶APP需要記錄錄音結(jié)束前總的音頻數(shù)據(jù)包的個(gè)數(shù),比如APP在結(jié)束錄音時(shí)候共接收到0X36包音頻數(shù)據(jù)包,則總的音頻數(shù)據(jù)的長(zhǎng)度為 0X36 * 0X100 = 0X3600;
4.3.2. 錄音結(jié)束命令(DA)
APP發(fā)送此條指令,錄音芯片接收到錄音結(jié)束命令,停止發(fā)送錄音數(shù)據(jù)包,并結(jié)束當(dāng)前錄音,返回結(jié)束錄音返回碼;
結(jié)束錄音返回碼:
APP收到結(jié)束錄音返回碼,則保存當(dāng)前錄音文件,并將數(shù)據(jù)長(zhǎng)度重寫到文件相關(guān)位置,如圖所示。至此,錄音上傳完成。
5. 程序設(shè)計(jì)框圖
6. 應(yīng)用實(shí)例
下面我們用唯創(chuàng)WT-RS2 APP軟件進(jìn)行實(shí)際測(cè)試錄音上傳功能,首先打開APP,選擇MP3方案;
連接藍(lán)牙名稱為VT-A782的藍(lán)牙設(shè)備,連接成功后,APP界面默認(rèn)會(huì)打印當(dāng)前藍(lán)牙設(shè)備的藍(lán)牙MAC地址,唯創(chuàng)知音可以為每臺(tái)藍(lán)牙設(shè)備可以設(shè)置不同的的MAC地址,從而形成單獨(dú)唯一的藍(lán)牙名稱,在某些應(yīng)用場(chǎng)合,為每臺(tái)產(chǎn)品形成唯一身份碼。
點(diǎn)擊APP界面開始錄音標(biāo)志,此時(shí)APP按照時(shí)間創(chuàng)建錄音文件,此時(shí)開始接收錄音數(shù)據(jù),每個(gè)A和B包數(shù)據(jù)間隔10MS,每個(gè)C包數(shù)據(jù)間隔60MS,直到點(diǎn)擊APP結(jié)束錄音按鈕,此時(shí)APP顯示錄音結(jié)束。此時(shí)錄音文件已經(jīng)創(chuàng)建完畢,客戶可通過APP界面將錄音文件通過分享的方式發(fā)送到電腦或者其他播放器進(jìn)行播放!
關(guān)于我們
唯創(chuàng)知音作為一家專注于語音技術(shù)研究的高新技術(shù)企業(yè),始終堅(jiān)持以“服務(wù)好工程師”為目標(biāo),以行業(yè)語音交互器件標(biāo)準(zhǔn)化為方向,致力于讓復(fù)雜變簡(jiǎn)單,提供快捷的語音、智能物聯(lián)網(wǎng)應(yīng)用解決方案。
WT588F02B、WT2003H系列語音芯片應(yīng)用設(shè)計(jì)方案,在智能鬧鐘、智能水杯、霧化器等消費(fèi)電子行業(yè)領(lǐng)域內(nèi)已有成熟的應(yīng)用案例。消費(fèi)類電子產(chǎn)品應(yīng)用是公司重要的發(fā)展領(lǐng)域,未來,唯創(chuàng)知音將在更多行業(yè)推出標(biāo)準(zhǔn)化語音芯片,進(jìn)一步提升工程師的設(shè)計(jì)體驗(yàn),為消費(fèi)類電子行業(yè)標(biāo)準(zhǔn)化賦能。
更多詳情可搜索:深圳唯創(chuàng)知音電子有限公司,與在線客服溝通,我們會(huì)發(fā)送一份選型表給到大家,芯片 與 模塊 還可以申請(qǐng)免費(fèi)送樣服務(wù),期待您的光臨。
-
藍(lán)牙芯片
+關(guān)注
關(guān)注
17文章
377瀏覽量
46096
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
評(píng)論