0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

優(yōu)化lSD系列語(yǔ)音芯片的開(kāi)發(fā)平臺(tái)設(shè)計(jì)方案介紹

電子設(shè)計(jì) ? 來(lái)源:郭婷 ? 作者:電子設(shè)計(jì) ? 2018-12-21 08:26 ? 次閱讀

目前,市場(chǎng)上的語(yǔ)音芯片和語(yǔ)音板很多,從性能價(jià)格比上看,美國(guó)1SD公司的ISD系列錄放芯片可謂是一支獨(dú)秀。1SD器件使用直接電平存儲(chǔ)技術(shù),省去了A/D、D/A轉(zhuǎn)換;內(nèi)部集成了大容量的EERPOM,不再需要擴(kuò)展存儲(chǔ)器;控制簡(jiǎn)單,控制管腳與TFL電平兼容。具有集成度高、音質(zhì)好、使用方便等優(yōu)點(diǎn),是一種理想的語(yǔ)音處理芯片。

在控制上,除去手動(dòng)外,lSD器件也可以通過(guò)地址尋址來(lái)精確定位,但它的地址不是字節(jié)地址單元,而是信息段的基本組成單位。以ISD2560為例,它內(nèi)部的480kB的EEPROM均勻地規(guī)劃為600行,每個(gè)地址單元指向其中一行,有600個(gè)地址單元。ISD2560的錄放時(shí)間是60s,因此地址分辨率是100ms。lSD器件可進(jìn)行多段地址操作,每一段稱為一個(gè)信息段,它可以占用-行和多行存儲(chǔ)空間。-個(gè)地址單元最多只能作為一個(gè)獨(dú)立的段。因此,ISD2560最多可以分為600個(gè)信息段m。

2當(dāng)前ISD芯片開(kāi)發(fā)存在的問(wèn)題

通常情況下,只能使用lSD器件提供的無(wú)需知道地址的操作模式,即手動(dòng)模式,這只適合于開(kāi)發(fā)語(yǔ)音玩具,而無(wú)法滿足復(fù)雜操作或?qū)崟r(shí)系統(tǒng)中應(yīng)用的要求。為實(shí)現(xiàn)以上應(yīng)用,最好使用對(duì)地址直接操作的辦法。但在實(shí)用中,一些電路開(kāi)發(fā)設(shè)計(jì)只是在基于語(yǔ)音信號(hào)已經(jīng)寫人芯片,并且段地址已經(jīng)知道的基礎(chǔ)上才能進(jìn)行。然而,不可避免地要遇到必須將語(yǔ)音寫入的時(shí)候。如果手動(dòng)處理,采用按“錄音”按鍵錄音,“停止”按鍵停止,假如錄音段數(shù)特別多,就要頻繁地按上述按鍵,實(shí)在讓人疲憊不堪。此外,手動(dòng)按下“錄音”及“停止”按鍵的時(shí)間也很難掌握,這就容易產(chǎn)生段間空白,造成芯片空間浪費(fèi),對(duì)語(yǔ)音段特別多,而語(yǔ)句又特別短的提示如一些單字、單詞更是浪費(fèi)嚴(yán)重。不僅這樣,由于短句中空白時(shí)間過(guò)長(zhǎng),合成放音時(shí)出現(xiàn)語(yǔ)音不連貫。另外,直接對(duì)連接到1SD芯片的傳聲器錄音會(huì)造成情緒緊張,容易出錯(cuò),且無(wú)法對(duì)錄入的語(yǔ)音進(jìn)行高級(jí)處理。

3 解決方法

基于上述原因,需要設(shè)計(jì)一種lSD語(yǔ)音開(kāi)發(fā)平臺(tái),借助傳聲器通過(guò)計(jì)算機(jī)的聲卡將所有待寫語(yǔ)音信號(hào)一并錄入計(jì)算機(jī),存儲(chǔ)為*.wav文件,然后利用聲音剪輯軟件將各個(gè)詞語(yǔ)(短句)分離出來(lái)。因?yàn)槿绻皇峭瑫r(shí)錄音的話,對(duì)同一個(gè)人來(lái)說(shuō),其聲音在不同時(shí)間、不同場(chǎng)合、不同情緒時(shí)都會(huì)有著很大的差別。如電子體重計(jì),“您的體重是五十一公斤,您的身高是一百七十二厘米”,應(yīng)該是由“您的、體重、身高、是、公斤、厘米、五、十、一、百、七、二”等12個(gè)詞合成后形成的,如果由于某種原因,引起了任何一個(gè)詞與其它語(yǔ)調(diào)不同,提示時(shí)就會(huì)顯得特別突出,聽(tīng)起來(lái)有種怪怪的感覺(jué)。

若用計(jì)算機(jī)錄音,可以一并錄入很多段話(并非一定是全部需要的),然后從中選出所需詞語(yǔ)(短句)。因?yàn)檫@些話是在較短的時(shí)間內(nèi)完成的,所以不會(huì)有很大的語(yǔ)調(diào)變化,將從中選出的詞組合起來(lái)時(shí)也不會(huì)顯得牽強(qiáng),聽(tīng)起來(lái)感覺(jué)不到這些句子是由詞語(yǔ)拼湊起來(lái)的。

除此之外,如果有專業(yè)語(yǔ)音庫(kù),還可以直接從其中抽出詞語(yǔ)來(lái)組成所需的句子,并且還省去了請(qǐng)專業(yè)錄音人員的開(kāi)支。這樣還有一個(gè)好處是修改方便,因?yàn)楫?dāng)需要修改句子內(nèi)容時(shí),恰巧已經(jīng)錄過(guò)的句子中并沒(méi)有這樣的詞語(yǔ),則還必須請(qǐng)錄音員重錄一次,這不但增加了額外的開(kāi)支,還由于時(shí)間過(guò)了較久,錄音員的語(yǔ)調(diào)同原來(lái)相比肯定會(huì)有些變化,所以原來(lái)的錄音只能全部作廢,所有的一切都要從頭開(kāi)始。

綜上所述,采用計(jì)算機(jī)來(lái)分析組合以及剪輯語(yǔ)音的好處是處理直觀、修改方便,語(yǔ)句連續(xù)性強(qiáng),合成的句子更具有人性化。

不僅如此,采用該開(kāi)發(fā)平臺(tái),還可直觀地看出每個(gè)語(yǔ)句的詳細(xì)信息,包括:開(kāi)始地址、結(jié)束地址、語(yǔ)句所用時(shí)間、語(yǔ)句所占用芯片行的段數(shù)等對(duì)使用該語(yǔ)音芯片時(shí)碰到的比較敏感的信息。

為此,設(shè)計(jì)整個(gè)開(kāi)發(fā)平臺(tái)的結(jié)構(gòu)框圖如圖1所示。

優(yōu)化lSD系列語(yǔ)音芯片的開(kāi)發(fā)平臺(tái)設(shè)計(jì)方案介紹

系統(tǒng)工作方式如下:首先,通過(guò)傳聲器將相關(guān)的大段語(yǔ)句經(jīng)計(jì)算機(jī)聲卡錄制成為*,way文件并保存,然后借助于語(yǔ)音處理軟件如CoolEdit剪輯出需要的單詞(或短句)并去掉頭尾的空白,將剪輯過(guò)的單詞(或短句)每段都單獨(dú)另存為新的·.wav文件,并把它們?nèi)糠湃艘粋€(gè)單獨(dú)目錄。啟動(dòng)1SD編程燒錄器上位機(jī)開(kāi)發(fā)軟件,選中所有的待錄*.wav文件,并點(diǎn)“開(kāi)始燒錄”,所有過(guò)程將會(huì)自動(dòng)完成。燒錄結(jié)束后會(huì)有提示,并且自動(dòng)記錄一份工作信息表,包括工作時(shí)間、語(yǔ)音文件數(shù)、錄音總時(shí)間、每一段語(yǔ)音在lSD芯片中的起始地址及結(jié)束地址,其占用時(shí)間等。有了這些數(shù)據(jù),就可以較方便地修改甚至對(duì)某些地方重新錄制。將錄制過(guò)的芯片及各段語(yǔ)音的起始地址表交給其它下位機(jī)程序員,他們就可以利用單片機(jī)DSP控制器來(lái)隨心所欲地開(kāi)發(fā)相應(yīng)的語(yǔ)音提示設(shè)備了。

4 -F位機(jī)軟硬件

下位機(jī)硬件應(yīng)包括信號(hào)調(diào)理部分和數(shù)據(jù)通信部分,前者將信號(hào)電平調(diào)整到lSD芯片允許的最優(yōu)的范圍,后者接收計(jì)算機(jī)發(fā)來(lái)的各種控制信息,如“開(kāi)始燒錄”信號(hào)、“段間停止”信號(hào)、“返回結(jié)束地址”信號(hào)、“放音試音”信號(hào),通過(guò)編程器的微控制器完成所需任務(wù)。

下位機(jī)硬件框圖設(shè)計(jì)如圖2。

優(yōu)化lSD系列語(yǔ)音芯片的開(kāi)發(fā)平臺(tái)設(shè)計(jì)方案介紹

其中MAX232是電平轉(zhuǎn)換芯片,它使計(jì)算機(jī)通過(guò)符合RS232協(xié)議的串口和符合TYL電平的單片機(jī)直接通信。準(zhǔn)備錄制時(shí),電腦通過(guò)串口發(fā)出握手信號(hào)給單片機(jī),單片機(jī)接到該信號(hào)作出響應(yīng),計(jì)算機(jī)接到該回答后將錄音首地址發(fā)送給單片機(jī),同時(shí)放音控件開(kāi)始放音,信號(hào)由音頻線輸入到燒錄器的信號(hào)接收端,經(jīng)信號(hào)調(diào)整電路接至lSD芯片的錄音管腳。單片機(jī)接到首地址后立刻發(fā)控制信息給1SD芯片,通知其開(kāi)始錄音。這樣,就在上位機(jī)的協(xié)調(diào)下語(yǔ)音自動(dòng)地?zé)浀搅诵酒?。?dāng)該段語(yǔ)音錄制完畢后,上位機(jī)發(fā)語(yǔ)音段結(jié)束信號(hào),同時(shí)停止放音,單片機(jī)接收到該信號(hào)后,停止錄音并讀出結(jié)束地址,將其送回上位機(jī)。上位機(jī)讀人該地址將其寫入地址表以備查詢。如果還有待錄語(yǔ)音段的話,在上一語(yǔ)段的結(jié)束地址的基礎(chǔ)上加1,作為新一段的開(kāi)始地址,重復(fù)上述過(guò)程直至錄音完畢。全部語(yǔ)音錄制完畢后,上位機(jī)作出提示,讓你選擇放音按鍵,以測(cè)試錄音效果。當(dāng)按下該鍵時(shí),上位機(jī)quot;依次放音“命令給單片機(jī),單片機(jī)通知lSD芯片開(kāi)始放音,ISD通過(guò)放音管腳將語(yǔ)音信號(hào)輸出,經(jīng)過(guò)功放芯片TDA2822M將功率放大后,通過(guò)揚(yáng)聲器發(fā)聲,就可一段段地將剛錄制的語(yǔ)音放出來(lái)。如有什么地方不滿意,可通過(guò)地址表查出該段首地址,單獨(dú)選擇該段語(yǔ)音,將其首地址輸入”起始地址“框,點(diǎn)擊”開(kāi)始錄音“就可將該段語(yǔ)音重新錄制一遍。

優(yōu)化lSD系列語(yǔ)音芯片的開(kāi)發(fā)平臺(tái)設(shè)計(jì)方案介紹

5上位機(jī)軟件

語(yǔ)音編輯軟件采用CoolEdit,它包含高品質(zhì)的數(shù)字效果組件,可在任何聲卡上進(jìn)行64軌混音。上位機(jī)運(yùn)行環(huán)境用可視化的編程軟件Visual C++6.0來(lái)開(kāi)發(fā)。

上位機(jī)運(yùn)行軟件應(yīng)有以下功能

(1)通信功能。因?yàn)樯衔粰C(jī)必須發(fā)控制信號(hào)以及起始地址數(shù)據(jù)給下位機(jī),而下位機(jī)也要發(fā)應(yīng)答信號(hào)及結(jié)束地址數(shù)據(jù)給上位機(jī),故該通信為雙向通信。在此采用MSComm控件。使用串口通信控件進(jìn)行通信,必須首先對(duì)串口進(jìn)行初始化。初始化后,就可以調(diào)用MSComm控件的SetOutput()和Getlnput()函數(shù)來(lái)對(duì)串口進(jìn)行讀寫了,具體的使用方法在微軟的開(kāi)發(fā)手冊(cè)

MSDN中有詳細(xì)介紹。

(2)放音控制功能。上位機(jī)必須有放音控制功能,以便根據(jù)需要來(lái)開(kāi)始、停止聲卡放音。并且因?yàn)樾枰绦蜃詣?dòng)地控制,所以要求放音與停止放音能由VC命令語(yǔ)句來(lái)編程控制,在此采用CActiveMovie3控件。ActiveMovie不僅是一個(gè)播放器,同時(shí)也是ActiveX套件中的一個(gè)控件,它可以用來(lái)播放媒體文件,它支持絕大部分目前通用的媒體格式,它可以播放Wave,Midi,Avi,MPEG,QuickTime Movie等格式文件,甚至還可以用它來(lái)看視盤節(jié)目。由于它還是個(gè)控件,所以可以在VB或VC的程序中調(diào)用它。對(duì)它的操作相當(dāng)簡(jiǎn)單,只需提供要播放的文件名就可以用Run,Pause,Stop方法來(lái)播放、暫停和停止該媒體文件。

(3)保存數(shù)據(jù)功能。需要將各種工作信息(尤其是起始地址信息)保存到一個(gè)文本文件,以供查詢。保存數(shù)據(jù)比較簡(jiǎn)單,直接調(diào)用現(xiàn)有的函數(shù)即可。

6總結(jié)

文中針對(duì)當(dāng)前使用lSD系列語(yǔ)音芯片中存在的問(wèn)題,提出并設(shè)計(jì)了一種開(kāi)發(fā)ISD系列芯片的平臺(tái),它可方便地對(duì)聲音信號(hào)進(jìn)行編輯處理,選好待錄信號(hào)后可自動(dòng)地將這些語(yǔ)音段錄入1SD芯片,燒錄過(guò)程中以直觀形式顯示進(jìn)度,完畢后以文本文件的方式給出每個(gè)語(yǔ)音段的起始地址和結(jié)束地址,方便利用該芯片做相應(yīng)的語(yǔ)音提示或其它電路,因此具有較大的實(shí)用意義。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 芯片
    +關(guān)注

    關(guān)注

    456

    文章

    51140

    瀏覽量

    426130
  • 存儲(chǔ)器
    +關(guān)注

    關(guān)注

    38

    文章

    7527

    瀏覽量

    164168
  • 計(jì)算機(jī)
    +關(guān)注

    關(guān)注

    19

    文章

    7532

    瀏覽量

    88423
收藏 人收藏

    評(píng)論

    相關(guān)推薦

    NV512H語(yǔ)音芯片賦能加濕器方案,集語(yǔ)音播報(bào)+平臺(tái)自定義語(yǔ)音功能

    在秋冬季節(jié),天氣逐漸轉(zhuǎn)涼,空氣變得干燥,加濕器成為了許多家庭和辦公場(chǎng)所不可或缺的電器設(shè)備。NV512H語(yǔ)音芯片賦能的加濕器方案,不僅提升了加濕器的智能化水平,更在用戶體驗(yàn)上實(shí)現(xiàn)了質(zhì)的飛躍
    的頭像 發(fā)表于 12-26 13:35 ?140次閱讀
    NV512H<b class='flag-5'>語(yǔ)音</b><b class='flag-5'>芯片</b>賦能加濕器<b class='flag-5'>方案</b>,集<b class='flag-5'>語(yǔ)音</b>播報(bào)+<b class='flag-5'>平臺(tái)</b>自定義<b class='flag-5'>語(yǔ)音</b>功能

    Flash語(yǔ)音芯片相比OTP語(yǔ)音芯片的優(yōu)勢(shì)

    Flash語(yǔ)音芯片和OTP語(yǔ)音芯片是兩種常見(jiàn)的語(yǔ)音解決方案,在各自的應(yīng)用領(lǐng)域中發(fā)揮著重要作用。本
    的頭像 發(fā)表于 12-16 16:02 ?164次閱讀
    Flash<b class='flag-5'>語(yǔ)音</b><b class='flag-5'>芯片</b>相比OTP<b class='flag-5'>語(yǔ)音</b><b class='flag-5'>芯片</b>的優(yōu)勢(shì)

    Flash語(yǔ)音芯片相比OTP語(yǔ)音芯片的優(yōu)勢(shì)

    Flash語(yǔ)音芯片和OTP語(yǔ)音芯片是兩種常見(jiàn)的語(yǔ)音解決方案,在各自的應(yīng)用領(lǐng)域中發(fā)揮著重要作用。本
    的頭像 發(fā)表于 12-16 15:44 ?164次閱讀

    NRK3502系列芯片 | 制氧機(jī)離線語(yǔ)音識(shí)別方案

    NRK3502芯片制氧機(jī)離線語(yǔ)音識(shí)別方案制氧機(jī)離線語(yǔ)音識(shí)別方案是基于NRK3502藍(lán)牙雙模智能語(yǔ)音
    的頭像 發(fā)表于 12-04 01:02 ?187次閱讀
    NRK3502<b class='flag-5'>系列</b><b class='flag-5'>芯片</b> | 制氧機(jī)離線<b class='flag-5'>語(yǔ)音</b>識(shí)別<b class='flag-5'>方案</b>

    九芯語(yǔ)音合成芯片NVH-FLASH,看這一篇足矣!

    平臺(tái)可以直接在線生成播報(bào)語(yǔ)音,并支持一鍵燒錄至芯片中,極大地簡(jiǎn)化了開(kāi)發(fā)流程,縮短了產(chǎn)品上市周期。一、芯片
    的頭像 發(fā)表于 11-21 01:01 ?229次閱讀
    九芯<b class='flag-5'>語(yǔ)音</b>合成<b class='flag-5'>芯片</b>NVH-FLASH,看這一篇足矣!

    離線語(yǔ)音識(shí)別芯片,讓您的產(chǎn)品“聽(tīng)懂會(huì)說(shuō)”

    產(chǎn)品介紹NRK3502系列芯片是九芯電子新推出的一款藍(lán)牙雙模智能語(yǔ)音IoT芯片。芯片集成32位C
    的頭像 發(fā)表于 11-17 01:01 ?271次閱讀
    離線<b class='flag-5'>語(yǔ)音</b>識(shí)別<b class='flag-5'>芯片</b>,讓您的產(chǎn)品“聽(tīng)懂會(huì)說(shuō)”

    WTN6040FP-14S語(yǔ)音芯片在電梯控制板中的應(yīng)用開(kāi)發(fā)方案-實(shí)現(xiàn)樓層指引背景音樂(lè)播放功能

    環(huán)境,提高運(yùn)行效率,本文將介紹一種基于WTN6040FP-14S語(yǔ)音芯片的電梯控制板開(kāi)發(fā)方案。該方案
    的頭像 發(fā)表于 11-12 14:16 ?207次閱讀

    NVH-FLASH語(yǔ)音芯片支持平臺(tái)語(yǔ)音—打造音頻IC技術(shù)革新

    與靈活的支持平臺(tái),正逐步引領(lǐng)著音頻設(shè)備向更高品質(zhì)、更智能化方向發(fā)展。一、NVH-FLASH系列語(yǔ)音芯片概述NVH-FLASH系列
    的頭像 發(fā)表于 10-16 08:02 ?244次閱讀
    NVH-FLASH<b class='flag-5'>語(yǔ)音</b><b class='flag-5'>芯片</b>支持<b class='flag-5'>平臺(tái)</b>做<b class='flag-5'>語(yǔ)音</b>—打造音頻IC技術(shù)革新

    智能密碼、指紋鎖語(yǔ)音芯片ic方案 可存放40s語(yǔ)音內(nèi)容 NVD語(yǔ)音芯片

    隨著科技的飛速發(fā)展,智能家居安全領(lǐng)域迎來(lái)了前所未有的變革。智能密碼與指紋鎖作為現(xiàn)代家庭安全防護(hù)的重要一環(huán),其背后的語(yǔ)音芯片IC開(kāi)發(fā)更是這一變革中的關(guān)鍵技術(shù)突破。智能密碼、指紋鎖語(yǔ)音
    的頭像 發(fā)表于 09-25 08:01 ?318次閱讀
    智能密碼、指紋鎖<b class='flag-5'>語(yǔ)音</b><b class='flag-5'>芯片</b>ic<b class='flag-5'>方案</b> 可存放40s<b class='flag-5'>語(yǔ)音</b>內(nèi)容 NVD<b class='flag-5'>語(yǔ)音</b><b class='flag-5'>芯片</b>

    WTK6900芯片離線風(fēng)扇語(yǔ)音控制方案,自適應(yīng)降噪|精準(zhǔn)識(shí)別,靜享科技生活!

    開(kāi)發(fā)背景在這個(gè)智能家居時(shí)代,我們重新定義了“清涼”的含義。唯創(chuàng)知音作為智能語(yǔ)音識(shí)別領(lǐng)域的領(lǐng)航者,推出搭載WTK6900系列芯片的智能風(fēng)扇解決方案
    的頭像 發(fā)表于 07-27 08:37 ?397次閱讀
    WTK6900<b class='flag-5'>芯片</b>離線風(fēng)扇<b class='flag-5'>語(yǔ)音</b>控制<b class='flag-5'>方案</b>,自適應(yīng)降噪|精準(zhǔn)識(shí)別,靜享科技生活!

    深圳晶鑫微電子:引領(lǐng)智能語(yǔ)音芯片新紀(jì)元

    智能語(yǔ)音IC開(kāi)發(fā),智能語(yǔ)音芯片方案
    的頭像 發(fā)表于 04-28 10:33 ?429次閱讀

    電動(dòng)車充電語(yǔ)音提示芯片-充電柜OTP語(yǔ)音方案開(kāi)發(fā)

    語(yǔ)音解決方案:otp智能語(yǔ)音升級(jí)方案開(kāi)發(fā)
    的頭像 發(fā)表于 04-15 10:18 ?584次閱讀

    語(yǔ)音IC-智能語(yǔ)音芯片方案-您身邊的智選升級(jí)

    語(yǔ)音IC方案開(kāi)發(fā)-智能語(yǔ)音升級(jí)OTP開(kāi)發(fā)應(yīng)用場(chǎng)景
    的頭像 發(fā)表于 04-12 17:00 ?523次閱讀

    基于唯創(chuàng)語(yǔ)音芯片的三大煙霧報(bào)警器語(yǔ)音方案

    在智能設(shè)備與物聯(lián)網(wǎng)(IoT)技術(shù)的飛速發(fā)展中,語(yǔ)音播報(bào)功能的重要性日益凸顯,已成為提升用戶體驗(yàn)、實(shí)現(xiàn)人機(jī)交互的關(guān)鍵一環(huán)。本文將深入探討三種創(chuàng)新性語(yǔ)音播報(bào)系統(tǒng)設(shè)計(jì)方案:傳統(tǒng)方案——獨(dú)立的
    的頭像 發(fā)表于 04-12 15:08 ?451次閱讀
    基于唯創(chuàng)<b class='flag-5'>語(yǔ)音</b><b class='flag-5'>芯片</b>的三大煙霧報(bào)警器<b class='flag-5'>語(yǔ)音</b><b class='flag-5'>方案</b>

    OTP語(yǔ)音芯片-語(yǔ)音IC智能升級(jí)方案

    OTP語(yǔ)音方案開(kāi)發(fā)
    的頭像 發(fā)表于 04-10 12:40 ?548次閱讀