0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

HarmonyOS開發(fā)-語音識(shí)別

鴻蒙時(shí)代 ? 來源:鴻蒙時(shí)代 ? 作者:鴻蒙時(shí)代 ? 2022-03-22 09:34 ? 次閱讀

1.在使用語音識(shí)別API時(shí),將實(shí)現(xiàn)ASR的相關(guān)的類添加至工程。
// 提供ASR引擎執(zhí)行時(shí)所需要傳入的參數(shù)
import ohos.ai.asr.AsrIntent;
// 錯(cuò)誤碼的定義類
import ohos.ai.asr.util.AsrError;
// 加載語音識(shí)別Listener
import ohos.ai.asr.AsrListener;
// 提供調(diào)用ASR引擎服務(wù)接口的類
import ohos.ai.asr.AsrClient;
// ASR回調(diào)結(jié)果中的關(guān)鍵字封裝類
import ohos.ai.asr.util.AsrResultKey;
2.調(diào)用API接口。
創(chuàng)建一個(gè)AsrClient對(duì)象。context為應(yīng)用上下文信息,應(yīng)為ohos.aafwk.ability.Ability或ohos.aafwk.ability.AbilitySlice的實(shí)例或子類實(shí)例。

AsrClient asrClient = AsrClient.createAsrClient(context).orElse(null);

3.設(shè)置引擎參數(shù)。如果希望識(shí)別文件,音頻文件需滿足約束與限制,并設(shè)置音頻類型為“ASR_SRC_TYPE_FILE”;如果希望識(shí)別音頻流,則設(shè)置音頻類型為“ASR_SRC_TYPE_PCM”。

AsrIntent initIntent = new AsrIntent();
initIntent.setAudioSourceType(AsrIntent.AsrAudioSrcType.ASR_SRC_TYPE_PCM);

4.初始化ASR服務(wù)。其中,mMyAsrListener為實(shí)現(xiàn)了AsrListener接口的實(shí)例對(duì)象。

asrClient.init(initIntent, mMyAsrListener);

5.開始識(shí)別。用戶可以不設(shè)置參數(shù),使用默認(rèn)參數(shù)。

AsrIntent asrIntent = new AsrIntent();
// 設(shè)置后置的端點(diǎn)檢測(cè)(VAD)時(shí)間
asrIntent.setVadEndWaitMs(2000);
// 設(shè)置前置的端點(diǎn)檢測(cè)(VAD)時(shí)間
asrIntent.setVadFrontWaitMs(4800);
// 設(shè)置語音識(shí)別的超時(shí)時(shí)間
asrIntent.setTimeoutThresholdMs(20000);
asrClient.startListening(asrIntent);
// buffer需要替換為真實(shí)的音頻數(shù)據(jù)
byte[] buffer = new byte[]{0, 1, 0, 10, 1};
// 對(duì)于長度大于1280的音頻,需要多次調(diào)用writePcm分段傳輸
asrClient.writePcm(buffer, 1280);

需要注意的是,startListening或writePcm方法建議放在mMyAsrListener中onInit()方法內(nèi)調(diào)用,保證初始化引擎成功之后再調(diào)用識(shí)別接口。如果希望識(shí)別音頻文件,則不需要調(diào)用writePcm接口。
AsrIntent asrIntent = new AsrIntent();
// 將FilePath修改為正確的地址,且文件路徑需要給com.huawei.hiai進(jìn)程授予可訪問權(quán)限。
asrIntent.setFilePath("FilePath");
asrClient.startListening(asrIntent);
6.取消或停止識(shí)別。

asrClient.stopListening(); // 停止識(shí)別
asrClient.cancel(); // 取消識(shí)別

7.釋放引擎。
asrClient.destroy();


審核編輯:湯梓紅

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 開發(fā)
    +關(guān)注

    關(guān)注

    0

    文章

    370

    瀏覽量

    40879
  • 語音識(shí)別
    +關(guān)注

    關(guān)注

    38

    文章

    1742

    瀏覽量

    112755
  • HarmonyOS
    +關(guān)注

    關(guān)注

    79

    文章

    1980

    瀏覽量

    30338
收藏 人收藏

    評(píng)論

    相關(guān)推薦

    HarmonyOS NEXT 應(yīng)用開發(fā)練習(xí):AI智能語音播報(bào)

    一、DEMO思路 在這個(gè)HarmonyOS NEXT原生應(yīng)用DEMO中,我們將使用ArkTS開發(fā)語言創(chuàng)建一個(gè)簡單的AI智能語音播報(bào)應(yīng)用。 該應(yīng)用能夠接收用戶輸入的文本,并使用TTS
    發(fā)表于 01-06 15:33

    【「嵌入式系統(tǒng)設(shè)計(jì)與實(shí)現(xiàn)」閱讀體驗(yàn)】+ 基于語音識(shí)別的智能杯墊

    語音命令Q 識(shí)別,適用于智能家居控制、玩具、人機(jī)交互等多個(gè)領(lǐng)域。該模塊以其高識(shí)別率、低功耗和易于集成的特點(diǎn)受到廣大開發(fā)者的青睞。 主要技術(shù)及功能有: 磁力攪拌、重量采集、
    發(fā)表于 01-02 18:15

    HarmonyOS開發(fā)指導(dǎo)類文檔更新速遞(下)

    伴隨著HarmonyOS 5.0.0 Release、HarmonyOS 5.0.1 Release版本的發(fā)布,HarmonyOS官網(wǎng)文檔也帶來了不少上新內(nèi)容。本期HarmonyOS
    的頭像 發(fā)表于 12-30 09:54 ?172次閱讀
    <b class='flag-5'>HarmonyOS</b><b class='flag-5'>開發(fā)</b>指導(dǎo)類文檔更新速遞(下)

    語音識(shí)別與自然語言處理的關(guān)系

    在人工智能的快速發(fā)展中,語音識(shí)別和自然語言處理(NLP)成為了兩個(gè)重要的技術(shù)支柱。語音識(shí)別技術(shù)使得機(jī)器能夠理解人類的語音,而自然語言處理則讓
    的頭像 發(fā)表于 11-26 09:21 ?509次閱讀

    語音識(shí)別技術(shù)的應(yīng)用與發(fā)展

    語音識(shí)別技術(shù)的發(fā)展可以追溯到20世紀(jì)50年代,但直到近年來,隨著計(jì)算能力的提升和機(jī)器學(xué)習(xí)技術(shù)的進(jìn)步,這項(xiàng)技術(shù)才真正成熟并廣泛應(yīng)用于各個(gè)領(lǐng)域。語音識(shí)別技術(shù)的應(yīng)用不僅提高了工作效率,也極大
    的頭像 發(fā)表于 11-26 09:20 ?601次閱讀

    ASR與傳統(tǒng)語音識(shí)別的區(qū)別

    ASR(Automatic Speech Recognition,自動(dòng)語音識(shí)別)與傳統(tǒng)語音識(shí)別在多個(gè)方面存在顯著的區(qū)別。以下是對(duì)這兩者的對(duì)比: 一、技術(shù)基礎(chǔ) ASR : 基于深度學(xué)習(xí)算
    的頭像 發(fā)表于 11-18 15:22 ?565次閱讀

    ASR語音識(shí)別技術(shù)應(yīng)用

    ASR(Automatic Speech Recognition)語音識(shí)別技術(shù),是計(jì)算機(jī)科學(xué)與人工智能領(lǐng)域的重要突破,能將人類語音轉(zhuǎn)換為文本,廣泛應(yīng)用于智能家居、醫(yī)療、交通等多個(gè)領(lǐng)域。以下是對(duì)ASR
    的頭像 發(fā)表于 11-18 15:12 ?904次閱讀

    物聯(lián)網(wǎng)系統(tǒng)智能控制產(chǎn)品的語音識(shí)別方案_離線語音識(shí)別芯片分析

    01 物聯(lián)網(wǎng)系統(tǒng)中為什么要使用離線語音識(shí)別芯片 物聯(lián)網(wǎng)系統(tǒng)中使用離線語音識(shí)別芯片的原因主要基于以下幾個(gè)方面: 1、實(shí)時(shí)性與可靠性 實(shí)時(shí)性好:離線語音
    的頭像 發(fā)表于 09-26 17:56 ?711次閱讀
    物聯(lián)網(wǎng)系統(tǒng)智能控制產(chǎn)品的<b class='flag-5'>語音</b><b class='flag-5'>識(shí)別</b>方案_離線<b class='flag-5'>語音</b><b class='flag-5'>識(shí)別</b>芯片分析

    WTK6900FC語音識(shí)別模塊

    語音識(shí)別
    WT-深圳唯創(chuàng)知音電子有限公司
    發(fā)布于 :2024年09月25日 17:35:07

    唯創(chuàng)知音WT2605C用在離在線語音識(shí)別方案# #語音芯片 #語音識(shí)別 #唯創(chuàng)知音

    語音識(shí)別
    WT-深圳唯創(chuàng)知音電子有限公司
    發(fā)布于 :2024年09月12日 17:24:28

    什么是離線語音識(shí)別芯片?與在線語音識(shí)別的區(qū)別

    離線語音識(shí)別芯片適用于智能家電等,特點(diǎn)為小詞匯量、低成本、安全性高、響應(yīng)快,無需聯(lián)網(wǎng)。在線語音識(shí)別功能更廣泛、識(shí)別準(zhǔn)確率高,但依賴穩(wěn)定網(wǎng)絡(luò)。
    的頭像 發(fā)表于 07-22 11:33 ?438次閱讀

    車載語音識(shí)別系統(tǒng)語音數(shù)據(jù)采集標(biāo)注案例

    車載語音識(shí)別系統(tǒng)是指利用機(jī)器學(xué)習(xí)算法實(shí)現(xiàn)的一種自然語言處理技術(shù),載語音識(shí)別系統(tǒng)通過辨別聲音的語調(diào)、語速和音量,將所聽到的語音轉(zhuǎn)化成可讀取的語
    的頭像 發(fā)表于 06-19 15:52 ?386次閱讀
    車載<b class='flag-5'>語音</b><b class='flag-5'>識(shí)別</b>系統(tǒng)<b class='flag-5'>語音</b>數(shù)據(jù)采集標(biāo)注案例

    【基于存內(nèi)計(jì)算芯片開發(fā)板驗(yàn)證語音識(shí)別】訓(xùn)練手冊(cè)

    本教程展現(xiàn)語音識(shí)別算法在WTM2101開發(fā)板上從訓(xùn)練到部署的全流程,包括實(shí)驗(yàn)環(huán)境搭建,語音數(shù)據(jù)集以及算法模型轉(zhuǎn)換燒錄。
    的頭像 發(fā)表于 05-16 14:49 ?687次閱讀
    【基于存內(nèi)計(jì)算芯片<b class='flag-5'>開發(fā)</b>板驗(yàn)證<b class='flag-5'>語音</b><b class='flag-5'>識(shí)別</b>】訓(xùn)練手冊(cè)

    語音識(shí)別的技術(shù)歷程及工作原理

    語音識(shí)別的本質(zhì)是一種基于語音特征參數(shù)的模式識(shí)別,即通過學(xué)習(xí),系統(tǒng)能夠把輸入的語音按一定模式進(jìn)行分類,進(jìn)而依據(jù)判定準(zhǔn)則找出最佳匹配結(jié)果。
    的頭像 發(fā)表于 03-22 16:58 ?3463次閱讀
    <b class='flag-5'>語音</b><b class='flag-5'>識(shí)別</b>的技術(shù)歷程及工作原理

    恩智浦發(fā)布新一代智能語音技術(shù)組合的語音識(shí)別引擎

    恩智浦發(fā)布新一代智能語音技術(shù)組合的語音識(shí)別引擎。本文將探討開發(fā)人員在嵌入式語音控制設(shè)計(jì)中面臨的挑戰(zhàn)、恩智浦新的Speech to Inten
    的頭像 發(fā)表于 01-26 09:15 ?791次閱讀
    恩智浦發(fā)布新一代智能<b class='flag-5'>語音</b>技術(shù)組合的<b class='flag-5'>語音</b><b class='flag-5'>識(shí)別</b>引擎