0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
电子发烧友
开通电子发烧友VIP会员 尊享10大特权
海量资料免费下载
精品直播免费看
优质内容免费畅学
课程9折专享价
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

關(guān)于語音識別在人工智能時(shí)代作用和分析介紹

英特爾物聯(lián)網(wǎng) ? 來源:djl ? 2019-09-11 10:39 ? 次閱讀

智能時(shí)代,語音識別

神經(jīng)網(wǎng)絡(luò),深度學(xué)習(xí)

語音識別技術(shù)方便于長輩們?nèi)谌牒A繑?shù)據(jù)的互聯(lián)網(wǎng)時(shí)代,成為長輩們與外界交流的一大利器。不過,千萬不要認(rèn)為在未來人工智能時(shí)代中的語音識別僅僅是單純運(yùn)用到手機(jī)聊天中的識別錄入文字。語音識別技術(shù)隨著深度學(xué)習(xí)及高性能計(jì)算的不斷發(fā)展,正逐漸從實(shí)驗(yàn)室邁向工業(yè)領(lǐng)域。

語音識別簡史

1952年,美國AT&T貝爾實(shí)驗(yàn)室開發(fā)出了第一個(gè)基于電子計(jì)算機(jī)的語音識別系統(tǒng)Audrey,其可以識別10個(gè)英文數(shù)字,準(zhǔn)確率為98%;進(jìn)入60年代,語音識別領(lǐng)域的兩大突破是線性預(yù)測編碼,以及動態(tài)時(shí)間規(guī)整技術(shù);

在60年代后期,隱馬爾可夫模型被Leonard E. Baum等人提出,HMM的提出是語音識別歷史上的一個(gè)重大突破,使當(dāng)時(shí)語音識別的錯(cuò)誤率大大降低;李開復(fù)等人則在1988年第一次實(shí)現(xiàn)了基于HMM的大詞匯量語音識別系統(tǒng)Sphinx。

另一方面,早在上世紀(jì)80年代,人工神經(jīng)網(wǎng)絡(luò)已經(jīng)被引入語音識別。起初人工神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu)多為簡單的多層感知機(jī),但受限于當(dāng)時(shí)的計(jì)算能力以及語音數(shù)據(jù)的稀少,人工神經(jīng)網(wǎng)絡(luò)并沒有在識別率上帶來很大的提升。

近年來,隨著計(jì)算能力的提升和語音數(shù)據(jù)的增加,神經(jīng)網(wǎng)絡(luò)被廣泛應(yīng)用于語音識別任務(wù)中。深度神經(jīng)網(wǎng)絡(luò)技術(shù)的出現(xiàn),也進(jìn)一步提高了大規(guī)模連續(xù)語音識別的性能,目前已經(jīng)成為學(xué)術(shù)界和工業(yè)界研究的熱點(diǎn)內(nèi)容之一。

語音識別的技術(shù)支持

目前,在語音識別領(lǐng)域廣泛采用的神經(jīng)網(wǎng)絡(luò)有時(shí)延神經(jīng)網(wǎng)絡(luò)、深度神經(jīng)網(wǎng)絡(luò)、卷積神經(jīng)網(wǎng)絡(luò)、遞歸神經(jīng)網(wǎng)絡(luò)以及基于長短期記憶的RNN等。

通常將這些深度神經(jīng)網(wǎng)絡(luò)模型與HMM模型結(jié)合構(gòu)建完整的聲學(xué)模型,并結(jié)合語言模型等提升語音識別性能。

在語言模型方面,雖然傳統(tǒng)的N元模型一直是主流技術(shù),但基于神經(jīng)網(wǎng)絡(luò)的語言模型從2012年開始被較為廣泛的研究,如RNN-LM、LSTM-LM等。

鑒于基于神經(jīng)網(wǎng)絡(luò)的語言模型的計(jì)算量較大,一般先利用N元模型初始化,然后再用基于神經(jīng)網(wǎng)絡(luò)的語言模型重打分,即神經(jīng)網(wǎng)絡(luò)語言模型并不直接用于解碼,而是在基線系統(tǒng)解碼結(jié)果的基礎(chǔ)上進(jìn)行得分重估。

同時(shí),RNN-CTC的出現(xiàn)使得語音識別擺脫了傳統(tǒng)方法中聲學(xué)模型、語言模型、解碼器等模塊化的束縛,通過采用對輸入輸出序列直接建模的方法,只需訓(xùn)練一個(gè)神經(jīng)網(wǎng)絡(luò)模型即可進(jìn)行識別,因此被稱為端到端語音識別。

端到端的模型可以解決傳統(tǒng)方法中各個(gè)模型訓(xùn)練目標(biāo)不一致的問題。另外,由于實(shí)際中可獲取的文本數(shù)據(jù)比語音數(shù)據(jù)多得多,所以往往還會用文本數(shù)據(jù)訓(xùn)練一個(gè)更好的語言模型,與CTC神經(jīng)網(wǎng)絡(luò)結(jié)合使用。

深度神經(jīng)網(wǎng)絡(luò)用于人工智能應(yīng)用的問題在于其實(shí)時(shí)率等性能指標(biāo)還需有待提高,但是端到端語音識別開辟了人工智能的一個(gè)新方向,而且訓(xùn)練的過程相對簡單,因此人工智能方向上的端到端識別將會是未來的技術(shù)趨勢之一。此外人工智能再進(jìn)一步改進(jìn)網(wǎng)絡(luò)結(jié)構(gòu)、改進(jìn)訓(xùn)練方法,逐步使人工智能性能達(dá)到工業(yè)水平和要求,進(jìn)入商用階段指日可待。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報(bào)投訴
  • 神經(jīng)網(wǎng)絡(luò)

    關(guān)注

    42

    文章

    4785

    瀏覽量

    101284
  • 語音識別
    +關(guān)注

    關(guān)注

    38

    文章

    1746

    瀏覽量

    113019
  • 人工智能
    +關(guān)注

    關(guān)注

    1797

    文章

    47899

    瀏覽量

    240918
收藏 0人收藏

    評論

    相關(guān)推薦

    標(biāo)貝智能語音識別在智能會議場景中的落地案例

    標(biāo)貝科技專注智能語音交互領(lǐng)域多年,在語音識別語音合成領(lǐng)域有著多項(xiàng)大型企業(yè)合作案例,標(biāo)貝與多個(gè)智能
    的頭像 發(fā)表于 12-20 10:31 ?353次閱讀
    標(biāo)貝<b class='flag-5'>智能</b><b class='flag-5'>語音</b><b class='flag-5'>識別在</b><b class='flag-5'>智能</b>會議場景中的落地案例

    嵌入式和人工智能究竟是什么關(guān)系?

    人工智能的結(jié)合,無疑是科技發(fā)展中的一場革命。在人工智能硬件加速中,嵌入式系統(tǒng)以其獨(dú)特的優(yōu)勢和重要性,發(fā)揮著不可或缺的作用。通過深度學(xué)習(xí)和神經(jīng)網(wǎng)絡(luò)等算法,嵌入式系統(tǒng)能夠高效地處理大量數(shù)據(jù),從而實(shí)現(xiàn)
    發(fā)表于 11-14 16:39

    《AI for Science:人工智能驅(qū)動科學(xué)創(chuàng)新》第6章人AI與能源科學(xué)讀后感

    探討了人工智能如何通過技術(shù)創(chuàng)新推動能源科學(xué)的進(jìn)步,為未來的可持續(xù)發(fā)展提供了強(qiáng)大的支持。 首先,書中通過深入淺出的語言,介紹人工智能在能源領(lǐng)域的基本概念和技術(shù)原理。這使得我對人工智能
    發(fā)表于 10-14 09:27

    AI for Science:人工智能驅(qū)動科學(xué)創(chuàng)新》第4章-AI與生命科學(xué)讀后感

    很幸運(yùn)社區(qū)給我一個(gè)閱讀此書的機(jī)會,感謝平臺。 《AI for Science:人工智能驅(qū)動科學(xué)創(chuàng)新》第4章關(guān)于AI與生命科學(xué)的部分,為我們揭示了人工智能技術(shù)在生命科學(xué)領(lǐng)域中的廣泛應(yīng)用和深遠(yuǎn)影響。在
    發(fā)表于 10-14 09:21

    《AI for Science:人工智能驅(qū)動科學(xué)創(chuàng)新》第一章人工智能驅(qū)動的科學(xué)創(chuàng)新學(xué)習(xí)心得

    人工智能:科學(xué)研究的加速器 第一章清晰地闡述了人工智能作為科學(xué)研究工具的強(qiáng)大功能。通過機(jī)器學(xué)習(xí)、深度學(xué)習(xí)等先進(jìn)技術(shù),AI能夠處理和分析海量數(shù)據(jù),發(fā)現(xiàn)傳統(tǒng)方法難以捕捉的模式和規(guī)律。這不僅極大地提高了數(shù)據(jù)處理
    發(fā)表于 10-14 09:12

    risc-v在人工智能圖像處理應(yīng)用前景分析

    RISC-V在人工智能圖像處理領(lǐng)域的應(yīng)用前景十分廣闊,這主要得益于其開源性、靈活性和低功耗等特點(diǎn)。以下是對RISC-V在人工智能圖像處理應(yīng)用前景的詳細(xì)分析: 一、RISC-V的基本特點(diǎn) RISC-V
    發(fā)表于 09-28 11:00

    人工智能ai 數(shù)電 模電 模擬集成電路原理 電路分析

    人工智能ai 數(shù)電 模電 模擬集成電路原理 電路分析 想問下哪些比較容易學(xué) 不過好像都是要學(xué)的
    發(fā)表于 09-26 15:24

    名單公布!【書籍評測活動NO.44】AI for Science:人工智能驅(qū)動科學(xué)創(chuàng)新

    活的世界? 編輯推薦 《AI for Science:人工智能驅(qū)動科學(xué)創(chuàng)新》聚焦于人工智能與材料科學(xué)、生命科學(xué)、電子科學(xué)、能源科學(xué)、環(huán)境科學(xué)五大領(lǐng)域的交叉融合,通過深入淺出的語言和諸多實(shí)際應(yīng)用案例,介紹
    發(fā)表于 09-09 13:54

    FPGA在人工智能中的應(yīng)用有哪些?

    FPGA(現(xiàn)場可編程門陣列)在人工智能領(lǐng)域的應(yīng)用非常廣泛,主要體現(xiàn)在以下幾個(gè)方面: 一、深度學(xué)習(xí)加速 訓(xùn)練和推理過程加速:FPGA可以用來加速深度學(xué)習(xí)的訓(xùn)練和推理過程。由于其高并行性和低延遲特性
    發(fā)表于 07-29 17:05

    圖像識別屬于人工智能

    屬于。圖像識別人工智能(Artificial Intelligence, AI)領(lǐng)域的一個(gè)重要分支。 一、圖像識別概述 1.1 定義 圖像識別是指利用計(jì)算機(jī)技術(shù)對圖像中的內(nèi)容進(jìn)行
    的頭像 發(fā)表于 07-16 10:44 ?1399次閱讀

    人工智能神經(jīng)網(wǎng)絡(luò)芯片的介紹

    人工智能神經(jīng)網(wǎng)絡(luò)芯片是一類專門為深度學(xué)習(xí)和神經(jīng)網(wǎng)絡(luò)算法設(shè)計(jì)的處理器。它們具有高性能、低功耗、可擴(kuò)展等特點(diǎn),廣泛應(yīng)用于圖像識別語音識別、自然語言處理等領(lǐng)域。以下是
    的頭像 發(fā)表于 07-04 09:33 ?986次閱讀

    人工智能語音識別技術(shù)詳解

    隨著科技的飛速發(fā)展,人工智能(AI)技術(shù)已經(jīng)滲透到我們生活的方方面面,其中語音識別技術(shù)作為AI領(lǐng)域的重要分支,更是以其獨(dú)特的魅力和廣泛的應(yīng)用前景,引起了社會各界的廣泛關(guān)注。本文將詳細(xì)介紹
    的頭像 發(fā)表于 07-01 11:39 ?1717次閱讀

    5G智能物聯(lián)網(wǎng)課程之Aidlux下人工智能開發(fā)(SC171開發(fā)套件V2)

    ://t.elecfans.com/v/27221.html *附件:初學(xué)者完整學(xué)習(xí)流程實(shí)現(xiàn)手寫數(shù)字識別案例_V2-20240506.pdf 人工智能 語音對話機(jī)器人案例 26分03秒 https
    發(fā)表于 05-10 16:46

    5G智能物聯(lián)網(wǎng)課程之Aidlux下人工智能開發(fā)(SC171開發(fā)套件V1)

    *附件:初學(xué)者完整學(xué)習(xí)流程實(shí)現(xiàn)手寫數(shù)字識別案例.pdf 人工智能 語音對話機(jī)器人案例 26分03秒 https://t.elecfans.com/v/27185.html *附件:語音
    發(fā)表于 04-01 10:40

    嵌入式人工智能的就業(yè)方向有哪些?

    嵌入式人工智能的就業(yè)方向有哪些? 在新一輪科技革命與產(chǎn)業(yè)變革的時(shí)代背景下,嵌入式人工智能成為國家新型基礎(chǔ)建設(shè)與傳統(tǒng)產(chǎn)業(yè)升級的核心驅(qū)動力。同時(shí)在此背景驅(qū)動下,眾多名企也紛紛在嵌入式人工智能
    發(fā)表于 02-26 10:17

    電子發(fā)燒友

    中國電子工程師最喜歡的網(wǎng)站

    • 2931785位工程師會員交流學(xué)習(xí)
    • 獲取您個(gè)性化的科技前沿技術(shù)信息
    • 參加活動獲取豐厚的禮品