0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

智能語音創(chuàng)投趨緩 核心技術仍需升級

簡析 ? 來源:電子發(fā)燒友網(wǎng) ? 作者:郭露 ? 2020-01-05 00:01 ? 次閱讀
在人類的感官通道中,視覺占據(jù)最主要的位置,聽覺次之,但在信息傳遞中,聽覺語言的綜合利用率要遠高于視覺符號。因此,更接近于人類本能的交互方式--語音交互受到廣泛關注。目前,隨著智能語音技術的發(fā)展和應用場景的不斷豐富,人機交互方式已經開始從鍵盤、鼠標以及觸摸式的圖形交互,向語音模式轉變,并且隨著搭載量和使用率的提升,未來有望成為人機交互最主要的入口。

底層技術持續(xù)增強

智能語音包含語音識別、語義理解、自然語言生成以及語音合成等環(huán)節(jié)。其中,語音識別是率先商業(yè)化、應用最成熟的人工智能技術之一。根據(jù)信通院數(shù)據(jù),全球智能語音識別錯誤率連續(xù)降低,從2008年的23.6%降低到2017年的5.5%。
與此同時,國內廠商也在不斷刷新準確率的上限。2018年6月,阿里巴巴推出語音識別模型DFSMN,準確率高達96.04%;科大訊飛也在同期宣布訊飛語音識別率提升至98%;2017年11月,百度大腦推出新款語音識別模型--“基于復數(shù)CNN網(wǎng)絡的語音增強和聲學建模一體化的端到端語音識別模型”,打破了傳統(tǒng)遠場語音識別技術的流程,將語音識別準確率提高30%以上。
此外,大數(shù)據(jù)、深度學習、云計算等技術的迅速發(fā)展,也為智能語音提供了底層技術支持。

應用場景豐富多元

在國家大力發(fā)展人工智能產業(yè)的戰(zhàn)略引導下,以及企業(yè)技術能力提升和市場需求不斷擴張的驅動下,智能語音技術在智能家居、車載環(huán)境、在線教育、醫(yī)療、呼叫中心等各個場景均有落地化應用。據(jù)中國電子信息產業(yè)發(fā)展研究院預測,未來三年智能語音市場將保持25%以上的增速,到2021年預計達到194.8億元。
例如,在智能家居方面,語音聲控的應用增強了終端設備控制家居的簡便性、易用性、互動性和娛樂性。目前,眾多參與者以智能音箱作為智能家居語音交互的切入口。例如接入阿里智能家居平臺的天貓精靈、提供智能家居控制入口的小度音箱、連接小米智能家居生態(tài)的小愛智能音箱等等。
再如,在智能車載方面,從安全因素考慮,車載智能語音應用將是未來市場的剛需場景,如媒體娛樂、行車導航、信息查詢、即時通訊等等。2016年11月,科大訊飛發(fā)布智能車載系統(tǒng)飛魚助理,并于2017年11月發(fā)布2.0版本,該系統(tǒng)通過對語音引擎、生態(tài)引擎、云+端服務進行深度整合,并賦予智能人機交互方式,來為用戶提供人臉識別、AI虛擬助手、聲源定位、非全時免喚醒+上下文理解、自定義喚醒詞、XTTS等功能。
另外,在隨身設備方面,隨著設備功能的多元化,人們迫切需求擺脫傳統(tǒng)輸入設備的束縛,以智能手機為例,有關數(shù)據(jù)顯示,到2023年智能手機配備語音交互功能的比例將達到90%以上。并且據(jù)IDC預測,到2020年隨身設備的智能語音滲透率將達到68%??梢?,智能語音擁有豐富的應用場景,滲透率也會不斷提高。
圖:2020年智能語音滲透率預測
數(shù)據(jù)來源:IDC

創(chuàng)業(yè)及資本漸趨理性

智能語音市場參與者主要為科技巨頭及傳統(tǒng)智能語音企業(yè),行業(yè)集中度較高。科技巨頭在語音行業(yè)的布局多為對外開放語音生態(tài)系統(tǒng),對內則在自身產品中實現(xiàn)AI First。例如,百度Dueros開放平臺、阿里AliGenie開發(fā)者平臺、騰訊的智能語音平臺騰訊云小微等等。傳統(tǒng)智能語音企業(yè)已在語音行業(yè)深耕多年,1999年成立的科大訊飛市場占有率已然位列第一,除了面向教育、司法、醫(yī)療、城市等領域推出智能語音解決方案以外,還向硬件方面拓展,推出了翻譯機、學習機、錄音筆等相關產品。
此外,科技巨頭和傳統(tǒng)智能語音企業(yè)出于構建生態(tài)、積累數(shù)據(jù)等方面的考慮,大都提供開放平臺,而初創(chuàng)企業(yè)則可以借此發(fā)揮后發(fā)優(yōu)勢。雖然頭部企業(yè)已經處于絕對優(yōu)勢,但隨著應用場景的豐富,行業(yè)機會仍不斷涌現(xiàn),智能語音初創(chuàng)企業(yè)也吸引了資本市場的關注。據(jù)<華秋創(chuàng)服>不完全統(tǒng)計,2000-2019年,共有55家智能語音方案企業(yè)獲得融資,共計157筆,平均成立1.7年后獲得第一筆融資,獲投企業(yè)主要分布在北京、廣東、上海等地;從時間分布來看,2015年開始進入融資高峰期,2019年有所下降,一定程度上反映了智能語音企業(yè)的創(chuàng)業(yè)熱潮正逐漸趨于理性,市場也越來越重視企業(yè)的核心技術和落地能力。
圖:2000-2019年智能語音方案企業(yè)獲投筆數(shù)
數(shù)據(jù)來源:華秋創(chuàng)服
圖:2000-2019年獲投智能語音方案企業(yè)地區(qū)分布
數(shù)據(jù)來源:華秋創(chuàng)服

市場前景廣闊 技術仍待突破

IDC數(shù)據(jù)顯示,智能語音在我國人工智能市場中的份額占有22%的比重。場景應用的普遍化,促使整個行業(yè)開始從發(fā)展初期向成熟期邁進。雖然科大訊飛、百度等占據(jù)了市場近七成的份額,但是,隨著應用場景的拓寬,整個市場規(guī)模仍會不斷擴大。
不可否認的是,雖然智能語音技術飛速發(fā)展,但在實際應用環(huán)境中,語音信號往往伴隨著環(huán)境噪聲和混響,使得語音識別的性能急劇下降。例如,訊飛中英文語音識別準確率分別達到98%和95%,但在有方言、噪音、口音和遠場情況下,提高語音識別準確率仍有較大的提升空間。再如機器翻譯,雖然實時高效,但距離會議同傳以及高水平翻譯所講究的“信、達、雅”仍存在較大差距??梢?,雖然語音識別等某一技術環(huán)節(jié)已經取得較大發(fā)展,但面對應用場景的復雜性,智能語音技術仍有待突破。
聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 智能語音
    +關注

    關注

    10

    文章

    790

    瀏覽量

    49065
收藏 人收藏

    評論

    相關推薦

    語音芯片新標桿:WTN6系列—以低功耗、高性能賦能智能終端升級

    在萬物互聯(lián)的智能化浪潮中,語音交互正成為人機溝通的核心橋梁。作為智能設備的“聲音中樞”,語音芯片的性能直接影響用戶體驗與產品競爭力。廣州唯
    的頭像 發(fā)表于 03-07 08:30 ?148次閱讀
    <b class='flag-5'>語音</b>芯片新標桿:WTN6系列—以低功耗、高性能賦能<b class='flag-5'>智能</b>終端<b class='flag-5'>升級</b>

    深入探討DeepSeek大模型的核心技術

    導讀 本文深入探討了DeepSeek大模型的核心技術,從公司背景、模型能力、訓推成本到核心技術細節(jié)進行了全面分析。 ? 一、關于DeepSeek公司及其大模型 1.1 公司概況 DeepSeek
    的頭像 發(fā)表于 02-10 10:49 ?771次閱讀
    深入探討DeepSeek大模型的<b class='flag-5'>核心技術</b>

    智己汽車B輪融資94億元,加速核心技術研發(fā)

    底盤、線控轉向、智能駕駛等核心技術的研發(fā)與投入。智己汽車深知,技術創(chuàng)新是企業(yè)發(fā)展的核心競爭力,因此將持續(xù)加大在研發(fā)領域的投入,以推動產品和技術
    的頭像 發(fā)表于 12-26 11:15 ?383次閱讀

    語音提示器-WT3000A離在線TTS方案-打破語種限制/AI對話多功能支持

    TTS(離線本地音樂播放與在線TTS合成播放結合)技術,旨在為用戶打造一個智能、高效、人性化的語音提示解決方案。方案介紹SchemeIntroduction核心技術
    的頭像 發(fā)表于 10-25 08:11 ?398次閱讀
    <b class='flag-5'>語音</b>提示器-WT3000A離在線TTS方案-打破語種限制/AI對話多功能支持

    后摩智能參加聯(lián)想創(chuàng)2024年CVC創(chuàng)

    聯(lián)想創(chuàng)2024年CVC創(chuàng)周于日前在聯(lián)想全球總部東區(qū)舉行,本屆活動以"硅基覺醒,AI 啟未來"為主旨,將匯聚近50家科技創(chuàng)新型企業(yè)和眾多卓越投資者,共同探索和見證 AI
    的頭像 發(fā)表于 09-24 16:55 ?617次閱讀

    AI網(wǎng)絡發(fā)展的四大核心技術支柱

    在AI大模型時代,隨著模型參數(shù)量與訓練集規(guī)模的爆炸性增長,單純依賴GPU單體算力的提升已難以滿足需求,業(yè)界焦點逐漸轉向系統(tǒng)架構層面的革新,其中,作為底層核心技術的網(wǎng)絡成為了突破的關鍵。全球科技巨頭正競相研發(fā)相關產品技術,AI網(wǎng)絡技術
    的頭像 發(fā)表于 08-14 17:11 ?1379次閱讀

    聚焦物聯(lián)網(wǎng)場景,曠視科技核心技術能力持續(xù)升級

    曾經備受青睞的“AI四小龍”之一,曠視科技在更早的時候曾向港交所遞交上市申請,闖關未果后轉向上交所科創(chuàng)板。 ? 曠視科技核心技術能力 ? 曠視科技是一家聚焦物聯(lián)網(wǎng)場景的人工智能公司,其核心技術
    的頭像 發(fā)表于 07-25 00:09 ?4428次閱讀

    又一家人工智能企業(yè)成功IPO,核心技術涉及感知、理解、執(zhí)行

    流程。主要服務于城市管理及行政、汽車及交通、通信、金融以及教育、醫(yī)療健康、電商及零售等行業(yè)。 ? 核心技術涉及感知、理解、執(zhí)行 ????????????????????????????????? 聲通科技核心技術包括交互式人工智能技術
    的頭像 發(fā)表于 07-17 00:16 ?3253次閱讀

    【大語言模型:原理與工程實踐】核心技術綜述

    我也不打算把網(wǎng)上相關的信息在總結一下,這樣的話,工作量很大。 我主要看了-大語言模型基礎技術這節(jié) 大語言模型(Large Language Models,LLMs)的核心技術涵蓋了從模型的架構設計到
    發(fā)表于 05-05 10:56

    JXW56語音芯片,智能家居安全新升級

    智能升級煙霧語音IC
    的頭像 發(fā)表于 04-28 10:48 ?383次閱讀

    喬鋒智能IPO上市丨深耕機床行業(yè),構筑核心技術優(yōu)勢

    行業(yè)多年,一直致力于研制精度高、可靠性高、效率高、智能化的國產現(xiàn)代化“工業(yè)母機”,為智能制造轉型升級提供更高品質的數(shù)控機床設備。 通過多年的持續(xù)研發(fā)投入,喬鋒智能已經在機床領域積累了一
    的頭像 發(fā)表于 04-25 15:00 ?568次閱讀

    聚強智能宣布完成原子創(chuàng)獨家投資的數(shù)千萬元天使輪融資

    近日,基于dToF技術的高精度、遠距離、全自研國產高性能激光傳感器方案商“聚強智能”宣布完成原子創(chuàng)獨家投資的數(shù)千萬元天使輪融資。
    的頭像 發(fā)表于 04-25 09:06 ?686次閱讀

    新能源汽車核心技術加油站-VCU

    新能源汽車核心技術加油站-VCU
    的頭像 發(fā)表于 04-20 08:10 ?450次閱讀
    新能源汽車<b class='flag-5'>核心技術</b>加油站-VCU

    語音IC-智能語音芯片方案-您身邊的智選升級

    語音IC方案開發(fā)-智能語音升級OTP開發(fā)應用場景
    的頭像 發(fā)表于 04-12 17:00 ?565次閱讀

    首芯半導體完成天使+輪融資,中贏創(chuàng)

    近日,首芯半導體完成天使+輪融資。本輪融資由中贏創(chuàng),老股東錫創(chuàng)旗下的澄創(chuàng)高新基金及卓源亞
    的頭像 發(fā)表于 03-14 09:45 ?636次閱讀