国产在线精品一区二区不卡麻豆,无码丰满熟妇浪潮一区二区AV,国产一区专区

人工智能，可以說(shuō)是今年最熱的一個(gè)關(guān)鍵詞，并推動(dòng)著很多產(chǎn)品和產(chǎn)業(yè)的創(chuàng)新。而提到人工智能，目前主要的還是語(yǔ)音識(shí)別和圖像識(shí)別，這兩點(diǎn)也一直是上游芯片原廠(chǎng)和方案商想要突破和創(chuàng)新的技術(shù)關(guān)卡。

作為國(guó)內(nèi)知名的音頻芯片廠(chǎng)商炬芯科技，不但于去年在音頻領(lǐng)域進(jìn)入了小米、魅族等幾家大公司的供應(yīng)鏈，現(xiàn)在也開(kāi)始聚焦音頻AI領(lǐng)域，推出了一系列的智能語(yǔ)音產(chǎn)品和解決方案。12月15日，炬芯科技在深圳舉行了針對(duì)智能語(yǔ)音技術(shù)的專(zhuān)屬品牌活動(dòng)：炬芯科技2017 TcehLife開(kāi)發(fā)者交流大會(huì)。

單麥克風(fēng)or麥克風(fēng)陣列，語(yǔ)音交互該選用怎樣的方案？

本次的TechLife活動(dòng)交流分享環(huán)節(jié)，炬芯特邀地平線(xiàn)語(yǔ)音前端處理技術(shù)負(fù)責(zé)人，南京大學(xué)聲科學(xué)與工程系教授，噪聲控制與通信聲學(xué)研究室主任盧晶盧教授，為大家針對(duì)智能語(yǔ)音交互的“金耳朵”語(yǔ)音前端處理技術(shù)進(jìn)行了深度分享。

據(jù)WER統(tǒng)計(jì)，目前最頂尖的語(yǔ)音識(shí)別技術(shù)的誤識(shí)率是3%，已經(jīng)與人類(lèi)聽(tīng)力的誤識(shí)率持平，但是WER統(tǒng)計(jì)大多數(shù)針對(duì)安靜場(chǎng)景的語(yǔ)音數(shù)據(jù)，在復(fù)雜環(huán)境中語(yǔ)音性能顯著惡化。人耳能夠自動(dòng)屏蔽掉周?chē)脑胍簦魂P(guān)注你想聽(tīng)到的聲音；但是機(jī)器做不到，在語(yǔ)音識(shí)別系統(tǒng)看來(lái)所接收到的所有聲音重要性都是一樣的，無(wú)法區(qū)分噪音和聲音，在復(fù)雜環(huán)境下語(yǔ)音識(shí)別率自然會(huì)下降。

因此，智能語(yǔ)音技術(shù)的發(fā)展讓語(yǔ)音前端處理的重要性日益凸顯。不僅要像手機(jī)、藍(lán)牙耳機(jī)、助聽(tīng)器的語(yǔ)音前端處理系統(tǒng)一樣實(shí)現(xiàn)降噪，還要進(jìn)一步還原語(yǔ)音，讓要讓機(jī)器聽(tīng)得懂，進(jìn)而提升語(yǔ)音識(shí)別和說(shuō)話(huà)人識(shí)別系統(tǒng)的實(shí)用性和識(shí)別率。

盧晶盧教授表示，目前對(duì)干擾噪音的抑制有單麥克風(fēng)和麥克風(fēng)陣列兩種方案。其中單通道方案的關(guān)鍵點(diǎn)是噪聲功率譜的有效追蹤和語(yǔ)音邊界檢測(cè)，也可以基于深度學(xué)習(xí)的方案提升抑制干擾噪聲的能力。單通道方案優(yōu)點(diǎn)是結(jié)構(gòu)簡(jiǎn)單，硬件成本低，對(duì)平穩(wěn)噪聲效果明顯，但弱點(diǎn)是對(duì)非平穩(wěn)噪聲處理效果不佳。

麥克風(fēng)陣列由一組按一定幾何結(jié)構(gòu)（常用線(xiàn)形、環(huán)形）擺放的麥克風(fēng)組成，對(duì)采集的不同空間方向的聲音信號(hào)進(jìn)行空時(shí)處理，實(shí)現(xiàn)噪聲抑制、混響去除、人聲干擾抑制、聲源測(cè)向、聲源跟蹤、陣列增益等功能，進(jìn)而提高語(yǔ)音信號(hào)處理質(zhì)量，以提高真實(shí)環(huán)境下的語(yǔ)音識(shí)別率。

理論上來(lái)說(shuō)，麥克風(fēng)數(shù)量多多益善，但系統(tǒng)的實(shí)現(xiàn)必須考慮性?xún)r(jià)比。那么，對(duì)于開(kāi)發(fā)者來(lái)說(shuō)，該如何平衡語(yǔ)音前端硬件系統(tǒng)的性能和價(jià)格呢？盧晶盧教授認(rèn)為，在一般應(yīng)用場(chǎng)景，說(shuō)話(huà)人距離3m以?xún)?nèi)可以采用單麥克風(fēng)；復(fù)雜場(chǎng)景使用2顆；需要DOA估計(jì)的復(fù)雜場(chǎng)景則需要3-4顆甚至8顆的麥克風(fēng)。

聚焦音頻AI，炬芯推出智能語(yǔ)音全系列產(chǎn)品線(xiàn)

炬芯科技技術(shù)專(zhuān)家陶永耀在現(xiàn)場(chǎng)也為大家詳細(xì)的講解了炬芯目前的幾大核心平臺(tái)，同時(shí)也對(duì)智能語(yǔ)音的未來(lái)發(fā)表了獨(dú)到的觀(guān)點(diǎn)。

熟悉炬芯的人都知道，炬芯是做音頻起家的，最早做MP3，老人機(jī)、小音箱等產(chǎn)品。陶永耀表示，炬芯未來(lái)三到五年仍將重點(diǎn)聚焦以音頻為主線(xiàn)的三大領(lǐng)域，并引入人工智能元素。一是無(wú)線(xiàn)音頻和智能穿戴運(yùn)動(dòng)耳機(jī)；二是智能多媒體，將原來(lái)的老人機(jī)、游戲機(jī)、學(xué)習(xí)機(jī)，與人工智能結(jié)合形成跨界的產(chǎn)品。三是智慧計(jì)算與物聯(lián)網(wǎng)，包括無(wú)人機(jī)、VR/AR、OTT盒子等產(chǎn)品。

作為一家芯片廠(chǎng)商，炬芯聚焦解決智能語(yǔ)音平臺(tái)的共性需求，致力于智能語(yǔ)音交互技術(shù)中的前臺(tái)技術(shù)的發(fā)展。主要包括以下四點(diǎn)：1.mic陣列語(yǔ)音采集芯片；2整合語(yǔ)音前處理相關(guān)算法；3.整合本地語(yǔ)音識(shí)別引擎；4.雙mic語(yǔ)音前處理模塊。

目前炬芯已經(jīng)擁有非常豐富的智能語(yǔ)音產(chǎn)品線(xiàn)，尤其是目前熱門(mén)且已經(jīng)成功落地的智能早教機(jī)器人產(chǎn)品。其實(shí)在早教機(jī)器人方面炬芯已經(jīng)推出了比較全面的解決方案，完整布局了低、中、高端市場(chǎng)，主要包括ATS3503、ATS3603、ATS3703。

針對(duì)火爆的智能音箱市場(chǎng)，炬芯在本次開(kāi)發(fā)者交流大會(huì)上正式推出了全新的智能語(yǔ)音多媒體平臺(tái)。包括面向無(wú)屏Linux系統(tǒng)的智能語(yǔ)音平臺(tái)ATS3605D，面向有屏的Android智能語(yǔ)音平臺(tái)有S500、S700、S900，以及一顆支持4-8麥的語(yǔ)音采集套片ATT300X。

此外，炬芯還推出了雙模藍(lán)牙平臺(tái)AT3282X和ATB12XX，以及針對(duì)BLE藍(lán)牙智能語(yǔ)音平臺(tái)ATB110X。

此前，炬芯科技CEO周正宇博士被采訪(fǎng)表示，人工智能和物聯(lián)網(wǎng)概念一樣的龐大，如果人工智能像物聯(lián)網(wǎng)一樣不追求產(chǎn)品的落地，它將依然得不到人工智能需要追求實(shí)際的產(chǎn)品落地和智能化的用戶(hù)體驗(yàn)，堅(jiān)持小步快走的微智能化發(fā)展方針才是長(zhǎng)久之計(jì)。炬芯在此次開(kāi)發(fā)者大會(huì)上充分展示了智能語(yǔ)音全面的產(chǎn)品線(xiàn)，正是基于其小步快走的微智能化發(fā)展方針的最好實(shí)踐。

聲明：本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀(guān)點(diǎn)僅代表作者本人，不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用，如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題，請(qǐng)聯(lián)系本站處理。舉報(bào)投訴

AI

AI

+關(guān)注

關(guān)注
87

文章
31493

瀏覽量
270049
智能語(yǔ)音

智能語(yǔ)音

+關(guān)注

關(guān)注
10

文章
789

瀏覽量
48865

原文標(biāo)題：從音頻到智能語(yǔ)音，看炬芯AI創(chuàng)新之路

文章出處：【微信號(hào)：ittbank，微信公眾號(hào)：ittbank】歡迎添加關(guān)注！文章轉(zhuǎn)載請(qǐng)注明出處。

評(píng)論

相關(guān)推薦

前端技術(shù)的未來(lái)趨勢(shì)：擁抱創(chuàng)新，塑造無(wú)限可能

為未來(lái)的重要趨勢(shì)之一。智能交互將變得更加自然和流暢。例如，通過(guò)語(yǔ)音識(shí)別和自然語(yǔ)言處理技術(shù)，用戶(hù)可以直接通過(guò)

發(fā)表于 01-22 10:07 ?70次閱讀

【「嵌入式系統(tǒng)設(shè)計(jì)與實(shí)現(xiàn)」閱讀體驗(yàn)】+ 基于語(yǔ)音識(shí)別的智能杯墊

項(xiàng)目二維碼下圖該作品通過(guò)采集飲水?dāng)?shù)據(jù)，多種交互方式，數(shù)據(jù)分析處理，提醒用戶(hù)定期飲水，達(dá)到保持健康的作用。主要功能是語(yǔ)音識(shí)別。 ASR-PRO語(yǔ)音模塊是一款高度集成的

發(fā)表于 01-02 18:15

解鎖個(gè)性化語(yǔ)音交互新時(shí)代：九芯智能語(yǔ)音云平臺(tái)，讓創(chuàng)意聲音觸手可及！

九芯智能語(yǔ)音云平臺(tái)提供全面高效安全的智能語(yǔ)音服務(wù)，支持自定義語(yǔ)音內(nèi)容，簡(jiǎn)化燒錄流程，依托AI技術(shù)

發(fā)表于 01-02 16:51 ?154次閱讀

解鎖個(gè)性化<b class='flag-5'>語(yǔ)音</b><b class='flag-5'>交互</b>新時(shí)代：九芯<b class='flag-5'>智能</b><b class='flag-5'>語(yǔ)音</b>云平臺(tái)，讓創(chuàng)意聲音觸手可及！

基于語(yǔ)音識(shí)別的智能會(huì)議系統(tǒng)具備哪些交互功能

標(biāo)貝科技專(zhuān)注智能語(yǔ)音交互領(lǐng)域多年，在語(yǔ)音識(shí)別和語(yǔ)音合成領(lǐng)域有著多項(xiàng)大型企業(yè)合作案例，標(biāo)貝與多個(gè)智能

發(fā)表于 12-20 10:35 ?186次閱讀

基于智能語(yǔ)音交互的智能呼叫中心工作機(jī)制

作為實(shí)現(xiàn)智能呼叫中心的關(guān)鍵技術(shù)之一的智能語(yǔ)音交互技術(shù)，它通過(guò)集成自然語(yǔ)言

發(fā)表于 12-03 16:44 ?368次閱讀

語(yǔ)音識(shí)別與自然語(yǔ)言處理的關(guān)系

在人工智能的快速發(fā)展中，語(yǔ)音識(shí)別和自然語(yǔ)言處理（NLP）成為了兩個(gè)重要的技術(shù)支柱。語(yǔ)音識(shí)別技術(shù)使

發(fā)表于 11-26 09:21 ?554次閱讀

ASR語(yǔ)音識(shí)別技術(shù)應(yīng)用

語(yǔ)音識(shí)別技術(shù)應(yīng)用的分析：一、ASR語(yǔ)音識(shí)別技術(shù)原理 ASR語(yǔ)音識(shí)別技術(shù)的基本原理是將人類(lèi)

發(fā)表于 11-18 15:12 ?967次閱讀

樂(lè)鑫聲學(xué)前端算法：打造智能語(yǔ)音交互新體驗(yàn)，ESP32-S3 SOC技術(shù)方案

隨著人工智能技術(shù)的不斷進(jìn)步，智能語(yǔ)音設(shè)備正逐漸成為我們生活中不可或缺的一部分。然而，在嘈雜的現(xiàn)實(shí)環(huán)境中，如何實(shí)現(xiàn)清晰、準(zhǔn)確的語(yǔ)音交互，一直是

發(fā)表于 08-03 08:04 ?1107次閱讀

離線(xiàn)語(yǔ)音控制技術(shù)特點(diǎn)

離線(xiàn)語(yǔ)音控制通過(guò)結(jié)合高性能的音頻前端處理算法和本地AI模型實(shí)現(xiàn)了高效的語(yǔ)音識(shí)別和控制能力，不依賴(lài)于互聯(lián)網(wǎng)連接，同時(shí)具備靈活的應(yīng)用擴(kuò)展性。這種解決方案為各種

發(fā)表于 06-26 18:12 ?561次閱讀

車(chē)載語(yǔ)音識(shí)別系統(tǒng)語(yǔ)音數(shù)據(jù)采集標(biāo)注案例

的作用。一般來(lái)說(shuō)，車(chē)載語(yǔ)音識(shí)別系統(tǒng)主要分為前端和后端兩個(gè)部分，本文將針對(duì)前端語(yǔ)音信號(hào)數(shù)據(jù)采集標(biāo)注進(jìn)行

發(fā)表于 06-19 15:52 ?400次閱讀

車(chē)載語(yǔ)音識(shí)別系統(tǒng)語(yǔ)音數(shù)據(jù)采集標(biāo)注案例

的作用。一般來(lái)說(shuō)，車(chē)載語(yǔ)音識(shí)別系統(tǒng)主要分為前端和后端兩個(gè)部分，本文將針對(duì)前端語(yǔ)音信號(hào)數(shù)據(jù)采集標(biāo)注進(jìn)行

發(fā)表于 06-19 15:49 ?559次閱讀

智能語(yǔ)音交互技術(shù)如何助力設(shè)備實(shí)現(xiàn)人機(jī)自然對(duì)話(huà)

隨著現(xiàn)代人工智能在各行業(yè)的普及，智能語(yǔ)音交互技術(shù)也越來(lái)越多的在日常工作、生活中應(yīng)用，智能

發(fā)表于 05-23 15:16 ?759次閱讀

智能語(yǔ)音交互技術(shù)如何助力設(shè)備實(shí)現(xiàn)人機(jī)自然對(duì)話(huà)

智能語(yǔ)音交互技術(shù)是指通過(guò)語(yǔ)音識(shí)別、語(yǔ)音合成和自然語(yǔ)言理解等技

發(fā)表于 05-23 15:14 ?416次閱讀

讓機(jī)器擁有說(shuō)話(huà)能力，智能語(yǔ)音與音頻處理SoC

電子發(fā)燒友網(wǎng)報(bào)道（文/黃山明）隨著生成式AI的推進(jìn)，已經(jīng)有越來(lái)越多的智能家居企業(yè)開(kāi)始將其加入到產(chǎn)品當(dāng)中，預(yù)計(jì)未來(lái)也會(huì)有更多的家居產(chǎn)品能夠通過(guò)語(yǔ)音方式與人進(jìn)行交互。而實(shí)現(xiàn)這一

發(fā)表于 02-02 00:15 ?2865次閱讀

語(yǔ)音合成技術(shù)在智能駕駛中的創(chuàng)新與應(yīng)用

一、引言隨著智能駕駛技術(shù)的不斷發(fā)展，人機(jī)交互變得越來(lái)越重要。語(yǔ)音合成技術(shù)作為人機(jī)交互的重要手段

發(fā)表于 02-01 18:09 ?704次閱讀