0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

海岸語音石偉:聲矢量技術(shù)帶入消費(fèi)級市場還遠(yuǎn)遠(yuǎn)不夠 我們的目標(biāo)是整條語音技術(shù)鏈條

h1654155972.5709 ? 來源:電子發(fā)燒友網(wǎng) ? 作者:工程師譚軍 ? 2018-07-14 09:19 ? 次閱讀

互聯(lián)網(wǎng)發(fā)展至今,面對人工智能大時代的到來,智慧、高效、便捷的人工智能研發(fā)應(yīng)用,發(fā)展智能產(chǎn)業(yè)成為科技行業(yè)工作的重中之重。協(xié)會特派記者走進(jìn)深圳海岸語音技術(shù)有限公司,對石偉總經(jīng)理進(jìn)行了智能語音行業(yè)相關(guān)專訪。

深圳海岸語音技術(shù)有限公司創(chuàng)始人、總經(jīng)理 石偉

記者:智能語音作為人工智能應(yīng)用最成熟的技術(shù)之一,科技巨頭、初創(chuàng)公司紛紛布局,海岸語音是怎樣定位與布局?

石偉:從人機(jī)交互形式出發(fā),語音識別無疑是人工智能產(chǎn)品與用戶之間,最便捷有效的交流形式。語音交互技術(shù)鏈條較長,包括語音識別前端處理、語音識別、語義理解、語音合成等環(huán)節(jié)。在語音識別方面,百度、科大訊飛、谷歌等技術(shù)領(lǐng)先。我們主要做語音識別前端處理的技術(shù),是一家專注于智能聽覺感知技術(shù)的人工智能初創(chuàng)企業(yè),面向物聯(lián)網(wǎng)和人工智能時代,提供軟、硬件結(jié)合加云端引擎的一體化智能聽覺感知技術(shù)解決方案。

記者:海岸語音的產(chǎn)品及應(yīng)用有哪些?

石偉:有別于傳統(tǒng)的標(biāo)量麥克風(fēng)技術(shù),我們產(chǎn)品所采用的是聲學(xué)矢量傳感技術(shù),可同時測量聲場的聲壓信息和方向信息,該技術(shù)最早源于潛艇的矢量水聽器,在空氣中的應(yīng)用極少。我們團(tuán)隊歷經(jīng) 8 年研發(fā),打造出 AI 時代必不可少的“機(jī)器耳朵”:VecSense ? 智能聲矢量傳感器。該傳感器是世界首款消費(fèi)級聲矢量傳感器,可以應(yīng)用在機(jī)器人智能音箱、家電等諸多領(lǐng)域。

記者:海岸語音的核心競爭力體現(xiàn)在哪些方面?

石偉:把產(chǎn)品做小、成本做低(幾美元左右)是我們研發(fā)的方向。目前 VecSense ? 智能聲矢量傳感器比一毛錢硬幣還小三分之一,性能高、成本低、體積小的特性使其在智能語音、機(jī)器人、智能家居、無人機(jī)、穿戴式設(shè)備以及智能車載等領(lǐng)域都有廣闊的應(yīng)用前景。

作為 AI 時代機(jī)器必備的器件之一,“機(jī)器耳朵”需要更多的信息實現(xiàn)其智能的特性,這是傳統(tǒng)的標(biāo)量麥克風(fēng)所面臨的局限性。雖然在聲學(xué)傳感器的發(fā)展史上,各大研究機(jī)構(gòu)嘗試了通過多種方式獲取除了聲壓信息以外的聲音方向信息,但這些技術(shù)都具有各類不同的缺陷,使其無法在消費(fèi)級產(chǎn)品中使用。

我們在小尺寸的單顆傳感器封裝內(nèi)實現(xiàn)平面 360°聲音定向,并內(nèi)置多種語言 / 音頻智能算法。不僅在聽音辨位、抑制干擾、遠(yuǎn)場拾音方面表現(xiàn)出超強(qiáng)的性能,因其獨(dú)特的信號特性還能做到出色語音分離,讓智能機(jī)器同時聽懂多個說話人的指令。

在數(shù)量、尺寸、功耗和成本方面,一顆 VecSense ?傳感器對應(yīng)四至八顆傳感器組成的麥克風(fēng)陣列,顯然具有突出的優(yōu)勢:尺寸減少 70%,功耗降低 90%,同時成本可降低 90%。

記者:海岸語音發(fā)展過程中有遇到哪些困難?

石偉:目前我們產(chǎn)品還未正式推向市場,產(chǎn)品還在不斷地優(yōu)化,找到行業(yè)典型應(yīng)用是將要面臨的一大挑戰(zhàn)。在未來推向市場的時候,產(chǎn)品的正式落地希望能夠找到知名度較高的產(chǎn)品或廠商背書,進(jìn)一步打開市場。

記者:石總怎么看待科技巨頭與初創(chuàng)公司在智能語音領(lǐng)域的發(fā)展模式?

石偉:科技巨頭主要打造開發(fā)者生態(tài)系統(tǒng),使用算法平臺吸引開發(fā)者,實現(xiàn)數(shù)據(jù)的快速積累、產(chǎn)品的快速迭代。目前,在國內(nèi)智能語音領(lǐng)域,科大訊飛是做得比較完善,一整條產(chǎn)業(yè)鏈相關(guān)技術(shù)產(chǎn)品都有涉及,并將自身語音技術(shù)植入相關(guān)合作伙伴的產(chǎn)品中,以推動智能語音和人工智能技術(shù)在家居、車載、可穿戴等領(lǐng)域的落地。

初創(chuàng)公司目前以垂直領(lǐng)域和細(xì)分場景為突破口,切入產(chǎn)品場景應(yīng)用。初創(chuàng)企業(yè)不應(yīng)求大、求全,而是結(jié)合自身優(yōu)勢做最“性感”的技術(shù)和產(chǎn)品。

記者:海岸語音未來有些什么規(guī)劃?

石偉:海岸語音目前專注語音識別前端處理,未來將從前端向一整條語音技術(shù)鏈條進(jìn)行滲透,實現(xiàn)音頻和視頻融合的人機(jī)交互。我們會將底層的技術(shù)打包為完整的交互解決方案,服務(wù) B 端客戶。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 人機(jī)交互
    +關(guān)注

    關(guān)注

    12

    文章

    1217

    瀏覽量

    55494
  • 人工智能
    +關(guān)注

    關(guān)注

    1796

    文章

    47643

    瀏覽量

    239863
  • 智能語音
    +關(guān)注

    關(guān)注

    10

    文章

    789

    瀏覽量

    48865

原文標(biāo)題:對話 | 將聲矢量技術(shù)帶入消費(fèi)級市場—專訪深圳海岸語音技術(shù)有限公司總經(jīng)理石偉

文章出處:【微信號:SRA2009,微信公眾號:深圳市機(jī)器人協(xié)會】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏

    評論

    相關(guān)推薦

    HarmonyOS NEXT 應(yīng)用開發(fā)練習(xí):AI智能語音播報

    (Text-To-Speech,文本轉(zhuǎn)語音技術(shù)將文本轉(zhuǎn)換為語音進(jìn)行播報。 當(dāng)然除了基本的文本輸入和播報功能外,我們增加了
    發(fā)表于 01-06 15:33

    語音識別技術(shù)在醫(yī)療領(lǐng)域的應(yīng)用

    語音識別技術(shù)在醫(yī)療領(lǐng)域的應(yīng)用已經(jīng)越來越廣泛,為醫(yī)療服務(wù)帶來了諸多便利和效率提升。以下是對語音識別技術(shù)在醫(yī)療領(lǐng)域應(yīng)用的介紹: 一、語音病歷
    的頭像 發(fā)表于 11-26 09:35 ?469次閱讀

    語音識別技術(shù)的應(yīng)用與發(fā)展

    語音識別技術(shù)的發(fā)展可以追溯到20世紀(jì)50年代,但直到近年來,隨著計算能力的提升和機(jī)器學(xué)習(xí)技術(shù)的進(jìn)步,這項技術(shù)才真正成熟并廣泛應(yīng)用于各個領(lǐng)域。語音
    的頭像 發(fā)表于 11-26 09:20 ?691次閱讀

    ASR語音識別技術(shù)應(yīng)用

    ASR(Automatic Speech Recognition)語音識別技術(shù),是計算機(jī)科學(xué)與人工智能領(lǐng)域的重要突破,能將人類語音轉(zhuǎn)換為文本,廣泛應(yīng)用于智能家居、醫(yī)療、交通等多個領(lǐng)域。以下是對ASR
    的頭像 發(fā)表于 11-18 15:12 ?967次閱讀

    請問有移動設(shè)備上用的2.1道的語音功放芯片嗎?

    請問有移動設(shè)備上用的2.1道的語音功放芯片嗎?前端是左右聲道差分音頻輸入。電源電壓 大概3~5V。
    發(fā)表于 10-15 07:54

    語音降噪 -音頻技術(shù)的一個重要話題

    語音降噪技術(shù)在提高語音清晰度和用戶體驗方面發(fā)揮了重要作用。通過選擇合適的技術(shù)和優(yōu)化配置,可以有效解決背景噪聲、回聲和音質(zhì)保真等問題。未來,隨著深度學(xué)習(xí)和人工智能的發(fā)展,
    的頭像 發(fā)表于 09-13 16:20 ?3163次閱讀
    <b class='flag-5'>語音</b>降噪 -音頻<b class='flag-5'>技術(shù)</b>的一個重要話題

    人工智能的語音識別技術(shù)詳解

    隨著科技的飛速發(fā)展,人工智能(AI)技術(shù)已經(jīng)滲透到我們生活的方方面面,其中語音識別技術(shù)作為AI領(lǐng)域的重要分支,更是以其獨(dú)特的魅力和廣泛的應(yīng)用前景,引起了社會各界的廣泛關(guān)注。本文將詳細(xì)介
    的頭像 發(fā)表于 07-01 11:39 ?1530次閱讀

    基于助聽器開發(fā)的一種高效的語音增強(qiáng)神經(jīng)網(wǎng)絡(luò)

    。雖然模型壓縮技術(shù)是一個活躍的研究領(lǐng)域,但我們是第一個證明其有效性的RNN語音增強(qiáng),使用剪裁和權(quán)重/激活的整型量化。我們演示了狀態(tài)更新跳躍
    發(fā)表于 06-07 11:29

    標(biāo)貝語音識別技術(shù)在金融領(lǐng)域中的應(yīng)用實例

    隨著語音識別技術(shù)與文本挖掘、自然語言處理等技術(shù)的不斷融合,智能語音交互技術(shù)在金融領(lǐng)域中爆發(fā)了出巨大的應(yīng)用潛力。標(biāo)貝科技根據(jù)自身與金融領(lǐng)域合作
    的頭像 發(fā)表于 05-16 16:55 ?673次閱讀
    標(biāo)貝<b class='flag-5'>語音</b>識別<b class='flag-5'>技術(shù)</b>在金融領(lǐng)域中的應(yīng)用實例

    車內(nèi)語音識別技術(shù)在智能駕駛中的應(yīng)用與前景

    一、引言 隨著智能駕駛技術(shù)的快速發(fā)展,車內(nèi)語音識別技術(shù)逐漸成為智能駕駛領(lǐng)域的研究熱點。語音識別技術(shù)為駕駛員提供了更加便捷、安全的駕駛體驗,同
    的頭像 發(fā)表于 02-19 11:46 ?906次閱讀

    車內(nèi)語音識別技術(shù):智能駕駛的核心要素

    一、引言 隨著科技的飛速發(fā)展,智能駕駛已經(jīng)成為未來出行的趨勢。作為智能駕駛的關(guān)鍵技術(shù)之一,車內(nèi)語音識別技術(shù)發(fā)揮著越來越重要的作用。它不僅提升了駕駛的便捷性和安全性,也為駕駛者提供了更加個性化、智能化
    的頭像 發(fā)表于 02-19 11:42 ?845次閱讀

    車內(nèi)語音識別技術(shù):智能駕駛的革新之源

    一、引言 隨著科技的飛速發(fā)展,智能駕駛已經(jīng)成為現(xiàn)代交通領(lǐng)域的熱門話題。作為智能駕駛的關(guān)鍵技術(shù)之一,車內(nèi)語音識別技術(shù)正在改變我們對駕駛的認(rèn)知。它不僅提高了駕駛的便捷性和安全性,也為駕駛者
    的頭像 發(fā)表于 02-19 10:10 ?506次閱讀

    語音合成技術(shù)在智能駕駛中的創(chuàng)新與應(yīng)用

    一、引言 隨著智能駕駛技術(shù)的不斷發(fā)展,人機(jī)交互變得越來越重要。語音合成技術(shù)作為人機(jī)交互的重要手段,在智能駕駛中發(fā)揮著越來越重要的作用。本文將探討語音合成
    的頭像 發(fā)表于 02-01 18:09 ?704次閱讀

    語音合成技術(shù)在智能駕駛中的應(yīng)用與展望

    一、引言 隨著科技的飛速發(fā)展,語音合成技術(shù)逐漸成為人機(jī)交互領(lǐng)域的重要分支。在智能駕駛環(huán)境中,語音合成技術(shù)更是發(fā)揮著不可或缺的作用。它不僅簡化了人機(jī)交互過程,還為駕駛員提供了更加便捷、安
    的頭像 發(fā)表于 02-01 17:50 ?575次閱讀

    語音數(shù)據(jù)集:智能駕駛中車內(nèi)語音識別技術(shù)的基石

    一、引言 在智能駕駛中,車內(nèi)語音識別技術(shù)發(fā)揮著越來越重要的作用。語音數(shù)據(jù)集作為這一技術(shù)的基石,其質(zhì)量和規(guī)模對語音識別的性能有著至關(guān)重要的影響
    的頭像 發(fā)表于 01-31 16:07 ?586次閱讀