互聯(lián)網(wǎng)發(fā)展至今,面對人工智能大時代的到來,智慧、高效、便捷的人工智能研發(fā)應(yīng)用,發(fā)展智能產(chǎn)業(yè)成為科技行業(yè)工作的重中之重。協(xié)會特派記者走進(jìn)深圳海岸語音技術(shù)有限公司,對石偉總經(jīng)理進(jìn)行了智能語音行業(yè)相關(guān)專訪。
深圳海岸語音技術(shù)有限公司創(chuàng)始人、總經(jīng)理 石偉
記者:智能語音作為人工智能應(yīng)用最成熟的技術(shù)之一,科技巨頭、初創(chuàng)公司紛紛布局,海岸語音是怎樣定位與布局?
石偉:從人機(jī)交互形式出發(fā),語音識別無疑是人工智能產(chǎn)品與用戶之間,最便捷有效的交流形式。語音交互技術(shù)鏈條較長,包括語音識別前端處理、語音識別、語義理解、語音合成等環(huán)節(jié)。在語音識別方面,百度、科大訊飛、谷歌等技術(shù)領(lǐng)先。我們主要做語音識別前端處理的技術(shù),是一家專注于智能聽覺感知技術(shù)的人工智能初創(chuàng)企業(yè),面向物聯(lián)網(wǎng)和人工智能時代,提供軟、硬件結(jié)合加云端引擎的一體化智能聽覺感知技術(shù)解決方案。
記者:海岸語音的產(chǎn)品及應(yīng)用有哪些?
石偉:有別于傳統(tǒng)的標(biāo)量麥克風(fēng)技術(shù),我們產(chǎn)品所采用的是聲學(xué)矢量傳感技術(shù),可同時測量聲場的聲壓信息和方向信息,該技術(shù)最早源于潛艇的矢量水聽器,在空氣中的應(yīng)用極少。我們團(tuán)隊歷經(jīng) 8 年研發(fā),打造出 AI 時代必不可少的“機(jī)器耳朵”:VecSense ? 智能聲矢量傳感器。該傳感器是世界首款消費(fèi)級聲矢量傳感器,可以應(yīng)用在機(jī)器人、智能音箱、家電等諸多領(lǐng)域。
記者:海岸語音的核心競爭力體現(xiàn)在哪些方面?
石偉:把產(chǎn)品做小、成本做低(幾美元左右)是我們研發(fā)的方向。目前 VecSense ? 智能聲矢量傳感器比一毛錢硬幣還小三分之一,性能高、成本低、體積小的特性使其在智能語音、機(jī)器人、智能家居、無人機(jī)、穿戴式設(shè)備以及智能車載等領(lǐng)域都有廣闊的應(yīng)用前景。
作為 AI 時代機(jī)器必備的器件之一,“機(jī)器耳朵”需要更多的信息實現(xiàn)其智能的特性,這是傳統(tǒng)的標(biāo)量麥克風(fēng)所面臨的局限性。雖然在聲學(xué)傳感器的發(fā)展史上,各大研究機(jī)構(gòu)嘗試了通過多種方式獲取除了聲壓信息以外的聲音方向信息,但這些技術(shù)都具有各類不同的缺陷,使其無法在消費(fèi)級產(chǎn)品中使用。
我們在小尺寸的單顆傳感器封裝內(nèi)實現(xiàn)平面 360°聲音定向,并內(nèi)置多種語言 / 音頻智能算法。不僅在聽音辨位、抑制干擾、遠(yuǎn)場拾音方面表現(xiàn)出超強(qiáng)的性能,因其獨(dú)特的信號特性還能做到出色語音分離,讓智能機(jī)器同時聽懂多個說話人的指令。
在數(shù)量、尺寸、功耗和成本方面,一顆 VecSense ?傳感器對應(yīng)四至八顆傳感器組成的麥克風(fēng)陣列,顯然具有突出的優(yōu)勢:尺寸減少 70%,功耗降低 90%,同時成本可降低 90%。
記者:海岸語音發(fā)展過程中有遇到哪些困難?
石偉:目前我們產(chǎn)品還未正式推向市場,產(chǎn)品還在不斷地優(yōu)化,找到行業(yè)典型應(yīng)用是將要面臨的一大挑戰(zhàn)。在未來推向市場的時候,產(chǎn)品的正式落地希望能夠找到知名度較高的產(chǎn)品或廠商背書,進(jìn)一步打開市場。
記者:石總怎么看待科技巨頭與初創(chuàng)公司在智能語音領(lǐng)域的發(fā)展模式?
石偉:科技巨頭主要打造開發(fā)者生態(tài)系統(tǒng),使用算法平臺吸引開發(fā)者,實現(xiàn)數(shù)據(jù)的快速積累、產(chǎn)品的快速迭代。目前,在國內(nèi)智能語音領(lǐng)域,科大訊飛是做得比較完善,一整條產(chǎn)業(yè)鏈相關(guān)技術(shù)產(chǎn)品都有涉及,并將自身語音技術(shù)植入相關(guān)合作伙伴的產(chǎn)品中,以推動智能語音和人工智能技術(shù)在家居、車載、可穿戴等領(lǐng)域的落地。
初創(chuàng)公司目前以垂直領(lǐng)域和細(xì)分場景為突破口,切入產(chǎn)品場景應(yīng)用。初創(chuàng)企業(yè)不應(yīng)求大、求全,而是結(jié)合自身優(yōu)勢做最“性感”的技術(shù)和產(chǎn)品。
記者:海岸語音未來有些什么規(guī)劃?
石偉:海岸語音目前專注語音識別前端處理,未來將從前端向一整條語音技術(shù)鏈條進(jìn)行滲透,實現(xiàn)音頻和視頻融合的人機(jī)交互。我們會將底層的技術(shù)打包為完整的交互解決方案,服務(wù) B 端客戶。
-
人機(jī)交互
+關(guān)注
關(guān)注
12文章
1217瀏覽量
55494 -
人工智能
+關(guān)注
關(guān)注
1796文章
47643瀏覽量
239863 -
智能語音
+關(guān)注
關(guān)注
10文章
789瀏覽量
48865
原文標(biāo)題:對話 | 將聲矢量技術(shù)帶入消費(fèi)級市場—專訪深圳海岸語音技術(shù)有限公司總經(jīng)理石偉
文章出處:【微信號:SRA2009,微信公眾號:深圳市機(jī)器人協(xié)會】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
相關(guān)推薦
評論