語音聽寫,是指將短音頻(≤60秒)精準(zhǔn)識(shí)別成文字,實(shí)時(shí)返回結(jié)果,達(dá)到邊說邊返回的效果。
除了要考慮本身語音聽寫模型或算法的識(shí)別準(zhǔn)確率之外,一些智能硬件的產(chǎn)品還需要額外考慮降噪、回聲消除、去混響等因素,這些都是保證最后識(shí)別效果的重要因素。因?yàn)樯婕败浻布瑢?duì)能力交付方的項(xiàng)目經(jīng)驗(yàn)提出了較高的要求。
目前,國(guó)內(nèi)提供語音聽寫技術(shù)的廠商主要有:
1、科大訊飛
成立于1999年,2008年,公司在深圳證券交易所掛牌上市(股票代碼:002230)。一直深耕在人工智能領(lǐng)域,技術(shù)很全也很綜合,多次在語音識(shí)別、語音合成、機(jī)器翻譯、圖文識(shí)別、圖像理解、閱讀理解、機(jī)器推理等各項(xiàng)國(guó)際評(píng)測(cè)中取得佳績(jī)。
在語音聽寫上,除中文普通話和英文外,支持51個(gè)語種、24種方言和1個(gè)民族語言,可提供公有云接口及私有化部署方案。采用行業(yè)先進(jìn)的語音識(shí)別技術(shù),識(shí)別率可達(dá)98% 。目前廣泛應(yīng)用于語音搜索、聊天輸入、游戲娛樂、人機(jī)交互等場(chǎng)景。
2、百度
該技術(shù)主要由百度智能云提供,可適用于手機(jī)語音輸入、智能語音交互、語音指令、語音搜索等短語音交互場(chǎng)景。近場(chǎng)中文普通話識(shí)別準(zhǔn)確率達(dá)98%,在語言支持上覆蓋主流的普通話、口音普通話、粵語、四川話、英語。
3、云知聲
2012年6月創(chuàng)立于北京,是國(guó)內(nèi)頭部人工智能獨(dú)角獸企業(yè)。語音聽寫主要應(yīng)用于語音搜索、語音輸入、語音控制等場(chǎng)景。準(zhǔn)確率可達(dá)實(shí)用標(biāo)準(zhǔn),支持普通話、四川話、粵語、英語的識(shí)別。
4、思必馳
07年創(chuàng)立于英國(guó)劍橋,08年回國(guó)落戶蘇州,12年完成A輪融資,是國(guó)內(nèi)專業(yè)的對(duì)話式人工智能平臺(tái)公司,擁有全鏈路的智能語音語言技術(shù)。語音識(shí)別提供基于云+端混合引擎的連續(xù)語音識(shí)別,覆蓋中文、英文、葡萄牙語等語種,粵、川、滬等方言,以及帶方言的普通話。云端連續(xù)實(shí)時(shí)語音識(shí)別率>97%,可提供公有云接口及私有化部署方案。
審核編輯:符乾江
-
語音識(shí)別
+關(guān)注
關(guān)注
38文章
1742瀏覽量
112856 -
人工智能
+關(guān)注
關(guān)注
1796文章
47643瀏覽量
239913
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
評(píng)論