云知聲對(duì)比科大訊飛人工智能語音技術(shù)
隨著科技的進(jìn)步,人工智能在今天,早已不是一個(gè)現(xiàn)實(shí)中難以觸及的概念,伴隨智能家居、車聯(lián)網(wǎng)、甚至是VR產(chǎn)品的涌現(xiàn),人工智能的未來也有了更多可探索的方向。
從人機(jī)交互形式出發(fā),語音識(shí)別無疑是人工智能產(chǎn)品與用戶之間,最便捷有效的交流形式。
12月16日,年關(guān)將至,專注人工智能領(lǐng)域,擁有全球頂尖語音識(shí)別技術(shù)的業(yè)界新銳云知聲,在京舉辦了年度品牌發(fā)布會(huì),以“看見聲音的價(jià)值”為主題解釋了語音技術(shù)對(duì)人工智能非凡的含義,而聲音價(jià)值的背后,毫無疑問,是不斷升級(jí)的技術(shù)。
當(dāng)今的移動(dòng)互聯(lián)網(wǎng)領(lǐng)域,語音服務(wù)已經(jīng)變得越來越重要,在移動(dòng)端,語音輸入由于具有相對(duì)于敲字鍵入的便捷與高效性,無疑已經(jīng)成為趨勢(shì)。而在不少創(chuàng)業(yè)者和投資人眼中,傳統(tǒng)的搜索已成為過去時(shí),基于語音、語義的搜索和應(yīng)用服務(wù)才是未來。
近日國(guó)內(nèi)知名企業(yè)搜狗,對(duì)于語音服務(wù)技術(shù)支持的選擇也成為業(yè)內(nèi)的焦點(diǎn)話題,其推出的“搜狗語音助手”首先選擇了一家新興企業(yè)——“云知聲”,隨后又植入第二家公司——“科大訊飛”作為支持,筆者將會(huì)在下文中對(duì)二者的表現(xiàn)做一些簡(jiǎn)單的對(duì)比測(cè)試,讓大家能夠深入了解其性能。
近日筆者在業(yè)內(nèi)發(fā)現(xiàn)殺出一匹黑馬,一家開放共贏的新興企業(yè),有一個(gè)詩情畫意的名字——云知聲。這家在2012年6月成立的公司,并沒有“國(guó)企范兒”,而是秉承開放的心態(tài),作為技術(shù)服務(wù)提供商,提供根植于移動(dòng)互聯(lián)網(wǎng)的專業(yè)語音識(shí)別服務(wù)。
主流語音識(shí)別對(duì)比小測(cè)試
日前,國(guó)內(nèi)知名企業(yè)搜狗與科大訊飛、云知聲合作,推出“搜狗語音助手”插件。據(jù)有關(guān)人士透露,搜狗也曾在兩家公司之間難于選擇,畢竟云知聲作為一家成立只有半年多的創(chuàng)業(yè)公司,在業(yè)內(nèi)還未得到足夠的重視,相較于發(fā)展10余年的科大訊飛,云知聲的成績(jī)還是鮮為人知。但兩家公司在技術(shù)實(shí)力方面旗鼓相當(dāng),在同款“搜狗語音助手”上的表現(xiàn)也不相上下。最終的結(jié)果是,搜狗在2012年11月首發(fā)時(shí)是選擇了云知聲,數(shù)月后才又加上了科大訊飛。
接下來,筆者將兩家公司對(duì)于同款產(chǎn)品“搜狗語音助手”的技術(shù)服務(wù)支持做一個(gè)對(duì)比小測(cè)試,看一家從2009年開始從事語音識(shí)別技術(shù)的老牌企業(yè)——科大訊飛,與一家容納國(guó)內(nèi)10年實(shí)驗(yàn)室技術(shù)團(tuán)隊(duì)的新銳企業(yè)——云知聲,在反應(yīng)速度、識(shí)別能力和譯字準(zhǔn)確率方面的表現(xiàn)如何。
在本次的測(cè)試中,筆者的全部語音是使用相同循環(huán)錄音進(jìn)行輸入,以保證對(duì)比的公平性和準(zhǔn)確性。
【測(cè)試1】首先我們來看看在“搜狗語音助手”中,二者的集成方式有何區(qū)別。具體顯示結(jié)果:
圖1、云知聲語音輸入界面圖2、科大訊飛語音輸入界面
測(cè)試1結(jié)果:從上圖中我們可以清晰地看到,科大訊飛采用了傳統(tǒng)語音輸入的模式,彈出獨(dú)立對(duì)話框進(jìn)行語音輸入。而云知聲則是可定制的界面,在搜狗語音助手中是完全嵌入式語音輸入,在同一界面中即可完成輸入。當(dāng)然,這樣集成方式上的區(qū)別,就見仁見智了,筆者還是更傾向于嵌入式的音頻顯示,看起來更加清晰明了,不會(huì)覆蓋前面的對(duì)話內(nèi)容。
【測(cè)試2】專業(yè)詞匯。詞匯類別:軟件開發(fā)。測(cè)試語句為:“軟件設(shè)計(jì)包括設(shè)計(jì)軟件的功能和實(shí)現(xiàn)的算法和方法、軟件的總體結(jié)構(gòu)設(shè)計(jì)和模塊設(shè)計(jì)(普通話)”,得到以下測(cè)試結(jié)果,
測(cè)試2結(jié)果:通過專業(yè)詞匯測(cè)試看出,二者對(duì)于中文普通話的識(shí)別率比較高,只要發(fā)音夠標(biāo)準(zhǔn),云知聲的語音識(shí)別準(zhǔn)確率幾乎可達(dá)100%,另外對(duì)于整句話的邏輯性和條理性也非常清晰,專業(yè)詞句也能夠準(zhǔn)確識(shí)別,并沒有出現(xiàn)任何錯(cuò)別字。但科大訊飛在這輪的比拼中卻略顯劣勢(shì),邏輯性欠佳,并有錯(cuò)別字出現(xiàn)。
另外在測(cè)試中,筆者可以感受到云知聲的反應(yīng)速度是很快的,而科大訊飛可能要稍遜一籌。
【測(cè)試3】循環(huán)演說。測(cè)試內(nèi)容為:“在微博網(wǎng)友中流傳著一種‘黃金雞蛋‘做法,讓不少人躍躍欲試。瘋狂地晃動(dòng)你手中的生雞蛋,將蛋黃和蛋清混合,帶殼煮熟后,你就得到了一個(gè)’黃金雞蛋‘!這種蛋兒童更易使用,不會(huì)把蛋黃末弄得到處都是。但是經(jīng)過不少網(wǎng)友實(shí)踐,似乎很難將蛋黃蛋清搖勻!求專家解答!你試過嗎?(普通話連續(xù)說兩遍)”,這樣大段的內(nèi)容陳述,看看結(jié)果如何
測(cè)試3結(jié)果:從測(cè)試結(jié)果上來看,科大訊飛的輸入時(shí)間是有一些限制的,對(duì)于大段文字的輸入,訊飛可能還要擴(kuò)充一下輸入時(shí)間的限制范圍。另外,在識(shí)別準(zhǔn)確度上,云知聲變現(xiàn)的更為突出,幾乎沒有錯(cuò)別字的出現(xiàn)。細(xì)心的朋友可能還會(huì)發(fā)現(xiàn),用云知聲輸入的內(nèi)容,有很好的“斷句”,不會(huì)有冗長(zhǎng)的句式出現(xiàn)。
【測(cè)試4】方言測(cè)試。方言語種為武漢話,測(cè)試語句為“搜狗語音輸入插件”。測(cè)試結(jié)果
測(cè)試4結(jié)果:通過方言測(cè)試看出,兩款插件對(duì)方言的識(shí)別情況欠佳,識(shí)別出來的語句基本沒有任何調(diào)理和邏輯性。這也不奇怪,就算在現(xiàn)實(shí)溝通中,一個(gè)北方人到南方,也會(huì)經(jīng)常有一些聽不懂南方地區(qū)方言的情況出現(xiàn)。
【測(cè)試5】中英文混淆測(cè)試。測(cè)試內(nèi)容為:“ipad mini真好看,I want to buy it”,這樣大段的內(nèi)容陳述,看看結(jié)果如何,如圖11、圖12:
測(cè)試5結(jié)果: 從中英文混淆輸入的測(cè)試結(jié)果中我們可以看到,科大訊飛能夠準(zhǔn)確辨別中英文,做出正確的判斷及輸出。而新生的云知聲在對(duì)于中英文混合的識(shí)別準(zhǔn)確率還有待提升。相比之下,科大訊飛不愧是有著數(shù)年的積累,云知聲還應(yīng)該繼續(xù)努力,積累完善自己的技術(shù)。
-
語音技術(shù)
+關(guān)注
關(guān)注
2文章
226瀏覽量
21277 -
科大訊飛
+關(guān)注
關(guān)注
19文章
801瀏覽量
61257 -
云知聲
+關(guān)注
關(guān)注
0文章
185瀏覽量
8391
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
評(píng)論