語音交互在汽車行業(yè)的應(yīng)用并非是最近幾年才出現(xiàn)的,早在2000年的時(shí)候就已經(jīng)有汽車搭載了語音交互,但那時(shí)用戶對(duì)這種交互方式還非常陌生,使用頻率也很低。
近年來,隨著人工智能、車聯(lián)網(wǎng)以及無人駕駛技術(shù)的快速發(fā)展,車載語音才真正地火爆起來為用戶所熟知。
盡管主機(jī)廠、供應(yīng)商叫囂著汽車的車載語音如何準(zhǔn)確、如何智能等,尷尬的現(xiàn)實(shí)情況卻是車載語音的火熱程度和它的用戶體驗(yàn)度之間并不是一個(gè)正向遞增關(guān)系。
簡而言之,就是用戶對(duì)現(xiàn)今車載語音的體驗(yàn)并不滿意。想讓用戶心甘情愿的為語音交互買單,語音技術(shù)廠商需要做出更多成果讓用戶信服。
合格的車載語音首先要保證聽得見
作為一家語音技術(shù)方案商,思必馳一直專注垂直領(lǐng)域下的智能對(duì)話式交互,根據(jù)各個(gè)垂直行業(yè)做場景化的語音技術(shù)創(chuàng)新、優(yōu)化,做差異化的語音解決方案。先后推出環(huán)形6+1遠(yuǎn)場麥克風(fēng)陣列、車載天琴助手、DUI-對(duì)話定制平臺(tái)和會(huì)話精靈企業(yè)服務(wù)等多種業(yè)務(wù)方案。
在車載語音交互上,思必馳始終保持對(duì)車載的垂直領(lǐng)域進(jìn)行不斷的技術(shù)創(chuàng)新,包括不斷引進(jìn)國際化專家人才和人工智能人才培養(yǎng)。除了技術(shù)端,產(chǎn)品端口也一直不斷從穩(wěn)定性、客戶剛需以及增加樂趣三個(gè)維度來進(jìn)行產(chǎn)品體驗(yàn)的提升。
互聯(lián)網(wǎng)在汽車領(lǐng)域的大規(guī)模普及和應(yīng)用已經(jīng)成為了既定的事實(shí),未來車聯(lián)網(wǎng)和自動(dòng)駕駛技術(shù)的不斷發(fā)展將會(huì)把汽車變成一個(gè)重要的入網(wǎng)端口。
作為一個(gè)人機(jī)交互系統(tǒng),汽車上所有的功能應(yīng)用都是基于安全這個(gè)大前提進(jìn)行的,所以選擇一個(gè)安全自然的交互方式就顯得尤為重要,這也是為什么當(dāng)下的觸屏 交互并不是最合適的車內(nèi)交互方式。
思必馳車載事業(yè)部副總經(jīng)理宋佳認(rèn)為,與按鍵和觸控相比,語音交互是一個(gè)更好好的選擇,它可以讓駕駛員的雙眼鎖定在前方道路,不用低頭或是視線偏移,而僅靠語音指令就能夠?qū)崟r(shí)溝通。在確保駕駛安全的前提下,駕駛員也能夠獲得更舒適流暢的車內(nèi)交流體驗(yàn)。
現(xiàn)在很多用戶抱怨車載語音不好用,很大原因在于車載語音在第一階段的接收和識(shí)別過程就已經(jīng)出現(xiàn)問題。一方面是來自于語音識(shí)別引擎本身存在不完善,另一方面,其實(shí)對(duì)汽車的使用環(huán)境而言,麥克風(fēng)陣列的設(shè)計(jì)也影響著整個(gè)車載語音的識(shí)別準(zhǔn)確性。
宋佳表示,車載語音的交互并不是簡單的把識(shí)別引擎和硬件車機(jī)進(jìn)行綁定就能夠達(dá)到一個(gè)很好的體驗(yàn)效果,如果麥克風(fēng)和音腔結(jié)構(gòu)不合格,語音識(shí)別引擎再準(zhǔn)確也難以發(fā)揮作用。因此在硬件方面,麥克風(fēng)陣列和整個(gè)車機(jī)設(shè)計(jì)將是未來語音識(shí)別需要重點(diǎn)關(guān)注的部分。
對(duì)于車載語音交互來說,首先需要做到語音識(shí)別結(jié)果的準(zhǔn)確性,保證識(shí)別率,才能真的聽的清、聽得懂,其次是對(duì)接豐富的第三方資源,具備較廣泛的知識(shí)面,能夠完成車內(nèi)生活相關(guān)的指令。
宋佳表示,目前思必馳打造的天琴系統(tǒng)就已經(jīng)初步具備了用戶對(duì)智能車載語音交互的需求。
天琴系統(tǒng)是一個(gè)人車合一的多模式交互系統(tǒng),語音是首要的交互入口,用戶可以通過語音發(fā)布指令,完成搜索、查找等動(dòng)作。在導(dǎo)航時(shí),用戶不需要手動(dòng)操作就可以快速完成搜索目的地、查找路線等一系列操作,減少了用戶使用雙手帶來的駕駛安全問題。
此外,語音并不是唯一的交互選擇,在天琴系統(tǒng)中,思必馳將語音、觸控屏和方向盤進(jìn)行了高度的融合,使三者之間的交互實(shí)現(xiàn)了互融互通。這其實(shí)也是現(xiàn)在車載交互發(fā)展的趨勢,在觸控和物理按鍵無法被完全取代之前,三者不同交互方式之間實(shí)現(xiàn)有機(jī)的結(jié)合是最好的選擇。
值得一提的是, 思必馳的天琴系統(tǒng)優(yōu)化了基于場景化的語音提醒,解決了用戶不知道如何與語音產(chǎn)品對(duì)話的煩惱,也省去用戶自己花費(fèi)時(shí)間挖掘產(chǎn)品功能,降低學(xué)習(xí)使用的門檻,實(shí)現(xiàn)了可見即可說。
智能化的車載語音應(yīng)該具有主動(dòng)思考和預(yù)判能力
除了在識(shí)別準(zhǔn)確率上存在的問題,現(xiàn)階段的車載語音還面臨著如何提高智能化的問題,比如,用戶希望車載語音系統(tǒng)能夠像真正的人工智能一樣,具有主動(dòng)思考的能力。當(dāng)用戶發(fā)出指令的時(shí)候,能夠快速的反應(yīng)并捕獲用戶接下來的意圖,幫助用戶做出決定。
宋佳表示,車載語音交互再往更高一層發(fā)展必然是智能化的語音交互,而智能語音交互不是簡單的語音+車聯(lián)網(wǎng)的組合,它背后必然是基于機(jī)器大量的深度學(xué)習(xí),包括從數(shù)據(jù)中尋找類似事例來訓(xùn)練或是通過歸納大數(shù)據(jù)樣本的共性對(duì)語音指令做出決斷。
這也是語音技術(shù)發(fā)展的難點(diǎn)。
事實(shí)上,當(dāng)前市面上多數(shù)語音技術(shù)方案商研發(fā)的語音+車聯(lián)網(wǎng)場景的應(yīng)用平臺(tái),大部分是基于硬性的問答式語音交互,而針對(duì)智能化、人性化的語音交互的探索還不夠深入,導(dǎo)致車機(jī)的主動(dòng)思考及預(yù)判能力幾乎為零。
因此,對(duì)于語音供應(yīng)商來說,如何讓車載語音覆蓋更多的應(yīng)用場景提高它的思考預(yù)判能力成為車載語音智能化的關(guān)鍵。
思必馳的天琴系統(tǒng)通過場景化語義解析,涵蓋導(dǎo)航、電臺(tái)、音樂、電話、應(yīng)用操控、汽車操控、違章查詢、指定地點(diǎn)查詢、路況、今日限行等各領(lǐng)域內(nèi)容。
基于周邊服務(wù)的整合,語音系統(tǒng)已經(jīng)可以開始預(yù)判用戶的需求,并幫助用戶做出預(yù)判。例如用戶語音搜索目的地電影院,系統(tǒng)除了快速彈出電影院推薦、結(jié)合導(dǎo)航時(shí)間進(jìn)行場次推薦外,還能直接幫助訂票、選位。
技術(shù)的不斷創(chuàng)新對(duì)語音交互來說非常重要 ,因?yàn)檎Z音底層技術(shù)能確保系統(tǒng)更清晰的識(shí)別用戶的語音指令,從而更好的接收指令、理解指令,最后快速的做出反饋。
但是隨著底層技術(shù)能力的不斷提升,未來關(guān)于語音交互服務(wù)的整合能力將成為影響用戶體驗(yàn)的關(guān)鍵。這種整合能力不僅是讓車載語音系統(tǒng)聽得清楚、聽得懂,更重要的是如何將不同資源、服務(wù)對(duì)接,成為名副其實(shí)的智能語音。
畢竟,語音交互只是手段,不是最終目的,交互的目的只是為了讓機(jī)器更好地完成任務(wù)提升用戶體驗(yàn)。
據(jù)思必馳介紹,公司現(xiàn)在已經(jīng)占據(jù)了車載語音后裝市場70%的市場份額,今年進(jìn)入前裝市場,目前前裝已經(jīng)合作幾十家tier1企業(yè)和車廠,大部分都已量產(chǎn)上市。
宋佳表示,未來思必馳還將繼續(xù)拓寬車載語音的應(yīng)用,2019年將實(shí)現(xiàn)聲紋商用落地,單輛車多賬戶并存成為可能,同時(shí),還會(huì)有基于聲紋的個(gè)性化推薦和回復(fù)。在語音識(shí)別上,多麥克風(fēng)陣列實(shí)現(xiàn)對(duì)不同方位的聲源定位,可以提供不同座位的獨(dú)立車控操作。
-
智能化
+關(guān)注
關(guān)注
15文章
4927瀏覽量
55583 -
車載語音
+關(guān)注
關(guān)注
0文章
19瀏覽量
10387
原文標(biāo)題:從聽見到聽懂,思必馳在車載語音方面如何做好垂直化、差異化? | GGAI專訪
文章出處:【微信號(hào):ilove-ev,微信公眾號(hào):高工智能汽車】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
評(píng)論