現(xiàn)在語音交互在車載場景下有哪些應(yīng)用?痛點在哪些地方?難點在哪些地方?現(xiàn)在面臨哪些挑戰(zhàn)?怎么解決?包括產(chǎn)品設(shè)計,諸多的一些想法、問題,我來簡單分享一下幾個觀點,跟各位做一個交流。
我們見了很多的車載的后市場,包括傳統(tǒng)產(chǎn)業(yè)轉(zhuǎn)型,包括互聯(lián)網(wǎng)新型智能硬件開發(fā)者,像后視鏡、HUD等,現(xiàn)在大家普遍的感覺車載的語音交互是一個大的趨勢,但是依然有一些認(rèn)為在車載場景下語音的交互還是一個噱頭。主要是因為使用率最廣但漸漸成為調(diào)戲工具的SIRI,其次他們擔(dān)心在車載場景下的使用語音的安全性。我們認(rèn)為, SIRI等助手在手機端變成調(diào)戲工具,這是一個必然。早期很多助手應(yīng)用我們語音技術(shù),接入思必馳語音云,通過數(shù)據(jù)分析發(fā)現(xiàn),很多用戶問的事情是偏帶顏色的,比如問一些AV女優(yōu)、AV大片名字方便查詢。其次,現(xiàn)在應(yīng)用語音的車載產(chǎn)品大多只能做到簡單交互,只是為了市場跟風(fēng)而加上的功能,在產(chǎn)品設(shè)計和內(nèi)容方便明顯存在短板,不夠便捷不夠方便。
開車是非常乏味的事情,因此車載交互也在向趣味性方向發(fā)展,比如高德做的林志玲航的導(dǎo)航,我問了一下出租車司機,其中一個司機特別典型,他說我們開車非常悶,林志玲的聲音讓我心里挺激動的,沒有寂寞感。我們現(xiàn)在跟考拉也在做一些個性化的聲音,我們相信有人性化的車載交互會讓語音體驗大幅增加,會讓用戶的黏性大幅提高。林志玲的聲音高德在做了,我相信女孩喜歡聽男神的聲音,我們未來會出很多男神聲音、女神聲音,小孩聲音,個性化的語音合成,這本來也是思必馳的優(yōu)勢之一。
車載環(huán)境的語音交互,更重要的是能提升駕車安全。一般認(rèn)為,在車載里面的應(yīng)用操控應(yīng)該在兩秒之內(nèi),其實我覺得兩秒有點長,甚至應(yīng)該在一秒、零點幾秒,比如在高速上開車,速度是非??斓?,如果分神去做操控非常危險。但在設(shè)置導(dǎo)航、接聽電話、發(fā)微信的時候,緊急情況還是需要去操控它。毫無疑問,語音操控更加安全的?,F(xiàn)在車載產(chǎn)品的市場有1.6億,年增量2000萬,但是統(tǒng)計30%的車主在開車的時候是離不開手機的。這很危險。媒體經(jīng)常曝光拿手機發(fā)微信、發(fā)微博等等導(dǎo)致車禍。電影《2012》大家都看過,比尼說出“enginestar”啟動了保時捷死里逃生。在科幻電影里面的交互我相信在生活中能全部實現(xiàn)?,F(xiàn)在市面上馬上會出現(xiàn)全自然語音交互的車載產(chǎn)品,比如像戰(zhàn)斗機應(yīng)用的HUD技術(shù),樂駕CEO老馬會跟大家分享他們的HUD產(chǎn)品。
車主到底對智能語音交互接受程度怎么樣?沒有用戶接受,一款產(chǎn)品還是rubbish。騰訊做的一個調(diào)研, 76%的用戶對車載智能功能接受度越來越高,全語音控制導(dǎo)航的功能使用占比排第二,僅次于被盜車輛定位,中國太不安全了,小偷太多沒辦法。但即使車輛的定位、被盜的問題我相信未來語音的交互也能解決。比如現(xiàn)在我們汽車還是用鑰匙、用觸摸去開門,未來我們能不能用聲紋,比如說芝麻開門,車能夠識別主人身份,你可以給愛車起名字,你說話汽車就響應(yīng),別人說話不好使,這個一定能實現(xiàn)。
另外在汽車前裝市場很多高端車把語音交互系統(tǒng)作為標(biāo)配,這能引領(lǐng)和培育用戶認(rèn)知。我個人認(rèn)為前裝市場還是相對很難進入,而且創(chuàng)新的產(chǎn)品,優(yōu)秀的體驗還是從后裝做起,包括HUD、行車記錄儀、后視鏡,中控設(shè)備。前裝市場的思路相對比較傳統(tǒng),需要被顛覆,而且驗證周期特別長,像語音驗證周期一般兩三年,甚至三五年,飛馳鎂物很有經(jīng)驗,他們做了多年傳統(tǒng)前裝。
我們現(xiàn)在提智能語音基本上都認(rèn)為語音導(dǎo)航,其實不單單是導(dǎo)航,車載語音交互在向其他應(yīng)用擴展,服務(wù)性擴展?;仡^看,從2011年智能車載化到現(xiàn)在經(jīng)過了大概三個階段,傻瓜式1.0,擴展式2.0,和交互式的3.0。在2.0的時候語音控制還是比較低級,在交互式3.0語音需求和功能已經(jīng)上升第一位,甚至超過了LBS。再一個是相關(guān)的應(yīng)用的服務(wù),內(nèi)嵌的語音交互在大量拓展,整個車載生態(tài)在更繼續(xù)發(fā)展。
除了導(dǎo)航,其他很多服務(wù)和功能都需要語音交互,而且會做的越來越炫、越來越酷。比如收發(fā)短信,有些車載智能硬件已經(jīng)有這個功能,撥打電話,包括小說朗讀,天氣搜索,網(wǎng)絡(luò)電臺等等都已經(jīng)逐步邁入市場。網(wǎng)絡(luò)電臺方面,考拉做的很棒,未來我們跟老俞這方面會做的更加炫酷,有的人愿意聽謝霆峰的聲音,那你就可以選謝霆峰的聲音給你讀小說,現(xiàn)在這個技術(shù)已經(jīng)基本成熟,未來你把家人的聲音,比如男朋友、女朋友或者孩子聲音傳上去,自己下載一個語音包,未來你聽小說、聽電臺的內(nèi)容、聽新聞等等,這些都可以是你愛人的聲音、孩子的聲音,我們目前跟考拉、跟上海交大實驗室都在做這些事情。再一個微信,微信功能也是一個痛點需求,很多車禍就是因為司機在開車的時候收發(fā)微信,這一塊怎么做到極致體驗?一定要語音解決,樂駕做HUD“車蘿卜”,已經(jīng)解決了這個難點。另外,關(guān)于未來的拓展我很看好O2O,車載生態(tài)不僅僅是解決目前的一些功能,未來能不能我們在搜加油站、停車位、酒店時,像在手機端一樣形成一個閉環(huán),從搜索到導(dǎo)航到支付交易評價。社交,開車的時候我們通過行車記錄儀也好、HUD也好直接給景色拍照,全語音操作,能夠直接分享到微博、微信上。包括聲紋密碼,聲紋密碼不單是解鎖開車,不單是個人支付,我們希望要做到的就是它知道你的身份,知道你的相關(guān)的信息,推送的信息都是個性化的,甚至我們通過登陸查酒店的時候它知道你是男女,你的歷史記錄,你的年齡段。這些都是語音交互在車載方面的應(yīng)用可能。
現(xiàn)在車載智能硬件層出不窮,車機相對來說是挺主流的設(shè)備?,F(xiàn)在后視鏡市場特別火,行車記錄儀防碰瓷現(xiàn)在也非常流行,OBD目前還比較傳統(tǒng),車載音箱比如考拉做得很不錯,再包括一些其他的小智能硬件,車載環(huán)境里面到底哪一塊屏?xí)贾髁??還有一個說法,HUD抬頭顯示系統(tǒng)在戰(zhàn)斗機、高端車?yán)锩娑加?,現(xiàn)在全自然語音交互加手勢式交互的HUD概念已經(jīng)出來了,比如樂駕的“車蘿卜”,我覺得HUD也有很大可能,撬動未來車載的生態(tài)。不管怎么樣,絕對離不開語音交互。
從傻瓜式1.0到語音交互式3.0,從語音導(dǎo)航到其他功能,現(xiàn)已經(jīng)一步步成為現(xiàn)實。但現(xiàn)在去暢想O2O、聲紋密碼等,語音技術(shù)是不是已經(jīng)能夠直接應(yīng)用?我覺得還不到時候。語音交互雖然實現(xiàn)了技術(shù)上的可能性,但離質(zhì)的飛躍還有距離。目前的語音只是在載里面加上一個耳朵、一個嘴巴,還缺一個大腦,如何去協(xié)調(diào)在車載環(huán)境下遇到的種種挑戰(zhàn)。
第一,近場抗噪。語音識別在駕車的噪聲環(huán)境下怎么樣,人跟車機或者車載智能硬件往往有一段距離,0.3~1米的距離范圍里,噪聲很多,發(fā)動機聲噪、路噪、人的說話,音噪等,怎樣抗噪?播放音樂的時候回聲對消我們已經(jīng)能夠?qū)崿F(xiàn),在跟多種車載設(shè)備交互下的算法降噪,我們思必馳一直在研發(fā)并且目前也有一些還比較滿意的進步。
第二,自然語音交互。這是讓車載生態(tài)能夠發(fā)展最核心音素,現(xiàn)在車載交互還大多停留在簡單操控階段,簡單控制、簡單命令、簡單搜索、簡單查詢。但如果我們想撬動O2O,一定要首先形成閉環(huán)。就像人跟手機的關(guān)系,所有的購物、查詢搜索、玩游戲一定會在智能手機完成,不會再跳轉(zhuǎn)另一個設(shè)備上。車載生態(tài)起來一定會形成一個閉環(huán),不僅僅是簡單語音交互,一定是自然語言的交互、一定是對話式交互,這個是應(yīng)用趨勢。思必馳目前一直在努力地,就是真正的對話式人性化語言交互技術(shù)。
第三,產(chǎn)品設(shè)計層面的邏輯關(guān)系。我們智能車載硬件的麥克風(fēng)、喇叭、結(jié)構(gòu)布局和錄音收音效果的關(guān)系,怎么保證抗噪,包括我們語音交互跟后端服務(wù)怎么結(jié)合。比如語音導(dǎo)航時,能不能跳轉(zhuǎn)到搜音樂,在導(dǎo)航的時候能不能收發(fā)微信等,產(chǎn)品邏輯這是非常大的挑戰(zhàn)。這需要產(chǎn)品開發(fā)者和思必馳一起來討論來解決的問題。
(高總此刻給大家放了兩個視頻,一個是春節(jié)期間的山東糾正哥的網(wǎng)絡(luò)視頻,一個是思必馳最新的可糾正打斷功能的實際演示視頻。涉及到技術(shù)曝光,此刻先不做播放。如有興趣的,可關(guān)注7月中旬的思必馳新技術(shù)發(fā)布會。)
這是我們做的一個語音糾正的功能演示。糾正哥遇到的問題我們在車?yán)锩娴臅r候經(jīng)常遇到,在車載噪聲環(huán)境下語音識別很難達到百分之百,現(xiàn)在語音交互還是比較差,經(jīng)常會讓人抓狂,我們就做這批技術(shù),能夠隨時打斷和糾正機器的判斷和識別。我們在7月份會有新技術(shù)的大型發(fā)布會,到時候會邀請各位朋友參加。目前的語音交互僅僅實現(xiàn)操控、命令,簡單的查詢,這是遠(yuǎn)遠(yuǎn)不行的,一定是真正的智能語音的技術(shù)的進步,才能讓整個生態(tài)進來,才能讓整個整個產(chǎn)品體驗帶來質(zhì)的飛躍。
最后插播小廣告——關(guān)于思必馳。我們最早成立劍橋大學(xué),現(xiàn)在拿到兩輪投資,我們專注人機對話,以及語音識別、理解、合成、設(shè)備一系列技術(shù),我們把這個技術(shù)做成開放解決方案,提供垂直行業(yè)像車載、家居、穿戴,包括機器人玩具等等這些行業(yè)的開發(fā)者,讓他們結(jié)成了我們的相關(guān)的SDK方案以后提升產(chǎn)品的交互體驗。車載方面我們對芯片廠商、方案廠商,還有車載智能硬件合作伙伴提供我們們相關(guān)的技術(shù)和方案。
-
導(dǎo)航
+關(guān)注
關(guān)注
7文章
528瀏覽量
42415 -
智能語音
+關(guān)注
關(guān)注
10文章
783瀏覽量
48773 -
思必馳
+關(guān)注
關(guān)注
4文章
284瀏覽量
14288
發(fā)布評論請先 登錄
相關(guān)推薦
評論