0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

思必馳高始興對智能語音在車載領(lǐng)域的應(yīng)用的解讀

思必馳 ? 來源:djl ? 作者:思必馳 ? 2019-08-05 16:09 ? 次閱讀

現(xiàn)在語音交互在車載場景下有哪些應(yīng)用?痛點在哪些地方?難點在哪些地方?現(xiàn)在面臨哪些挑戰(zhàn)?怎么解決?包括產(chǎn)品設(shè)計,諸多的一些想法、問題,我來簡單分享一下幾個觀點,跟各位做一個交流。

我們見了很多的車載的后市場,包括傳統(tǒng)產(chǎn)業(yè)轉(zhuǎn)型,包括互聯(lián)網(wǎng)新型智能硬件開發(fā)者,像后視鏡、HUD等,現(xiàn)在大家普遍的感覺車載的語音交互是一個大的趨勢,但是依然有一些認(rèn)為在車載場景下語音的交互還是一個噱頭。主要是因為使用率最廣但漸漸成為調(diào)戲工具的SIRI,其次他們擔(dān)心在車載場景下的使用語音的安全性。我們認(rèn)為, SIRI等助手在手機端變成調(diào)戲工具,這是一個必然。早期很多助手應(yīng)用我們語音技術(shù),接入思必馳語音云,通過數(shù)據(jù)分析發(fā)現(xiàn),很多用戶問的事情是偏帶顏色的,比如問一些AV女優(yōu)、AV大片名字方便查詢。其次,現(xiàn)在應(yīng)用語音的車載產(chǎn)品大多只能做到簡單交互,只是為了市場跟風(fēng)而加上的功能,在產(chǎn)品設(shè)計和內(nèi)容方便明顯存在短板,不夠便捷不夠方便。

開車是非常乏味的事情,因此車載交互也在向趣味性方向發(fā)展,比如高德做的林志玲航的導(dǎo)航,我問了一下出租車司機,其中一個司機特別典型,他說我們開車非常悶,林志玲的聲音讓我心里挺激動的,沒有寂寞感。我們現(xiàn)在跟考拉也在做一些個性化的聲音,我們相信有人性化的車載交互會讓語音體驗大幅增加,會讓用戶的黏性大幅提高。林志玲的聲音高德在做了,我相信女孩喜歡聽男神的聲音,我們未來會出很多男神聲音、女神聲音,小孩聲音,個性化的語音合成,這本來也是思必馳的優(yōu)勢之一。

車載環(huán)境的語音交互,更重要的是能提升駕車安全。一般認(rèn)為,在車載里面的應(yīng)用操控應(yīng)該在兩秒之內(nèi),其實我覺得兩秒有點長,甚至應(yīng)該在一秒、零點幾秒,比如在高速上開車,速度是非??斓?,如果分神去做操控非常危險。但在設(shè)置導(dǎo)航、接聽電話、發(fā)微信的時候,緊急情況還是需要去操控它。毫無疑問,語音操控更加安全的?,F(xiàn)在車載產(chǎn)品的市場有1.6億,年增量2000萬,但是統(tǒng)計30%的車主在開車的時候是離不開手機的。這很危險。媒體經(jīng)常曝光拿手機發(fā)微信、發(fā)微博等等導(dǎo)致車禍。電影《2012》大家都看過,比尼說出“enginestar”啟動了保時捷死里逃生。在科幻電影里面的交互我相信在生活中能全部實現(xiàn)?,F(xiàn)在市面上馬上會出現(xiàn)全自然語音交互的車載產(chǎn)品,比如像戰(zhàn)斗機應(yīng)用的HUD技術(shù),樂駕CEO老馬會跟大家分享他們的HUD產(chǎn)品。

車主到底對智能語音交互接受程度怎么樣?沒有用戶接受,一款產(chǎn)品還是rubbish。騰訊做的一個調(diào)研, 76%的用戶對車載智能功能接受度越來越高,全語音控制導(dǎo)航的功能使用占比排第二,僅次于被盜車輛定位,中國太不安全了,小偷太多沒辦法。但即使車輛的定位、被盜的問題我相信未來語音的交互也能解決。比如現(xiàn)在我們汽車還是用鑰匙、用觸摸去開門,未來我們能不能用聲紋,比如說芝麻開門,車能夠識別主人身份,你可以給愛車起名字,你說話汽車就響應(yīng),別人說話不好使,這個一定能實現(xiàn)。

另外在汽車前裝市場很多高端車把語音交互系統(tǒng)作為標(biāo)配,這能引領(lǐng)和培育用戶認(rèn)知。我個人認(rèn)為前裝市場還是相對很難進入,而且創(chuàng)新的產(chǎn)品,優(yōu)秀的體驗還是從后裝做起,包括HUD、行車記錄儀、后視鏡,中控設(shè)備。前裝市場的思路相對比較傳統(tǒng),需要被顛覆,而且驗證周期特別長,像語音驗證周期一般兩三年,甚至三五年,飛馳鎂物很有經(jīng)驗,他們做了多年傳統(tǒng)前裝。

思必馳高始興對智能語音在車載領(lǐng)域的應(yīng)用的解讀

我們現(xiàn)在提智能語音基本上都認(rèn)為語音導(dǎo)航,其實不單單是導(dǎo)航,車載語音交互在向其他應(yīng)用擴展,服務(wù)性擴展?;仡^看,從2011年智能車載化到現(xiàn)在經(jīng)過了大概三個階段,傻瓜式1.0,擴展式2.0,和交互式的3.0。在2.0的時候語音控制還是比較低級,在交互式3.0語音需求和功能已經(jīng)上升第一位,甚至超過了LBS。再一個是相關(guān)的應(yīng)用的服務(wù),內(nèi)嵌的語音交互在大量拓展,整個車載生態(tài)在更繼續(xù)發(fā)展。

思必馳高始興對智能語音在車載領(lǐng)域的應(yīng)用的解讀

除了導(dǎo)航,其他很多服務(wù)和功能都需要語音交互,而且會做的越來越炫、越來越酷。比如收發(fā)短信,有些車載智能硬件已經(jīng)有這個功能,撥打電話,包括小說朗讀,天氣搜索,網(wǎng)絡(luò)電臺等等都已經(jīng)逐步邁入市場。網(wǎng)絡(luò)電臺方面,考拉做的很棒,未來我們跟老俞這方面會做的更加炫酷,有的人愿意聽謝霆峰的聲音,那你就可以選謝霆峰的聲音給你讀小說,現(xiàn)在這個技術(shù)已經(jīng)基本成熟,未來你把家人的聲音,比如男朋友、女朋友或者孩子聲音傳上去,自己下載一個語音包,未來你聽小說、聽電臺的內(nèi)容、聽新聞等等,這些都可以是你愛人的聲音、孩子的聲音,我們目前跟考拉、跟上海交大實驗室都在做這些事情。再一個微信,微信功能也是一個痛點需求,很多車禍就是因為司機在開車的時候收發(fā)微信,這一塊怎么做到極致體驗?一定要語音解決,樂駕做HUD“車蘿卜”,已經(jīng)解決了這個難點。另外,關(guān)于未來的拓展我很看好O2O,車載生態(tài)不僅僅是解決目前的一些功能,未來能不能我們在搜加油站、停車位、酒店時,像在手機端一樣形成一個閉環(huán),從搜索到導(dǎo)航到支付交易評價。社交,開車的時候我們通過行車記錄儀也好、HUD也好直接給景色拍照,全語音操作,能夠直接分享到微博、微信上。包括聲紋密碼,聲紋密碼不單是解鎖開車,不單是個人支付,我們希望要做到的就是它知道你的身份,知道你的相關(guān)的信息,推送的信息都是個性化的,甚至我們通過登陸查酒店的時候它知道你是男女,你的歷史記錄,你的年齡段。這些都是語音交互在車載方面的應(yīng)用可能。

現(xiàn)在車載智能硬件層出不窮,車機相對來說是挺主流的設(shè)備?,F(xiàn)在后視鏡市場特別火,行車記錄儀防碰瓷現(xiàn)在也非常流行,OBD目前還比較傳統(tǒng),車載音箱比如考拉做得很不錯,再包括一些其他的小智能硬件,車載環(huán)境里面到底哪一塊屏?xí)贾髁??還有一個說法,HUD抬頭顯示系統(tǒng)在戰(zhàn)斗機、高端車?yán)锩娑加?,現(xiàn)在全自然語音交互加手勢式交互的HUD概念已經(jīng)出來了,比如樂駕的“車蘿卜”,我覺得HUD也有很大可能,撬動未來車載的生態(tài)。不管怎么樣,絕對離不開語音交互。

從傻瓜式1.0到語音交互式3.0,從語音導(dǎo)航到其他功能,現(xiàn)已經(jīng)一步步成為現(xiàn)實。但現(xiàn)在去暢想O2O、聲紋密碼等,語音技術(shù)是不是已經(jīng)能夠直接應(yīng)用?我覺得還不到時候。語音交互雖然實現(xiàn)了技術(shù)上的可能性,但離質(zhì)的飛躍還有距離。目前的語音只是在載里面加上一個耳朵、一個嘴巴,還缺一個大腦,如何去協(xié)調(diào)在車載環(huán)境下遇到的種種挑戰(zhàn)。

第一,近場抗噪。語音識別在駕車的噪聲環(huán)境下怎么樣,人跟車機或者車載智能硬件往往有一段距離,0.3~1米的距離范圍里,噪聲很多,發(fā)動機聲噪、路噪、人的說話,音噪等,怎樣抗噪?播放音樂的時候回聲對消我們已經(jīng)能夠?qū)崿F(xiàn),在跟多種車載設(shè)備交互下的算法降噪,我們思必馳一直在研發(fā)并且目前也有一些還比較滿意的進步。

第二,自然語音交互。這是讓車載生態(tài)能夠發(fā)展最核心音素,現(xiàn)在車載交互還大多停留在簡單操控階段,簡單控制、簡單命令、簡單搜索、簡單查詢。但如果我們想撬動O2O,一定要首先形成閉環(huán)。就像人跟手機的關(guān)系,所有的購物、查詢搜索、玩游戲一定會在智能手機完成,不會再跳轉(zhuǎn)另一個設(shè)備上。車載生態(tài)起來一定會形成一個閉環(huán),不僅僅是簡單語音交互,一定是自然語言的交互、一定是對話式交互,這個是應(yīng)用趨勢。思必馳目前一直在努力地,就是真正的對話式人性化語言交互技術(shù)。

第三,產(chǎn)品設(shè)計層面的邏輯關(guān)系。我們智能車載硬件的麥克風(fēng)、喇叭、結(jié)構(gòu)布局和錄音收音效果的關(guān)系,怎么保證抗噪,包括我們語音交互跟后端服務(wù)怎么結(jié)合。比如語音導(dǎo)航時,能不能跳轉(zhuǎn)到搜音樂,在導(dǎo)航的時候能不能收發(fā)微信等,產(chǎn)品邏輯這是非常大的挑戰(zhàn)。這需要產(chǎn)品開發(fā)者和思必馳一起來討論來解決的問題。

(高總此刻給大家放了兩個視頻,一個是春節(jié)期間的山東糾正哥的網(wǎng)絡(luò)視頻,一個是思必馳最新的可糾正打斷功能的實際演示視頻。涉及到技術(shù)曝光,此刻先不做播放。如有興趣的,可關(guān)注7月中旬的思必馳新技術(shù)發(fā)布會。)

這是我們做的一個語音糾正的功能演示。糾正哥遇到的問題我們在車?yán)锩娴臅r候經(jīng)常遇到,在車載噪聲環(huán)境下語音識別很難達到百分之百,現(xiàn)在語音交互還是比較差,經(jīng)常會讓人抓狂,我們就做這批技術(shù),能夠隨時打斷和糾正機器的判斷和識別。我們在7月份會有新技術(shù)的大型發(fā)布會,到時候會邀請各位朋友參加。目前的語音交互僅僅實現(xiàn)操控、命令,簡單的查詢,這是遠(yuǎn)遠(yuǎn)不行的,一定是真正的智能語音的技術(shù)的進步,才能讓整個生態(tài)進來,才能讓整個整個產(chǎn)品體驗帶來質(zhì)的飛躍。

思必馳高始興對智能語音在車載領(lǐng)域的應(yīng)用的解讀

最后插播小廣告——關(guān)于思必馳。我們最早成立劍橋大學(xué),現(xiàn)在拿到兩輪投資,我們專注人機對話,以及語音識別、理解、合成、設(shè)備一系列技術(shù),我們把這個技術(shù)做成開放解決方案,提供垂直行業(yè)像車載、家居、穿戴,包括機器人玩具等等這些行業(yè)的開發(fā)者,讓他們結(jié)成了我們的相關(guān)的SDK方案以后提升產(chǎn)品的交互體驗。車載方面我們對芯片廠商、方案廠商,還有車載智能硬件合作伙伴提供我們們相關(guān)的技術(shù)和方案。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 導(dǎo)航
    +關(guān)注

    關(guān)注

    7

    文章

    528

    瀏覽量

    42415
  • 智能語音
    +關(guān)注

    關(guān)注

    10

    文章

    783

    瀏覽量

    48773
  • 思必馳
    +關(guān)注

    關(guān)注

    4

    文章

    284

    瀏覽量

    14288
收藏 人收藏

    評論

    相關(guān)推薦

    攜手長城汽車入選2024年人工智能先鋒案例集

    日前,中國人工智能產(chǎn)業(yè)發(fā)展聯(lián)盟《2024年人工智能先鋒案例集》正式發(fā)布,長城汽車與聯(lián)合申報的“長城汽車Coffee Al
    的頭像 發(fā)表于 11-26 17:56 ?944次閱讀

    帶來全新辦公體驗!發(fā)布AI辦公本Turbo

    是基于千萬小時的會議訓(xùn)練數(shù)據(jù)進行優(yōu)化的。它能夠?qū)崿F(xiàn)手寫輸入、圖像掃描、語音輸入以及歷史筆記文檔的跨模態(tài)融合,從而極大地提升了用戶在會議記錄、整理等方面的效率。 智能筆記是
    的頭像 發(fā)表于 11-06 11:30 ?523次閱讀

    發(fā)布AI辦公本Turbo,搭載專業(yè)級跨模態(tài)會議大模型

    近日,正式發(fā)布了其最新的AI辦公本Turbo,該設(shè)備搭載了專業(yè)級的跨模態(tài)會議大模型。這一創(chuàng)新技術(shù)的引入,標(biāo)志著
    的頭像 發(fā)表于 10-31 17:03 ?496次閱讀

    AI辦公本Turbo重磅發(fā)布

    近日,AI辦公本新品發(fā)布會如約而至,IOT事業(yè)部首席產(chǎn)品官馬斌斌詳細(xì)介紹了
    的頭像 發(fā)表于 10-31 14:23 ?466次閱讀

    10月份大事件盤點

    日前,省科技廳黨組書記、廳長徐光輝一行在進行調(diào)研。董事長、CEO
    的頭像 發(fā)表于 10-30 15:01 ?352次閱讀

    江蘇省科技廳領(lǐng)導(dǎo)蒞臨調(diào)研

    近日,省科技廳黨組書記、廳長徐光輝一行在進行調(diào)研。市科技局黨組書記、局長徐積明、省科技廳科技戰(zhàn)略規(guī)劃處處長李杰、園區(qū)科創(chuàng)委副主任楊小波等陪同調(diào)研。
    的頭像 發(fā)表于 10-18 10:19 ?435次閱讀

    9月份大事件盤點

    在“人工智能+”創(chuàng)新發(fā)展試驗區(qū)推進大會上,發(fā)布了蘇州市制造業(yè)應(yīng)用模型——中樞大模型,圍繞人工智能在行業(yè)中的痛點問題,整合多模態(tài)數(shù)據(jù),實
    的頭像 發(fā)表于 10-14 14:05 ?487次閱讀

    攜手新一代哈弗H6共創(chuàng)智能出行新未來

    隨著汽車行業(yè)邁入智能化的新時代,消費者對智能交互體驗的期待也在不斷提升。新一代哈弗H6搭載了由提供
    的頭像 發(fā)表于 09-18 11:37 ?474次閱讀

    獲得TISAX最高等級AL3級認(rèn)證

    近日,經(jīng)過充分的準(zhǔn)備和嚴(yán)格的評審,科技股份有限公司已成功獲得TISAX最高等級AL3級的認(rèn)證標(biāo)簽,這一認(rèn)證標(biāo)志著
    的頭像 發(fā)表于 07-25 10:49 ?637次閱讀

    攜手長虹美菱共研AI引領(lǐng)智能家居新潮流

    月9日,董事長、CEO始興,
    的頭像 發(fā)表于 07-15 10:45 ?471次閱讀
    <b class='flag-5'>思</b><b class='flag-5'>必</b><b class='flag-5'>馳</b>攜手長虹美菱共研AI引領(lǐng)<b class='flag-5'>智能</b>家居新潮流

    廣西柳州的智能制造基地正式投入試運行

    近日,隨著一臺臺智能智造設(shè)備的陸續(xù)進廠和調(diào)試完成,位于廣西柳州的智能制造基地正式投入試運行。
    的頭像 發(fā)表于 05-29 10:32 ?482次閱讀

    AWE現(xiàn)場 | ×康佳:智能聲控,視聽隨心

    (AWE2024)在上海新國際博覽中心盛大開幕。展會現(xiàn)場,展臺展示的康佳電視吸引了大批消費者和媒體記者的駐足。 作為國內(nèi)知名品牌,康佳電視無論是在畫質(zhì)還是音質(zhì)上都表現(xiàn)的非常出色。在
    的頭像 發(fā)表于 03-18 12:15 ?358次閱讀

    北汽研究總院與簽署戰(zhàn)略合作協(xié)議

    2月29日,北汽研究總院與科技股份有限公司(以下簡稱)簽署戰(zhàn)略協(xié)議,將依托各自優(yōu)勢,
    的頭像 發(fā)表于 03-11 14:59 ?670次閱讀

    出席大模型與智能汽車新應(yīng)用論壇

    、中國信息通信研究院、浙江大學(xué)、等各單位領(lǐng)導(dǎo)及業(yè)界專家共計80余人共同出席,分享在AI大模型領(lǐng)域取得的最新成果和經(jīng)驗,探討人工智能在實
    的頭像 發(fā)表于 01-11 10:38 ?633次閱讀

    完成新一輪首期兩億元融資

    科技股份有限公司(以下簡稱“”)完成新一輪首期兩億元融資,后續(xù)
    的頭像 發(fā)表于 01-11 10:37 ?644次閱讀