0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

如何在人與汽車之間構(gòu)建一個(gè)交互系統(tǒng)?

我快閉嘴 ? 來源:蓋世汽車快訊 ? 作者: 童郜 ? 2020-09-02 10:07 ? 次閱讀

霍金輪椅是當(dāng)今人機(jī)交互的集大成者

“WOW!”—這是斯蒂芬霍金用眼睛寫完的人生最后一句話,無比深情地表達(dá)了他對(duì)世界的熱愛!

霍金是繼牛頓和愛因斯坦之后最杰出的科學(xué)家之一,被譽(yù)為宇宙之王。但命運(yùn)似乎和霍金開了個(gè)玩笑,他在21歲就被確診為“漸凍癥”,不能言語。為了讓霍金能夠繼續(xù)創(chuàng)造科學(xué)奇跡,世界前沿科技公司為霍金的輪椅安裝了電腦等設(shè)備,配置了文字轉(zhuǎn)換語音、紅外線監(jiān)測(cè)、人臉識(shí)別、眼球追蹤等技術(shù),可以把思想轉(zhuǎn)化為文字。此后,霍金用自己的勇氣與堅(jiān)持做出了常人難以企及的成就,提出了著名的“霍金輻射”學(xué)說??梢哉f,霍金輪椅是當(dāng)今人機(jī)交互的“集大成者”,是人類思想與機(jī)械力量擦出的強(qiáng)火花。

如何在人與汽車之間構(gòu)建一個(gè)交互系統(tǒng)

語音轉(zhuǎn)文字并不稀奇,微信中幾乎每天都會(huì)用到它。人臉識(shí)別技術(shù)、眼球追蹤技術(shù)才是霍金輪椅的先進(jìn)之處。不過隨著科技發(fā)展,這兩項(xiàng)技術(shù)在汽車中已經(jīng)被廣泛應(yīng)用。今年7月份上市的凱迪拉克CT6就配置了Super Cruise超級(jí)智能駕駛系統(tǒng),集成了用于人臉識(shí)別的攝像頭和紅外線發(fā)射器。在你疲勞駕駛時(shí),可以更主動(dòng)的給予提醒。剛剛開啟預(yù)售的威馬EX6 Plus 6座則配置了更先進(jìn)的“眼神智控”,具備人臉識(shí)別、視線喚醒、疲勞檢測(cè)三大模塊。像霍金的傳奇輪椅一樣,這套系統(tǒng)只需你給它一個(gè)眼神,就可以瞬間秒懂你的想法。

可以發(fā)現(xiàn),無論是“眼神智控”還是人臉識(shí)別,本質(zhì)上反映的是機(jī)器如何獨(dú)立思考,如何做決策,如何更好的服務(wù)人類。那么,人類工程師是如何實(shí)現(xiàn)人與汽車溝通,或者說如何在人與汽車之間構(gòu)建一個(gè)交互系統(tǒng)。

第一階段的人車交互:沒有腦子的汽車和只能下命令的人類

一切的技術(shù)謎團(tuán)都要在從最初的需求出發(fā),人與汽車的交互系統(tǒng)由人對(duì)汽車的便捷性需求催生。進(jìn)入工業(yè)化社會(huì),“我很忙”變成了每個(gè)職場(chǎng)人的口頭禪,在生活與工作之間疲于應(yīng)對(duì)的人們更加需要一臺(tái)更懂他的汽車。然而從需求出現(xiàn)到市場(chǎng)滿足,總需要一個(gè)過程,打工族不是霍金,不可能讓一堆世界前沿公司不惜一切成本為其量身定制,更何況霍金的輪椅也經(jīng)歷了漫長(zhǎng)的升級(jí)迭代。于是汽車開始出現(xiàn)了一些最早的智能交互,在2013年凱迪拉克車型就已經(jīng)搭載了CUE人車交互系統(tǒng),用戶按下方向盤上的啟動(dòng)按鈕,然后說出“打開空調(diào)”,汽車就可以自動(dòng)開啟空調(diào)。在當(dāng)時(shí),汽車智能化雖然在國(guó)內(nèi)正在如火如荼的進(jìn)行,但在市場(chǎng)端,國(guó)產(chǎn)品牌依舊沒有拿出比較成熟的產(chǎn)品。豪華品牌在技術(shù)上,依然占據(jù)引導(dǎo)作用,并依靠這種時(shí)髦的科技,賺足了眼球。

即便以今天的眼光,這種指令式人車交互也有獨(dú)特優(yōu)勢(shì)。它更簡(jiǎn)單、高效,說讓汽車干啥,汽車就能干啥。缺點(diǎn)也很明顯,一個(gè)功能對(duì)應(yīng)一條指令,想要玩轉(zhuǎn)這一套,需要花時(shí)間去學(xué)習(xí)。最關(guān)鍵的是,智能化不是讓人去學(xué)習(xí)語言,而是讓機(jī)器去學(xué)習(xí)人類。而且指令式人車交互,在實(shí)際體驗(yàn)中,也不完美。想要的打開空調(diào)時(shí),就必須方向盤上操作一番,然后對(duì)著車機(jī)系統(tǒng)吼一通。可實(shí)際上,啟動(dòng)空調(diào)很簡(jiǎn)單,隨手一摁就行,完全不需要如此麻煩。

第二階段: 狂背單詞的汽車和愛講話的人類

初期的人車交互尷尬問題,并沒有打擊到汽車工程師,對(duì)于這類人來說,與天斗,與地斗,與機(jī)器斗,其樂無窮! 很快,就出現(xiàn)了以“免喚醒詞”為代表的人車交互新方式,標(biāo)志著汽車開始嘗試以朋友的角色,理解你。

那么,免喚醒詞是什么鬼?現(xiàn)在讓我們回想一下人機(jī)交互使用場(chǎng)景。例如,我正在用小鵬G3,我要去外灘看大海,我會(huì)說:“小P、小P”,我要打開地圖。但如果我們真的把“小P”當(dāng)朋友,像朋友一樣面對(duì)面的交流,我們就不會(huì)每句話都“指名道姓”,我們會(huì)說,去外灘看海景。在這個(gè)過程中,“小P、小P”被省略,“去外灘看海景”則變成了啟動(dòng)導(dǎo)航系統(tǒng)的免喚醒詞。

免喚醒詞的出現(xiàn)大大降低了人車溝通復(fù)雜性。嘗到甜頭后,國(guó)內(nèi)車企迅速擴(kuò)大了“免喚醒詞”詞組量。以新發(fā)布的威馬EX6 Plus 6座為例,人車交互系統(tǒng)內(nèi)置超過了70組免喚醒詞。比方說,日常駕駛聽歌時(shí),對(duì)當(dāng)前歌曲完全不感冒,想切換下一首,只需要說“下一首”就行。相比最早的凱迪拉克CUE人車交互系統(tǒng),免喚醒詞的加入取消了手動(dòng)啟動(dòng)語音和“指名道姓”的語音喚醒過程,第一次真正意義上讓語音交互有了實(shí)用價(jià)值。

然而在人車交互發(fā)展方面,國(guó)內(nèi)造車新勢(shì)力因?yàn)榘l(fā)展原因,語音交互是從免喚醒詞這一階段開始。而合資車企在這方面走的更早,它們的人機(jī)交互是從簡(jiǎn)單的語音指令開始。但走的早,不一定走的好。在本土品牌擴(kuò)大“免喚醒詞”應(yīng)用時(shí),通用、大眾這些巨頭還在糾結(jié)是否需要為此做更深的延展。至今,凱迪拉克CT6的語音交互依舊停留在“安鍵啟動(dòng)”狀態(tài),并不支持免喚醒詞。而在小鵬P7的車機(jī)系統(tǒng)中免喚醒詞已經(jīng)達(dá)到了50+,威馬EX6 Plus 6座更是擁有超70組免喚醒詞,支持超過120項(xiàng)駕駛場(chǎng)景常用功能的語音控制,包含17項(xiàng)車輛控制指令,能夠有效識(shí)別中英文混合信息。只需說句話,一切全搞定。

第三階段:察言觀色的汽車和手舞足導(dǎo)的用戶

話說回來,免喚醒詞始終是技術(shù)限制下的產(chǎn)物,真正的人車交互應(yīng)該像朋友交流一樣,一個(gè)眼神、一個(gè)動(dòng)作、一個(gè)表情就能懂你,而不是儀式感的喚醒。此時(shí),汽車人車交互系統(tǒng)引入了類似斯蒂芬霍金輪椅配置的“眼神追蹤”技術(shù),只不過在汽車上被稱為“眼神智控”。配置這種技術(shù)的汽車會(huì)在座艙內(nèi)放置人臉、眼神追蹤等識(shí)別模組,用來會(huì)檢測(cè)駕駛員動(dòng)作。當(dāng)你扭頭向屏幕的時(shí)候,汽車就會(huì)明白,你在需要我,此時(shí),你給它個(gè)眼神,就能喚醒車機(jī)交互系統(tǒng)。在這個(gè)階段,汽車學(xué)會(huì)了看臉色,揣測(cè)人類心思,變的更聰明。

在威馬EX6 Plus 6座中,“眼神智控”模組設(shè)置在了前擋風(fēng)玻璃靠近內(nèi)后視鏡處,具備了人臉識(shí)別、視線喚醒、疲勞檢測(cè)三大模塊。如果我想要設(shè)置導(dǎo)航,只需要扭頭看向中控大屏,然后說導(dǎo)航去國(guó)家大劇院,車機(jī)系統(tǒng)就會(huì)自動(dòng)輸入導(dǎo)航位置,然后開啟導(dǎo)航模式,這就是視線喚醒的奇妙之處。

如果說,“眼神智控”只是為了實(shí)現(xiàn)視線喚醒,那它將毫無存在感,這種小活,“免喚醒詞”就能做到。作為新的交互方式,“眼神智控”的雄心是要從被動(dòng)到主動(dòng)實(shí)現(xiàn)全新人車“互動(dòng)”。疲勞駕駛檢測(cè)就是一種很受歡迎的主動(dòng)關(guān)懷配置。統(tǒng)計(jì)表明由于疲勞、瞌睡引發(fā)的交通事故在交通事故的總數(shù)中占7%左右,在重型卡車和高速路上的交通事故中則占到35%左右,而在嚴(yán)重交通事故中的占比更達(dá)到40%。同時(shí)交通事故統(tǒng)計(jì)結(jié)果顯示,如果駕駛員反應(yīng)速度能夠快0.5秒,將有60%的交通事故能夠避免,如果快1.5秒,將有90%的交通事故能夠避免。

在凱迪拉克CT6和威馬EX6 Plus 6座中都配置了“疲勞駕駛檢測(cè)”。它們就像機(jī)警的偵察員,隨時(shí)分析駕駛員面部數(shù)據(jù),如果駕駛員出現(xiàn)眨眼睛和打哈欠等動(dòng)作,它們就進(jìn)入分階提醒。如果眨眼睛的時(shí)間和打哈欠的次數(shù)滿足了車輛設(shè)定條件,車機(jī)系統(tǒng)就會(huì)發(fā)生提醒,或者主動(dòng)啟動(dòng)語音,詢問車主是否來點(diǎn)音樂。只不過新勢(shì)力出身的威馬在“眼神智控”的人臉識(shí)別模塊中,還進(jìn)行了更深的拓展應(yīng)用。譬如,用戶坐進(jìn)駕駛艙,人臉識(shí)別模組就能進(jìn)行識(shí)別駕駛員,自動(dòng)把對(duì)應(yīng)的喜馬拉雅、QQ音樂、愛奇藝、百度地圖等賬號(hào)全面互通。如果說語音交互的差異是豪華品牌的本土化服務(wù)缺失。那么,“眼神智控”的深度拓展則反映出各自不同的軟件開發(fā)實(shí)力。

需要指出的是,合資品牌并不傻,他們已經(jīng)醒悟過來,體會(huì)到了人車交互對(duì)用戶的吸引力,以及人車交互開發(fā)對(duì)自身在智能化方面的積極作用。但合資品牌經(jīng)歷了太久的戰(zhàn)略遲疑,從16年開始,人車交互已經(jīng)在國(guó)產(chǎn)車上基本普及,相關(guān)人車交互產(chǎn)業(yè)也被本土的百度、阿里、科大訊飛、商湯等巨頭所壟斷,他們能做的只能是買國(guó)產(chǎn)供應(yīng)商提供的半成品,加上無法很好的本土化適配,最終導(dǎo)致他們從先行者,變成如今的追趕者。

第四階段:“聲情并茂”的汽車和不想說話的用戶

那么,在接下來的一段時(shí)間內(nèi),人車交互又會(huì)如何發(fā)展呢?

是像電影(鋼鐵俠)中的賈維斯?還是像(流浪地球)中和吳京對(duì)話的繆斯。NO,都不是,人車智能交互屬于基礎(chǔ)科學(xué),完全不存在“大躍進(jìn)”式的跨越發(fā)展。下一階段的人車交互會(huì)把語音交互和“眼神智控”深度融合,從聲音和表情上“聲情并茂“的理解用戶,然后在交互上,做出一些新的創(chuàng)新形式。

如何定義新的創(chuàng)新形式?試想當(dāng)你點(diǎn)燃一支煙,希望略作放松時(shí),車輛會(huì)為你主動(dòng)降下窗戶,實(shí)現(xiàn)車內(nèi)通風(fēng)。當(dāng)你忽然接到一個(gè)電話,要做簡(jiǎn)單溝通時(shí),車輛會(huì)為你主動(dòng)降低音樂和導(dǎo)航音量,以保證通話效果,這些功能在威馬EX6 Plus 6座上已經(jīng)能夠?qū)崿F(xiàn)。未來更超前的手勢(shì)控制,也會(huì)在威馬下一代數(shù)字智能座艙中逐漸落地。譬如,開車時(shí),需要觸控屏幕完成操作時(shí),可以不用俯身,直接做一個(gè)滑動(dòng)手勢(shì),車機(jī)系統(tǒng)就能完成屏幕滑動(dòng)。這一階段的人車交互智能化,將無限接近霍金的傳奇輪椅。

相比新勢(shì)力這種更快速地智能化發(fā)展,合資品牌的人車交互進(jìn)程就要保守太多。通用集團(tuán)凱迪拉克品牌在下一代旗艦車型凱雷德上依然只是提供了基礎(chǔ)的4G通訊和百度語音,不僅缺少5G 、V2X等前瞻科技,甚至是車機(jī)交互的發(fā)力點(diǎn)仍然是在向著整車OTA、本土化語音發(fā)力,還是在打基礎(chǔ),做基本功。

致敬霍金,致敬他對(duì)世界的熱愛,對(duì)科研的熱誠(chéng)。以為往圣繼絕學(xué)的科技態(tài)度、和落后就要挨打,天天擔(dān)心被淘汰的焦慮感,造車新勢(shì)力在智能化方面突飛猛進(jìn)。從汽車人車交互的四個(gè)發(fā)展階段看,造車新勢(shì)力顯然走在了時(shí)代前列,雖然它們依然有很多方面都需要努力追趕,但并不妨礙我們給予適當(dāng)鼓勵(lì),畢竟“胡蘿卜加大棒”才是好的激勵(lì)方式。在此,我引用我國(guó)已故著名生物學(xué)家童第周的話:“一定要爭(zhēng)氣,中國(guó)人并不比外國(guó)人笨。外國(guó)人認(rèn)為難辦的事,我們中國(guó)人經(jīng)過努力,也能辦得到?!?br /> 責(zé)任編輯:tzh

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 攝像頭
    +關(guān)注

    關(guān)注

    60

    文章

    4849

    瀏覽量

    95838
  • 人臉識(shí)別
    +關(guān)注

    關(guān)注

    76

    文章

    4012

    瀏覽量

    81986
  • 5G
    5G
    +關(guān)注

    關(guān)注

    1355

    文章

    48470

    瀏覽量

    564647
收藏 人收藏

    評(píng)論

    相關(guān)推薦

    【「具身智能機(jī)器系統(tǒng)」閱讀體驗(yàn)】+數(shù)據(jù)在具身人工智能中的價(jià)值

    重大數(shù)據(jù)瓶頸的嚴(yán)重阻礙。與主要由用戶生成的輸入組成且相對(duì)容易收集和匯總的 Internet 數(shù)據(jù)不同,EAI 的數(shù)據(jù)涉及機(jī)器與其動(dòng)態(tài)環(huán)境之間的復(fù)雜交互。這根本差異意味著,雖然可以從
    發(fā)表于 12-24 00:33

    《具身智能機(jī)器系統(tǒng)》第1-6章閱讀心得之具身智能機(jī)器系統(tǒng)背景知識(shí)與基礎(chǔ)模塊

    物理交互納入智能系統(tǒng)的核心要素。 第3章是探討機(jī)器計(jì)算系統(tǒng)。這章節(jié)詳細(xì)闡述了自主機(jī)器的軟硬
    發(fā)表于 12-19 22:26

    思必馳攜手長(zhǎng)城汽車入選2024年工智能先鋒案例集

    提供車載語音語言交互技術(shù),交互體驗(yàn)在響應(yīng)速度、流暢度、多音區(qū)交互、抗干擾、連續(xù)對(duì)話等功能上躍升個(gè)
    的頭像 發(fā)表于 11-26 17:56 ?971次閱讀

    智能網(wǎng)聯(lián)汽車云控系統(tǒng)第2部分:車云數(shù)據(jù)交互規(guī)范

    智能網(wǎng)聯(lián)汽車云控系統(tǒng) 第2部分 車云數(shù)據(jù)交互規(guī)范
    發(fā)表于 11-18 15:04 ?0次下載

    如何構(gòu)建物聯(lián)網(wǎng)系統(tǒng)

    構(gòu)建物聯(lián)網(wǎng)系統(tǒng)個(gè)復(fù)雜而細(xì)致的過程,涉及多個(gè)關(guān)鍵步驟和組件。以下是個(gè)詳細(xì)的
    的頭像 發(fā)表于 10-29 10:40 ?638次閱讀

    為THS3001構(gòu)建個(gè)簡(jiǎn)單的SPICE模型

    電子發(fā)燒友網(wǎng)站提供《為THS3001構(gòu)建個(gè)簡(jiǎn)單的SPICE模型.pdf》資料免費(fèi)下載
    發(fā)表于 10-29 10:11 ?0次下載
    為THS3001<b class='flag-5'>構(gòu)建</b><b class='flag-5'>一</b><b class='flag-5'>個(gè)</b>簡(jiǎn)單的SPICE模型

    SLAM:機(jī)器何在未知地形環(huán)境中進(jìn)行導(dǎo)航

    作者: Aswin S Babu 設(shè)想下,當(dāng)我們困在個(gè)陌生的沙漠中時(shí),所面臨的艱巨任務(wù)是尋找條安全之路。長(zhǎng)期以來,在陌生地形中導(dǎo)航
    的頭像 發(fā)表于 10-02 16:37 ?547次閱讀

    何在不同應(yīng)用場(chǎng)景下構(gòu)建音頻測(cè)試環(huán)境

    在之前的文章中,我們已經(jīng)詳細(xì)介紹了基礎(chǔ)音頻參數(shù)和AP525的軟硬件配置。本文將延續(xù)這主題,以泰凌TLSR9518A EVB作為測(cè)試設(shè)備(DUT),向大家展示如何在不同應(yīng)用場(chǎng)景下構(gòu)建音頻測(cè)試環(huán)境。
    的頭像 發(fā)表于 07-03 15:00 ?586次閱讀
    如<b class='flag-5'>何在</b>不同應(yīng)用場(chǎng)景下<b class='flag-5'>構(gòu)建</b>音頻測(cè)試環(huán)境

    人機(jī)交互界面是什么_人機(jī)交互界面的功能

    終端(OT),是指與計(jì)算機(jī)系統(tǒng)之間的通信媒體或手段,是與計(jì)算機(jī)之間進(jìn)行各種符號(hào)和動(dòng)作的雙向信息交換的平臺(tái)。   人機(jī)
    的頭像 發(fā)表于 06-22 11:03 ?2624次閱讀

    PLC之間的IO交互怎么實(shí)現(xiàn)

    在工業(yè)自動(dòng)化領(lǐng)域,可編程邏輯控制器(PLC)作為核心控制設(shè)備,其重要性不言而喻。PLC之間的IO交互是實(shí)現(xiàn)自動(dòng)化生產(chǎn)線高效、穩(wěn)定運(yùn)行的關(guān)鍵環(huán)節(jié)。本文將詳細(xì)探討PLC之間IO交互的實(shí)現(xiàn)方
    的頭像 發(fā)表于 06-17 11:09 ?1953次閱讀

    個(gè)PLC之間如何交互信號(hào)

    在工業(yè)自動(dòng)化系統(tǒng)中,PLC(Programmable Logic Controller,可編程邏輯控制器)是核心的控制設(shè)備。在許多復(fù)雜的應(yīng)用場(chǎng)景中,需要兩個(gè)或多個(gè)PLC之間進(jìn)行信號(hào)交互
    的頭像 發(fā)表于 06-14 16:57 ?4510次閱讀

    個(gè)簡(jiǎn)單的汽車蓄電池維修電路

     這是個(gè)圍繞當(dāng)?shù)厥袌?chǎng)上容易買到的非常常見的電子元件構(gòu)建的簡(jiǎn)單電路,用于保護(hù)汽車汽車)電池免受深度放電并防止損壞。
    的頭像 發(fā)表于 05-05 11:19 ?1172次閱讀
    <b class='flag-5'>一</b><b class='flag-5'>個(gè)</b>簡(jiǎn)單的<b class='flag-5'>汽車</b>蓄電池維修電路

    人機(jī)交互的三個(gè)階段 人機(jī)交互的常用方式

    機(jī)交互經(jīng)歷的三個(gè)階段:命令行界面交互階段、圖形用戶界面交互階段、自然和諧的人機(jī)交互階段。
    的頭像 發(fā)表于 03-13 17:25 ?3171次閱讀

    怪獸智能數(shù)字,實(shí)時(shí)交互數(shù)字直播系統(tǒng),3D超寫實(shí)虛擬形象直播

    也在不斷創(chuàng)新,推出了許多令人驚嘆的技術(shù)產(chǎn)品。其中,可互動(dòng)的怪獸智能數(shù)字以及實(shí)時(shí)交互數(shù)字直播系統(tǒng),以及其超寫實(shí)的3D虛擬形象直播系統(tǒng)就是其
    的頭像 發(fā)表于 03-05 09:08 ?652次閱讀

    鴻蒙開發(fā)丨設(shè)備內(nèi) UIAbility 的幾種交互方式

    UIAbility 組件間交互(設(shè)備內(nèi)) 在設(shè)備內(nèi),UIAbility(用戶界面能力)是系統(tǒng)調(diào)度的最小單元,它們負(fù)責(zé)展示用戶界面和執(zhí)行相關(guān)的業(yè)務(wù)邏輯。設(shè)備內(nèi)的不同功能模塊之間交互是應(yīng)
    的頭像 發(fā)表于 02-02 10:42 ?631次閱讀
    鴻蒙開發(fā)丨設(shè)備內(nèi) UIAbility 的幾種<b class='flag-5'>交互</b>方式