0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內(nèi)不再提示

人機交互的最終目標:聲紋識別讓機器主動適應人

智能生物識別說 ? 2019-10-16 17:53 ? 次閱讀

人機交互的前世今生

自從人類發(fā)明了計算機,就持續(xù)面臨著一個問題:我們到底應該如何與機器交互?

在計算機的發(fā)展歷史上,隨著技術的進步,發(fā)生過幾次大的交互模式的演進:近年來的轉(zhuǎn)變大致可以概括為以鼠標/鍵盤為主的交互模式轉(zhuǎn)換為以觸摸和語音為主的交互模式。

由此,我們可以預測人機交互的發(fā)展趨勢,主要體現(xiàn)在:

交互理念方面,機器從被動接受信息到主動理解信息,以及從滿足基本功能到強調(diào)用戶體驗;

交互設備方面,機器輸入、輸出的方式更加自然化、內(nèi)容多樣化。

顯然,不管是理念的轉(zhuǎn)變還是設備的升級,我們和機器的交互方式上經(jīng)歷了一個從人適應機器,到機器適應人的過程。

語音交互解決人機交互痛點

語言是什么?是人類最牛逼的發(fā)明,是人類進化的產(chǎn)物。

人類通過語言,能夠把對世界的理解,想傳遞的信息,壓縮成一串很短的文字輸入給對方,對方聽完以后,能根據(jù)這些文字,還原事件、圖像,以及情感。

鼠標/鍵盤本質(zhì)上不是一種交互方式,而是一種輸入設備,真正的交互方式其實是以語言為載體的“命令”。

正如微軟創(chuàng)始人比爾?蓋茨如所言:“人類自然形成的與自然界溝通的認知習慣和形式必定是人機交互的發(fā)展方向”。

隨著人工智能技術的發(fā)展,自然語言交互必定是實現(xiàn)“命令自然化”的關鍵突破口。語言聲學技術為人機交互注入了智能屬性,交互不再是精確的“指令”。

在上世紀出現(xiàn)Google、百度等搜索引擎的時候,交互還是單向的,但出現(xiàn)智能手機之后我們的交互變成了雙向。比如蘋果的交互史,在剛開始做出來第一代iPhone的時候并沒有語音交互的能力,但經(jīng)過市場調(diào)研之后發(fā)現(xiàn)有75%的用戶都希望有語音控制。于是,在后面兩代iPhone加入了語音控制,但到后面發(fā)現(xiàn)實際使用的用戶竟然不到5%,蘋果經(jīng)過總結(jié)之后發(fā)現(xiàn)不僅僅是語音,還必須有自然語言交互。

正如我們對自然語言處理技術的應用場景的想象,關鍵在于足夠自然,人工智能永遠都在追趕最高的自然智能。


信息文明走向智能文明 ,機器需適應人類的自然語言體系,然后完成任務。

語音識別+聲紋識別:人機交互這么做就對了!

智能音箱為例,需要其不再是基于幾個關鍵詞來反饋結(jié)果,而是能夠理解用戶的語言指令,完成一項完整的任務。

一方面,語音交互將使智能音箱跳出了傳統(tǒng)的“命令式交互系統(tǒng)”,你可以說“為我播放一首爵士樂”、“為我查一下明天的天氣”等這類不再精確的指令。機器擁有理解人類語言、分析語言意圖,進行更多的決策的可能。

另一方面,語音技術的進展使得我們可以遠距離控制設備。在移動互聯(lián)網(wǎng)時代,用戶需要更為方便自然的人機交互方式。當互聯(lián)網(wǎng)從個人電腦向移動終端遷移,人們在走路、開車、吃飯時都可以通過互聯(lián)網(wǎng)獲取信息、完成任務,語音交互的非接觸性,解放了雙手,成為了快捷方便的方式。

“萬物互聯(lián)”時代下的人機交互:以用戶為中心,使產(chǎn)品主動為受眾的提供服務

隨著5G的發(fā)展和互聯(lián)網(wǎng)技術的不斷成熟,人類已經(jīng)進入到了一個萬物互聯(lián)的“大連接”時代,“大連接”的目的是為了讓人類的生活更加美好,更加便利。

設備被賦予的大量連接,連接為交互建立了通道。交互通道建立后的下一步,是用人工智能技術為“大連接”時代賦能。

語音交互遠距離控制的特性,極大地增加了可交互設備的數(shù)量,有利于智能設備的快速普及。

在未來全面智能化、萬物互聯(lián)的生活中,真實使用場景總是有多個聲源和環(huán)境噪聲疊加,比如經(jīng)常會出現(xiàn)周邊噪聲干擾和多人同時說話的場景。

想象一下,如果所有的智能設備都在同一時間點被觸發(fā),“隨意”的為用戶展示信息,身處其中的大家可能會立刻瘋掉。這時候,用聲紋識別技術讓智能設備可以識別“主人身份”就顯得格外重要(語音識別是識別你說的話,而聲紋識別是指識別說話的人是誰)。未來更多的智能設備上面將配有聲紋識別,更將大大的提高設備的安全性。

快商通聲紋識別:讓智能設備認識你,聽懂你

以前的語音交互大多是服務為主,以產(chǎn)品為核心,是根據(jù)產(chǎn)品找用戶。

目前,作為聲紋身份認證與智能語音交互解決方案提供商,快商通推出以用戶為中心的智能交互解決方案:

通過遠場聲紋識別技術,讓智能設備能夠自然快速識別用戶身份,從而時刻感知用戶需求的本質(zhì)來源,記憶用戶行為習慣和各類偏好。通過自然語言交互,分析用戶語言背后的真實意圖,并隨之快速作出合理的反應,并能在之后的生活中不斷地進行調(diào)整。

方案集成聲紋識別、聲學處理、自然語言處理、深度神經(jīng)網(wǎng)絡等核心AI智能技術,以唯一性和安全性為基礎,打造“人性化”的人機交互,解決智能設備的誤觸發(fā)及個性化服務痛點:

快商通原創(chuàng)的語音與聲學處理技術能夠保證機器能夠聽得準真實環(huán)境下人的聲音,使智能設備在充滿噪聲干擾和多人同時說話的場景中,仍然能保持95%以上的識別準確率,同時處理多人聲紋身份識別的問題。

智能設備們除了能只被特定成員喚醒外,還能根據(jù)不同成員的習慣和喜好進行個性化推薦。唯有你能在你的整個智能生活的中心隨心所欲。

快商通是一家以人工智能技術為核心的創(chuàng)新型科技公司,專注于聲紋識別與自然語言處理技術的研發(fā)與創(chuàng)新,完全自主知識產(chǎn)權(quán)的聲紋識別技術達到世界領先水平。

目前,快商通已為大量終端設備廠商提供優(yōu)質(zhì)的遠場聲紋識別與語義理解技術支持。用戶可在不同場景下通過遠場語音交互。進行自然語言交互,享受科技給生活帶來的便利。未來,將攜手人工智能生態(tài)鏈上下游合作伙伴,持續(xù)推進更自然、更智能、更人性化的人機交互發(fā)展,讓人工智能更好的服務人類。

快商通技術方案優(yōu)勢:

1.復雜場景下的身份識別與喚醒:結(jié)合聲源定位和前端聲學處理技術,解決誤觸發(fā),交互過程自然高效。

2.深層次理解:結(jié)合場景、世界知識和歷史交互信息,再對語義、語用和情感進行深層次理解,提升能交互效率和機器決策準確度。

3.擬人式對話:在系統(tǒng)的輸出側(cè),能夠以高逼真度、高自然度、和高準確度度的擬人形象、用詞、和表達方式來和用戶交互,就能大大減小對用戶感知能力的要求。

4.個性化交互:與不同人交互時,智能設備提供的交互方式和內(nèi)容是用戶所感興趣的。


聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
收藏 人收藏

    評論

    相關推薦

    啟英泰倫新推出多意圖自然說,重塑離線人機交互新標準!

    智能語音識別技術作為人機交互領域的一場革命性突破,正逐步重塑我們與智能設備的交互方式。近期,啟英泰倫新推出了多意圖自然說技術,進一步增強了人機交互的自然流暢度與操作便捷性。AI語音2.
    的頭像 發(fā)表于 01-03 16:01 ?157次閱讀
    啟英泰倫新推出多意圖自然說,重塑離線<b class='flag-5'>人機交互</b>新標準!

    芯??萍糉orceTouch3.0:重塑人機交互新境界

    在追求極致用戶體驗的智能時代,每一次技術的革新都是對未來的深度探索。芯海科技,作為業(yè)界領先的芯片設計企業(yè),憑借其ForceTouch3.0技術,正引領著一場人機交互的變革,為智能手機、智能穿戴、家電乃至汽車電子等領域注入了全新的活力與可能。
    的頭像 發(fā)表于 11-28 09:20 ?242次閱讀
    芯??萍糉orceTouch3.0:重塑<b class='flag-5'>人機交互</b>新境界

    具身智能對人機交互的影響

    在人工智能的發(fā)展歷程中,人機交互一直是研究的核心領域之一。隨著技術的進步,人機交互的方式也在不斷演變。從最初的命令行界面,到圖形用戶界面,再到現(xiàn)在的自然語言處理和語音識別,每一次技術的突破都極大
    的頭像 發(fā)表于 10-27 09:58 ?393次閱讀

    聚徽-工控一體機是如何實現(xiàn)人機交互

    工控一體機實現(xiàn)人機交互的方式是多種多樣的,結(jié)合搜索結(jié)果,我們可以歸納出以下幾種主要的實現(xiàn)方式:
    的頭像 發(fā)表于 09-10 09:31 ?385次閱讀

    基于傳感器的人機交互技術

    基于傳感器的人機交互技術是現(xiàn)代科技發(fā)展的重要領域之一,它極大地推動了人機交互的便捷性、自然性和智能性。本文將詳細探討基于傳感器的人機交互技術,包括其基本原理、關鍵技術、應用領域以及未來發(fā)展趨勢。
    的頭像 發(fā)表于 07-17 16:52 ?932次閱讀

    目標智能識別系統(tǒng)

    智慧華盛恒輝多目標智能識別系統(tǒng)是一種利用現(xiàn)代計算機視覺技術和人工智能算法,從圖像或視頻中同時識別和分類多個目標物體的系統(tǒng)。這種系統(tǒng)廣泛應用于自動駕駛、智能監(jiān)控、
    的頭像 發(fā)表于 07-16 10:42 ?1.4w次閱讀

    人機界面交互方式的介紹

    人機界面(Human-Computer Interaction, HCI)是研究與計算機之間交互方式的學科。隨著計算機技術的發(fā)展,人機交互方式也在不斷地演變和創(chuàng)新。以下是對各種
    的頭像 發(fā)表于 07-01 14:22 ?927次閱讀

    人機交互界面是什么_人機交互界面的功能

    終端(OT),是指與計算機系統(tǒng)之間的通信媒體或手段,是與計算機之間進行各種符號和動作的雙向信息交換的平臺。   人機交互界面的主要作用是將人類的意圖轉(zhuǎn)化為計算機能夠理解和處理的形式,同時將計
    的頭像 發(fā)表于 06-22 11:03 ?2714次閱讀

    工業(yè)平板電腦在人機交互中的應用

    工業(yè)平板電腦在人機交互(Human-Machine Interaction,HMI)中扮演著至關重要的角色,它們通過直觀的界面和強大的計算能力,極大地提升了工業(yè)環(huán)境下的操作效率和用戶體驗。以下是工業(yè)平板電腦在人機交互中的具體應用:
    的頭像 發(fā)表于 06-18 12:00 ?321次閱讀

    人機交互與人機界面的區(qū)別與聯(lián)系

    隨著信息技術的飛速發(fā)展,人機交互(Human-Computer Interaction,HCI)已成為現(xiàn)代社會不可或缺的一部分。人機交互技術,作為實現(xiàn)與計算機之間有效通信的橋梁,不僅改變了我們
    的頭像 發(fā)表于 06-07 15:29 ?1094次閱讀

    芯??萍肌皦喝荻弦籗oC”系列芯片打造極致人機交互體驗

    5月7日晚,蘋果春季新品發(fā)布特別活動推出全新升級的Apple Pencil Pro,持續(xù)深度布局壓力觸控人機交互領域。
    的頭像 發(fā)表于 05-11 10:00 ?531次閱讀
    芯??萍肌皦喝荻弦籗oC”系列芯片打造極致<b class='flag-5'>人機交互</b>體驗

    瑞薩與RT-Thread推出基于RT-Thread&amp;OpenMV的RA8人機交互方案

    瑞薩與戰(zhàn)略合作伙伴RT-Thread攜手于2024年2月底正式發(fā)布了全新的硬件產(chǎn)品——基于RT-Thread&OpenMV的RA8人機交互解決方案Vision Board。
    的頭像 發(fā)表于 04-01 14:10 ?972次閱讀
    瑞薩與RT-Thread推出基于RT-Thread&amp;OpenMV的RA8<b class='flag-5'>人機交互</b>方案

    人機交互的三個階段 人機交互的常用方式

    交互經(jīng)歷的三個階段:命令行界面交互階段、圖形用戶界面交互階段、自然和諧的人機交互階段。
    的頭像 發(fā)表于 03-13 17:25 ?3231次閱讀

    人機交互系統(tǒng)的發(fā)展史及過程步驟

    人機交互系統(tǒng)還包括用戶界面(UI),它是用戶與系統(tǒng)之間進行信息交流和控制活動的載體。用戶界面可以是軟件系統(tǒng)界面,通過顯示器呈現(xiàn)系統(tǒng)信息,并接收來自用戶的視覺、聽覺等感官的輸入。
    的頭像 發(fā)表于 03-11 17:15 ?2565次閱讀
    <b class='flag-5'>人機交互</b>系統(tǒng)的發(fā)展史及過程步驟

    人機交互技術有哪幾種 人機交互技術的發(fā)展趨勢

    人機交互技術是指與計算機之間通過各種交互方式進行信息傳遞、操作和控制的技術。隨著科技的進步,人機交互技術也在不斷發(fā)展創(chuàng)新。以下將介紹人機交互
    的頭像 發(fā)表于 01-22 17:47 ?3859次閱讀