早在計算機發(fā)明之前,自動語音識別的設想就已經(jīng)被提上了議事日程,早期的聲碼器可被視作語音識別及合成的雛形。而1920年代生產(chǎn)的“Radio Rex”玩具狗可能是最早的語音識別器,當這只狗的名字被呼喚的時候,它能夠從底座上彈出來。最早的基于電子計算機的語音識別系統(tǒng)是由AT&T貝爾實驗室開發(fā)的Audrey語音識別系統(tǒng),它能夠識別10個英文數(shù)字。其識別方法是跟蹤語音中的共振峰。該系統(tǒng)得到了98%的正確率。到1950年代末,倫敦學院(College of London)的Denes已經(jīng)將語法概率加入語音識別中。1960年代,人工神經(jīng)網(wǎng)絡被引入了語音識別。這一時代的兩大突破是線性預測編碼Linear Predictive Coding (LPC), 及動態(tài)時間規(guī)整Dynamic Time Warp技術(shù)。
互聯(lián)網(wǎng)時代,科技家居已經(jīng)變得格外普遍。智能語音界面無處不在,或許現(xiàn)在的人們跟智能軟件講話的次數(shù)比鄰居、老同學甚至家人還要多。我們將Amazon Echo或者Google Home安裝在家里的某個角落,我們跟Siri調(diào)侃談話,我們搜索資料、發(fā)送信息、控制相連設備、購物等等,都和語音界面緊密相關。
但事實上是孩子先一步接觸語音技術(shù)的。2010年iPad第一次亮相后,孩子很快就學會如何激發(fā)語音界面。識字尚且不多的孩子希望世界上的一切都和這個iPad一樣,只要說話就可以控制了。但那時技術(shù)尚且不成熟,孩子和機器說話,像“Alexa,打開車窗”或者“谷歌,調(diào)整電視信號”,沮喪的是,這時什么都沒有發(fā)生。孩子也在等待世界跟上他們的步伐,就像鼠標和觸摸控制是大人的,而語音控制卻是孩子的,智能語音界面就是他們最了解也最喜愛的東西。
語音用戶界面有個大舞臺,隨著科技進步,舞臺會越變越大。Alexa、Google Home以及Siri的各項功能隨著時間越來越豐富,越來越完善。我們已經(jīng)可以和它們有良好的互動,像“Alexa,今天早上的通勤時間是多少?”或者“谷歌,告訴我今天的天氣”。我們喜歡和機器人聊天,但又很快的拋棄它們。根據(jù)Voicelabs統(tǒng)計顯示,用戶度過了第一周的新鮮期以后,繼續(xù)使用語音用戶界面的幾率只有3%。對于試圖想要和消費者建立良好互動關系的營銷人員來講,這并不是一個好現(xiàn)象。那么想要建立更加復雜的交互關系就更加困難了。
語言界面現(xiàn)在雖然已經(jīng)興起,但是用戶似乎尚未學會物盡其用。因為在大多數(shù)的情況下,我們并不需要創(chuàng)造對話,我們只是想在語音界面輸入老式單一的命令。像在行程中添加一些東西、播放一首歌曲以及設置一個鬧鐘,這些都只需要簡單的命令。這些命令語音界面都可以游刃有余的辦好,但是一旦涉及到更加廣泛的談話空間,語音界面就顯得遲鈍。但是這不單單是用戶界面的問題,智能語音界面和用戶想要建立更加流暢的對話關系,需要長時間的信息采集。例如當用戶提到“有趣的周末”時,語音界面的回答建議便是從以前的對話中提取整合信息得來的。
語音用戶界面的模塊構(gòu)建需要對話設計。保羅·龐加羅(Paul Pangaro),一位權(quán)威的會話理論家,提出了對話簡單元素和流程的框架。以此為基礎,研發(fā)者設計界面時,設定談話雙方要共享上下文以及語言環(huán)境,準確定義談話目標,反復評估和交換信息。
現(xiàn)在有很好的工具促進語音用戶界面的對話創(chuàng)建。Pullstring和Dexter試圖向用戶呈現(xiàn)一個友好的界面的同時保持運行靈活順暢。但是為了語音用戶界面的更好發(fā)展,這些工具還是需要改進,例如設計專業(yè)業(yè)務邏輯,像針對用戶的職業(yè)身份,語音界面會具備相應的專業(yè)只是系統(tǒng);以及語音人工智能的個性化以及品牌化發(fā)展等。
上面提出的已經(jīng)有公司在嘗試,但這還需要很多的工作要做。語音人工智能技術(shù)正在興起,無論是對廣大的用戶來講還是營銷人員來講,相信語音用戶界面的發(fā)展會給人們帶來更多更美好的體驗。
相關推薦
搭載了語音模塊的落地扇還具有人機交互更加自然的特點。使用者可以通過自然語言與落地扇進行交流,例如“打....
發(fā)表于 2023-10-24 15:11?
140次閱讀
搭載離線語音模塊后,用戶只需通過語音指令就能控制風扇的開關、調(diào)節(jié)檔位和定時等功能
發(fā)表于 2023-10-23 14:31?
169次閱讀
吸化妝燈境在搭載了語音模塊后,不僅擁有了更加智能化的控制方式,還增加了許多額外的功能
發(fā)表于 2023-10-20 16:06?
347次閱讀
一.使用場景夏天某個涼爽的早晨,當你躺在床上玩著手機,突然一陣困意襲來,原來已經(jīng)中午了,此時你一個側(cè)....
發(fā)表于 2023-10-19 18:03?
125次閱讀
一、引言 隨著人工智能技術(shù)的不斷發(fā)展,語音識別技術(shù)在醫(yī)療領域的應用越來越廣泛。本文將探討語音識別技術(shù)....
發(fā)表于 2023-10-19 16:30?
72次閱讀
隨著人工智能和物聯(lián)網(wǎng)技術(shù)的不斷發(fā)展,智能家居成為了人們生活中不可或缺的一部分。語音識別技術(shù)作為一種重....
發(fā)表于 2023-10-19 15:57?
55次閱讀
語音識別技術(shù)是一種將人類語音轉(zhuǎn)化為計算機可理解數(shù)據(jù)的技術(shù)。隨著人工智能和云計算技術(shù)的不斷發(fā)展,語音識....
發(fā)表于 2023-10-19 15:51?
31次閱讀
語音模塊的識別準確率和反應速度都非常出色,用戶可以輕松地與家庭設備進行交互
發(fā)表于 2023-10-19 11:01?
113次閱讀
一、引言 隨著人工智能技術(shù)的不斷發(fā)展,語音識別技術(shù)得到了越來越廣泛的應用。端到端語音識別技術(shù)是近年來....
發(fā)表于 2023-10-18 17:06?
70次閱讀
一、引言 隨著科技的不斷發(fā)展,語音識別技術(shù)得到了廣泛應用。然而,語音識別技術(shù)在發(fā)展過程中面臨著許多挑....
發(fā)表于 2023-10-18 16:56?
93次閱讀
一、引言 隨著科技的不斷發(fā)展,語音識別技術(shù)已經(jīng)滲透到各個行業(yè)中,并逐漸改變著人們的生活方式。本文將探....
發(fā)表于 2023-10-18 16:10?
55次閱讀
有了離線語音模塊,用戶只需要對空氣中的麥克風說出指令,就可以實現(xiàn)對落地燈的控制
發(fā)表于 2023-10-18 15:52?
383次閱讀
當吸小夜燈搭載離線語音模塊后,用戶可以通過語音控制的方式來調(diào)節(jié)它的亮度、顏色等參數(shù),實現(xiàn)更加智能化的....
發(fā)表于 2023-10-17 14:18?
193次閱讀
在吸頂燈上搭載離線語音模塊后,用戶可以通過語音控制來調(diào)節(jié)燈的亮度、顏色和定時等功能
發(fā)表于 2023-10-16 14:31?
303次閱讀
芯片上的四邊形MZI網(wǎng)絡可能對涉及光神經(jīng)網(wǎng)絡的應用有用,這些網(wǎng)絡是由相互連接的節(jié)點創(chuàng)建的。為了有效地....
發(fā)表于 2023-10-15 11:19?
95次閱讀
一、引言 語音識別技術(shù)是一種將人類語言轉(zhuǎn)化為計算機可理解數(shù)據(jù)的技術(shù)。這一領域經(jīng)歷了從傳統(tǒng)到現(xiàn)代的轉(zhuǎn)變....
發(fā)表于 2023-10-13 17:08?
83次閱讀
離線語音模塊是一種基于語音識別技術(shù)的模塊,它不需要連接互聯(lián)網(wǎng),通過內(nèi)置的語音算法和硬件設備,可以直接....
發(fā)表于 2023-10-13 14:26?
228次閱讀
一、引言 語音識別技術(shù)是一種將人類語音轉(zhuǎn)化為計算機可理解數(shù)據(jù)的技術(shù)。隨著人工智能和深度學習的發(fā)展,語....
發(fā)表于 2023-10-12 18:33?
107次閱讀
一、引言 語音識別技術(shù)是一種將人類語音轉(zhuǎn)化為計算機可讀文本的技術(shù),它在許多領域都有廣泛的應用,如智能....
發(fā)表于 2023-10-12 16:57?
155次閱讀
離線語音模塊的加入,使得智能家居設備具備了語音控制功能。用戶可以通過語音指令,控制家中的各種設備
發(fā)表于 2023-10-12 15:20?
405次閱讀
使用PocketSphinx包, PocketSphinx是一個用于語音轉(zhuǎn)換文本的開源API。它是一....
發(fā)表于 2023-10-11 09:31?
26次閱讀
一、引言 隨著深度學習技術(shù)的快速發(fā)展,其在語音識別領域的應用也日益廣泛。深度學習技術(shù)可以有效地提高語....
發(fā)表于 2023-10-10 18:14?
129次閱讀
一、引言 語音識別技術(shù)是一種能夠讓計算機“聽懂”人類語言的技術(shù)。隨著科技的不斷發(fā)展,語音識別技術(shù)的應....
發(fā)表于 2023-10-10 17:26?
149次閱讀
一、引言 語音識別技術(shù)是一種將人類語言轉(zhuǎn)化為計算機可理解數(shù)據(jù)的技術(shù)。隨著科技的不斷發(fā)展,語音識別技術(shù)....
發(fā)表于 2023-10-10 17:10?
127次閱讀
離線語音控制是指在不依賴于互聯(lián)網(wǎng)的情況下,通過語音識別控制技術(shù),實現(xiàn)人機交互功能
發(fā)表于 2023-10-10 16:36?
201次閱讀
浴霸搭載離線語音模塊后,擁有了智能語音控制的功能。我們只需要說出相應的語音指令,比如“打開浴霸”、“....
發(fā)表于 2023-10-07 14:31?
290次閱讀
一、引言 語音識別技術(shù)經(jīng)歷了從傳統(tǒng)到現(xiàn)代的發(fā)展過程,發(fā)生了許多重大變革。本文將探討這個過程中的一些關....
發(fā)表于 2023-09-28 17:05?
69次閱讀
一、引言 隨著科技的快速發(fā)展,語音識別技術(shù)得到了廣泛應用。語音識別技術(shù)是一種人機交互的關鍵技術(shù),它使....
發(fā)表于 2023-09-28 16:55?
169次閱讀
通過在晾衣架上嵌入離線語音模塊,用戶可以通過簡單的聲音指令控制晾衣架的開關,包括升降、伸展、停止等
發(fā)表于 2023-09-27 10:43?
888次閱讀
通過在飲水機中安裝離線語音模塊,我們可以通過簡單的語音指令來控制飲水機的開關、溫度調(diào)節(jié)、水量控制等功....
發(fā)表于 2023-09-26 14:29?
808次閱讀
離線語音模塊賦予了電動窗簾語音控制的功能。用戶可以通過簡單的語音指令控制窗簾的開關、升降和停止等操作
發(fā)表于 2023-09-25 14:26?
269次閱讀
一、引言 在當今數(shù)字化時代,語音識別技術(shù)已經(jīng)成為人機交互的重要方式之一。本文將探討語音識別技術(shù)的歷史....
發(fā)表于 2023-09-22 18:29?
150次閱讀
一、引言 隨著科技的快速發(fā)展,語音識別技術(shù)已經(jīng)逐漸融入我們的日常生活,且在各個領域展現(xiàn)出廣闊的應用前....
發(fā)表于 2023-09-22 18:23?
126次閱讀
自然語言處理是人工智能中的重要領域之一,涉及計算機與人類自然語言的交互。NLP技術(shù)可以實現(xiàn)語音識別、....
發(fā)表于 2023-09-22 10:56?
302次閱讀
一、引言 隨著科技的快速發(fā)展,語音識別技術(shù)成為了人機交互的重要方式。然而,盡管語音識別技術(shù)在某些領域....
發(fā)表于 2023-09-20 16:17?
93次閱讀
一、引言 語音識別技術(shù)是一種讓計算機理解和解析人類語音的方法。這種技術(shù)已經(jīng)存在多年,但隨著硬件性能的....
發(fā)表于 2023-09-19 18:30?
427次閱讀
隨著科技的快速發(fā)展,人類對機器的操控方式也在不斷尋求創(chuàng)新。其中,語音識別技術(shù)作為人機交互的重要接口,....
發(fā)表于 2023-09-19 18:13?
201次閱讀
離線語音賦能還可以與其他智能設備進行聯(lián)動,實現(xiàn)更加智能、便捷的家居體驗。在商業(yè)場景中,離線語音賦能智....
發(fā)表于 2023-09-15 14:49?
359次閱讀
離線語音技術(shù)的應用使得教師可以通過簡單的口令或指令來操控教室中控系統(tǒng),例如說出“打開投影儀”、“調(diào)整....
發(fā)表于 2023-09-14 11:52?
282次閱讀
自動語音識別技術(shù),簡單來說其實就是利用計算機將語音信號自動轉(zhuǎn)換為文本的一項技術(shù)。這項技術(shù)同時也是機器....
發(fā)表于 2023-09-14 09:35?
100次閱讀
一般而言,大模型(Large Language Models)指的是包含超大規(guī)模參數(shù)的神經(jīng)網(wǎng)絡模型。....
發(fā)表于 2023-09-13 16:33?
334次閱讀
電子發(fā)燒友網(wǎng)報道(文/李彎彎)近日消息,據(jù)知情人士透露,蘋果始終在增加構(gòu)建人工智能所需計算的預算,并....
發(fā)表于 2023-09-11 09:13?
909次閱讀
在技術(shù)創(chuàng)新賽道中,已經(jīng)出現(xiàn)了成熟的大模型作品并實現(xiàn)了落地。該團隊研發(fā)的是聚焦在法律領域的私域大模型,....
發(fā)表于 2023-09-08 15:58?
157次閱讀
近日,國際性語音及語言科學技術(shù)領域盛會INTERSPEECH 2023在愛爾蘭都柏林舉行。云知聲聯(lián)合....
發(fā)表于 2023-09-07 10:27?
301次閱讀
華為P60是5g手機嗎 是什么芯片?? 華為P60不是5G手機,它搭載的是華為自主研發(fā)的Kirin ....
發(fā)表于 2023-09-01 16:12?
2697次閱讀
通過離線語音技術(shù)的應用,用戶只需簡單的語音指令,就能夠遠程控制玄關燈的開關
發(fā)表于 2023-08-30 10:49?
321次閱讀
時隔3年后,國際多通道語音分離和識別大賽CHiME-7再次“上線”。當?shù)貢r間8月25日,CHiME-....
發(fā)表于 2023-08-28 16:59?
805次閱讀
通過離線語音技術(shù)的應用,用戶只需要通過簡單的語音指令,就可以輕松地控制落地燈的開關、亮度調(diào)節(jié)以及顏色....
發(fā)表于 2023-08-28 15:43?
332次閱讀
npu芯片有什么用 隨著人工智能的發(fā)展,NPU芯片作為一款專門用于加速人工智能計算的芯片,正在逐漸成....
發(fā)表于 2023-08-27 17:08?
1168次閱讀
正在玩9160做語音識別的東東,但發(fā)現(xiàn)沒法自己做詞條,好像要找廠家定做,而且要收費,請了解過這方面的說一說吧,或者...
發(fā)表于 2023-06-21 08:23?
286次閱讀
挑戰(zhàn)與應用
隨著科學技術(shù)和人工智能的不斷發(fā)展,智能生活已經(jīng)深入生活各個方面,而AI語音控制作為智能化的前驅(qū),其智...
發(fā)表于 2023-05-31 09:50?
511次閱讀
智能語音技術(shù)是人工智能應用最成熟的技術(shù)之一,并擁有交互的自然性,就是讓智能設備聽懂人類的語音。它是一門涉及數(shù)字...
發(fā)表于 2023-05-27 09:41?
360次閱讀
我是用的是ESP32-WROOM芯片,用的Vscode+IDF+ADF,我跑了一下官方的語音識別中的asr例程,但是我發(fā)現(xiàn),...
發(fā)表于 2023-03-13 09:13?
56次閱讀
運行esp-adfexamplescloud_servicespipeline_baidu_speech_mp3例程失敗,已在百度AI開放平臺注冊語音合成應用,并且...
發(fā)表于 2023-03-10 08:48?
47次閱讀
我現(xiàn)在整合了語音識別和音樂播放器的功能,識別到喚醒詞我就把音樂播放關閉,并且保存播...
發(fā)表于 2023-03-10 08:31?
63次閱讀
ets Jun 8 2016 00:22:57
rst:0x1 (POWERON_RESET),boot:0x13 (SPI_FAST_FLAS...
發(fā)表于 2023-03-10 08:03?
50次閱讀
購買ESP32-LyraTD-MSC,準備作語音識別控制跑步機運動。在自己播放歌曲或者比較安靜的環(huán)境下使用問題都不大,...
發(fā)表于 2023-03-10 07:58?
93次閱讀
我使用你們官方的例程“asr”發(fā)現(xiàn)無法連續(xù)識別語音控制命令,在硬件方面,我換成LyraT-V2.2的開發(fā)板仍然無法連續(xù)識...
發(fā)表于 2023-03-10 07:21?
52次閱讀
想問下大家ESP-WHO的examples里面的ESP32-S3-EYE可以用語音識別來控制,采集到的原始音頻數(shù)據(jù)可以在哪找...
發(fā)表于 2023-03-06 06:58?
56次閱讀
評論