0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

關(guān)于人工智能語音的三次技術(shù)躍進(jìn)詳細(xì)分析

KIyT_gh_211d74f ? 2017-12-20 13:30 ? 次閱讀

人工智能的誕生沒有統(tǒng)一說法。

有部分學(xué)者以1950年“人工智能之父”馬文·明斯基建造世界上第一臺(tái)神經(jīng)網(wǎng)絡(luò)計(jì)算機(jī)為起點(diǎn),到現(xiàn)在,大致經(jīng)歷三段演化和推進(jìn)。

讓我們一起回顧整個(gè)過程,來看一下人工智能語音的三次技術(shù)躍進(jìn)。

人工智能語音1.0:一問一答

現(xiàn)在,人工智能語音技術(shù)在數(shù)碼電子、工業(yè)制造領(lǐng)域被廣泛應(yīng)用并且成為全民熱議的話題,可是在發(fā)展之初它還有很多稚嫩的地方。

關(guān)于人工智能時(shí)代的討論有很多,但在消費(fèi)層面上,真正大范圍進(jìn)入用戶試用階段的人工智能語音應(yīng)用大概在2010年之后。這個(gè)階段的人工智能語音技術(shù)形成了以語音交互為主的感知狀態(tài),我們暫且稱之為第一階段。

這時(shí)的人工智能語音應(yīng)用通過算法的演變和大量數(shù)據(jù)的輸入,在技術(shù)層面實(shí)現(xiàn)自然語音識(shí)別和語義理解,針對(duì)對(duì)話內(nèi)容進(jìn)行數(shù)據(jù)匹配,然后調(diào)取相關(guān)話題,從而實(shí)現(xiàn)簡(jiǎn)單內(nèi)容的單向一問一答。

第一階段在自我學(xué)習(xí)、邏輯推理方面有很大欠缺,不能針對(duì)同一對(duì)話內(nèi)容展開深入交互,橫向拓展和縱向發(fā)展都不能滿足用戶需求。

例如你問今天天氣如何?他調(diào)取今天的天氣數(shù)據(jù)。

接著你問明天的天氣如何?他調(diào)取明天的天氣預(yù)報(bào)。

今天天氣和明天天氣只是各自獨(dú)立的對(duì)答,不能連接貫通,形成邏輯。

關(guān)于人工智能語音技術(shù)的研究,國(guó)外企業(yè)投入較早,且發(fā)展也比較全面。

像Nuance,曾經(jīng)在語音識(shí)別方面功績(jī)卓著,到現(xiàn)在為止仍然是全球最大的語音技術(shù)公司,專利數(shù)量和市場(chǎng)份額都遙遙領(lǐng)先。之后包括亞馬遜、蘋果和谷歌,都在深度挖掘智能語音,推出自己的語音助手。

據(jù)不完全統(tǒng)計(jì),目前全球?qū)I(yè)做人工智能語音的公司有上千家之多,后起之秀越來越多,涉及的領(lǐng)域越來越廣。

如總部位于奧地利維也納的Cortical.io,主要提供新型自然語言理解(NLU)解決方案。

由艾倫人工智能研究所和亞馬遜Alexa基金等機(jī)構(gòu)資助KITT.AI公司,開發(fā)可定制熱詞檢測(cè)器(hotworddetector)和對(duì)話引擎ChatFlow。舊金山的MindMeld公司可提供對(duì)話式人工智能平臺(tái)等等。

人工智能語音2.0:有問有答

早在2000年,比爾 · 蓋茨就提出“未來10年是語音的時(shí)代”。

我們目前所說的智能語音,學(xué)術(shù)界稱為“自然語言處理”(來自百度)。業(yè)內(nèi)人士認(rèn)為,智能語音技術(shù)將會(huì)成為人類主流的人機(jī)交互方式之一,計(jì)算機(jī)技術(shù)與人工智能領(lǐng)域的發(fā)展為智能語音交互發(fā)展帶來了希望。

人工智能語音交互的更深層階段——對(duì)話,即有問有答,包含上下文邏輯。

舉個(gè)例子或許更好理解,如果一門課程上一年沒開設(shè),對(duì)于“這門課程去年有多少同學(xué)沒通過”這樣的問題,機(jī)器是回答“都沒通過”還是“去年沒開這門課”?同時(shí)機(jī)器還需要提前存儲(chǔ)“去年沒開這門課”的信息,想想我們從小時(shí)候啥也不懂到現(xiàn)在懂得的知識(shí)和信息,這是難以想象的數(shù)據(jù)量。

再比如說“我想聽周杰倫的歌”,機(jī)器只會(huì)將周杰倫的歌顯示出來,并不能直接播放。就是說假如你要做一件事情,需要給機(jī)器一個(gè)明確的指令,否則,會(huì)讓人很煩躁,因?yàn)槟阋恢闭f下去。

當(dāng)然,“對(duì)話”層面,仍然停留在“人機(jī)對(duì)話”階段,機(jī)器仍然停留在被動(dòng)接受人類輸入大量數(shù)據(jù)階段,相比“問答”層面,只不過信息流、數(shù)據(jù)存儲(chǔ)量更大,機(jī)器仍然不能更深層次理解人的意思,無法實(shí)現(xiàn)自學(xué)習(xí)、自成長(zhǎng),與機(jī)器的語音交流還不能像人一樣自然。

人工智能語音3.0:自然交互

人工智能進(jìn)入第三階段,最大的進(jìn)展就是交互的進(jìn)展。不僅僅有問有答,不僅僅包含上下文邏輯了,人工智能硬件能夠更多地融合各種環(huán)境信息,作出不同決策或推薦。也就說,在交互的過程中,機(jī)器有了更多的主動(dòng)性,能夠?yàn)槿颂峁└?、更好的幫助,讓人們的生活更便捷,更安全,更有趣?/p>

有兩個(gè)比較典型的應(yīng)用場(chǎng)景,一個(gè)是智能汽車,一個(gè)是智能家居。

2010年,谷歌秘密研究的無人汽車項(xiàng)目被《***》記者曝光,當(dāng)時(shí)引起了不小的震動(dòng)。無人汽車即無人駕駛汽車,也叫智能汽車,主要是通過車載傳感系統(tǒng)感知道路環(huán)境,并依靠車內(nèi)的人工智能系統(tǒng)自動(dòng)規(guī)劃行車路線,到達(dá)預(yù)定目的地。

谷歌無人駕駛汽車在開放道路上行駛時(shí),會(huì)對(duì)來往車輛、行人,路面環(huán)境信息進(jìn)行識(shí)別與分析,為系統(tǒng)的決策判斷提供依據(jù)。系統(tǒng)經(jīng)過長(zhǎng)期的“學(xué)習(xí)”后,人工智能具備的策略神經(jīng)元將變得更加熟練高效,并形成類似于人的“感覺”,能及時(shí)處理駕駛過程中的突發(fā)情況。

2016年1月,美國(guó)國(guó)家公路安全交通管理局(NHTSA)在其網(wǎng)站上發(fā)布了***,表示根據(jù)聯(lián)邦政府現(xiàn)行法律規(guī)定,谷歌的無人駕駛汽車采用的人工智能系統(tǒng)可以被視為“司機(jī)”。這被視為是人工智能發(fā)展里程碑的事件,也標(biāo)志著“智能”可以像“人工”一樣感知、判斷、推理并做出決策,可以實(shí)現(xiàn)主動(dòng)控制,也能更好地人機(jī)交互與協(xié)同。

在智能家居領(lǐng)域,人工智能的發(fā)展方向同樣是人機(jī)交互、操作簡(jiǎn)單、通過大數(shù)據(jù)能夠進(jìn)行自主判斷決策。

長(zhǎng)虹前不久推出了人工智能電視新品Q5K,主打語義理解和模糊搜片。不需要絕對(duì)明確的指令,人工智能電視能識(shí)別和理解用戶的語義。比如當(dāng)用戶說“太暗了”時(shí),電視能理解那是什么意思并知道該怎么做,而不是非得等用戶說出“調(diào)高亮度”。

再比如,最近熱播的一部電視劇《那年花開月正圓》,名字太長(zhǎng)很多人記不住,但只要你說“我想看花開月圓”,長(zhǎng)虹人工智能電視也能找到這部片。如果連這幾個(gè)字都記不住,說“我想看陳曉的電視劇”,它也會(huì)根據(jù)熱播影視數(shù)據(jù)推薦出這部片來。甚至于說到“我想看陳妍希老公的電視劇”,這臺(tái)電視也能理解,你所說的八成就是這部由陳曉主演、最近熱播的《那年花開月正圓》,并為你播放出來。

這就相當(dāng)于機(jī)器真正有了“大腦”,從而可以感知,交互,理解和決策。因此,也就能夠更好地為人類服務(wù)了。


聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 人工智能
    +關(guān)注

    關(guān)注

    1792

    文章

    47373

    瀏覽量

    238861

原文標(biāo)題:1.0到3.0:人工智能語音的三次技術(shù)躍進(jìn)

文章出處:【微信號(hào):gh_211d74f707ff,微信公眾號(hào):重慶人工智能】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏

    評(píng)論

    相關(guān)推薦

    TCP三次握手安全性分析

    TCP(傳輸控制協(xié)議)的三次握手是建立可靠連接的重要機(jī)制,它確保了通信雙方在數(shù)據(jù)傳輸前的連接狀態(tài)是可靠和準(zhǔn)確的。然而,從安全性的角度來分析,TCP三次握手并非無懈可擊,以下是對(duì)其安全性的詳細(xì)分
    的頭像 發(fā)表于 01-03 18:10 ?432次閱讀

    TCP三次握手的詳細(xì)過程

    是TCP三次握手的詳細(xì)過程: 1. 第一握手:SYN(同步序列編號(hào)) 客戶端 :客戶端準(zhǔn)備發(fā)起一個(gè)TCP連接,并向服務(wù)器發(fā)送一個(gè)SYN(同步序列編號(hào))報(bào)文。這個(gè)SYN報(bào)文包含客戶端的初始序列號(hào)(ISN),這是一個(gè)隨機(jī)數(shù),用于標(biāo)
    的頭像 發(fā)表于 01-03 17:11 ?314次閱讀

     美國(guó)站群vps云服務(wù)器缺點(diǎn)詳細(xì)分析

    美國(guó)站群VPS云服務(wù)器在提供多項(xiàng)優(yōu)勢(shì)的同時(shí),也存在一些缺點(diǎn)。主機(jī)推薦小編為您整理發(fā)布美國(guó)站群vps云服務(wù)器缺點(diǎn)詳細(xì)分析。
    的頭像 發(fā)表于 12-12 10:43 ?109次閱讀

    嵌入式和人工智能究竟是什么關(guān)系?

    對(duì)人工智能應(yīng)用的實(shí)時(shí)響應(yīng)。與此同時(shí),嵌入式系統(tǒng)在邊緣計(jì)算和物聯(lián)網(wǎng)領(lǐng)域,也為人工智能的應(yīng)用提供了廣闊的空間。 在邊緣計(jì)算中,嵌入式系統(tǒng)能夠?qū)?b class='flag-5'>人工智能算法部署到設(shè)備端,實(shí)現(xiàn)對(duì)數(shù)據(jù)的即時(shí)處理和分析
    發(fā)表于 11-14 16:39

    《AI for Science:人工智能驅(qū)動(dòng)科學(xué)創(chuàng)新》第6章人AI與能源科學(xué)讀后感

    幸得一好書,特此來分享。感謝平臺(tái),感謝作者。受益匪淺。 在閱讀《AI for Science:人工智能驅(qū)動(dòng)科學(xué)創(chuàng)新》的第6章后,我深刻感受到人工智能在能源科學(xué)領(lǐng)域中的巨大潛力和廣泛應(yīng)用。這一章詳細(xì)
    發(fā)表于 10-14 09:27

    AI for Science:人工智能驅(qū)動(dòng)科學(xué)創(chuàng)新》第4章-AI與生命科學(xué)讀后感

    閱讀這一章后,我深感人工智能與生命科學(xué)的結(jié)合正引領(lǐng)著一場(chǎng)前所未有的科學(xué)革命,以下是我個(gè)人的讀后感: 1. 技術(shù)革新與生命科學(xué)進(jìn)步 這一章詳細(xì)闡述了人工智能如何通過其強(qiáng)大的數(shù)據(jù)處理和
    發(fā)表于 10-14 09:21

    《AI for Science:人工智能驅(qū)動(dòng)科學(xué)創(chuàng)新》第一章人工智能驅(qū)動(dòng)的科學(xué)創(chuàng)新學(xué)習(xí)心得

    人工智能:科學(xué)研究的加速器 第一章清晰地闡述了人工智能作為科學(xué)研究工具的強(qiáng)大功能。通過機(jī)器學(xué)習(xí)、深度學(xué)習(xí)等先進(jìn)技術(shù),AI能夠處理和分析海量數(shù)據(jù),發(fā)現(xiàn)傳統(tǒng)方法難以捕捉的模式和規(guī)律。這不
    發(fā)表于 10-14 09:12

    risc-v在人工智能圖像處理應(yīng)用前景分析

    RISC-V在人工智能圖像處理領(lǐng)域的應(yīng)用前景十分廣闊,這主要得益于其開源性、靈活性和低功耗等特點(diǎn)。以下是對(duì)RISC-V在人工智能圖像處理應(yīng)用前景的詳細(xì)分析: 一、RISC-V的基本特點(diǎn) RISC-V
    發(fā)表于 09-28 11:00

    人工智能ai 數(shù)電 模電 模擬集成電路原理 電路分析

    人工智能ai 數(shù)電 模電 模擬集成電路原理 電路分析 想問下哪些比較容易學(xué) 不過好像都是要學(xué)的
    發(fā)表于 09-26 15:24

    FPGA在人工智能中的應(yīng)用有哪些?

    定制化的硬件設(shè)計(jì),提高了硬件的靈活性和適應(yīng)性。 綜上所述,F(xiàn)PGA在人工智能領(lǐng)域的應(yīng)用前景廣闊,不僅可以用于深度學(xué)習(xí)的加速和云計(jì)算的加速,還可以針對(duì)特定應(yīng)用場(chǎng)景進(jìn)行定制化計(jì)算,為人工智能技術(shù)的發(fā)展提供有力支持。
    發(fā)表于 07-29 17:05

    人工智能芯片與服務(wù)器芯片的區(qū)別

    人工智能芯片(AI芯片)與服務(wù)器芯片在多個(gè)方面存在顯著差異,這些差異主要體現(xiàn)在設(shè)計(jì)目標(biāo)、功能特性、應(yīng)用場(chǎng)景以及技術(shù)發(fā)展趨勢(shì)上。以下是對(duì)兩者區(qū)別的詳細(xì)分析
    的頭像 發(fā)表于 07-12 18:21 ?1652次閱讀

    人工智能語音識(shí)別技術(shù)詳解

    隨著科技的飛速發(fā)展,人工智能(AI)技術(shù)已經(jīng)滲透到我們生活的方方面面,其中語音識(shí)別技術(shù)作為AI領(lǐng)域的重要分支,更是以其獨(dú)特的魅力和廣泛的應(yīng)用前景,引起了社會(huì)各界的廣泛關(guān)注。本文將
    的頭像 發(fā)表于 07-01 11:39 ?1303次閱讀

    諧波和三次諧波區(qū)別 二諧波危害沒有三次諧波大?

    生并傳導(dǎo)會(huì)帶來一系列的問題。本文將詳細(xì)探討二諧波和三次諧波的區(qū)別,并深入分析它們對(duì)電力系統(tǒng)的危害。 一、二諧波的定義和特點(diǎn): 二
    的頭像 發(fā)表于 04-08 17:11 ?6134次閱讀

    嵌入式人工智能的就業(yè)方向有哪些?

    嵌入式人工智能的就業(yè)方向有哪些? 在新一輪科技革命與產(chǎn)業(yè)變革的時(shí)代背景下,嵌入式人工智能成為國(guó)家新型基礎(chǔ)建設(shè)與傳統(tǒng)產(chǎn)業(yè)升級(jí)的核心驅(qū)動(dòng)力。同時(shí)在此背景驅(qū)動(dòng)下,眾多名企也紛紛在嵌入式人工智能領(lǐng)域布局
    發(fā)表于 02-26 10:17

    說說TCP三次握手的過程?為什么是三次而不是兩、四?

    說說TCP三次握手的過程?為什么是三次而不是兩、四? TCP三次握手是建立TCP連接的過程,確保數(shù)據(jù)的可靠傳輸。它是由發(fā)送端和接收端完成
    的頭像 發(fā)表于 02-04 11:03 ?701次閱讀