0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

下一代的人機(jī)交互方式是什么?

電子工程師 ? 來(lái)源:未知 ? 作者:李倩 ? 2018-10-21 10:39 ? 次閱讀

自互聯(lián)網(wǎng)誕生以來(lái),人與機(jī)器的信息交互方式就在不斷演進(jìn)和發(fā)展。從早期單一的鼠標(biāo)、鍵盤(pán)操作方式,再到如今以智能手機(jī)為代表的觸控交互。我們急切地想知道:下一代的人機(jī)交互方式是什么?

智能語(yǔ)音,賦予了機(jī)器可以像人類一樣“講話”并與人類“對(duì)話”的能力,也讓不少人看到了語(yǔ)音技術(shù)的巨大潛力。追溯起來(lái),有關(guān)語(yǔ)音技術(shù)真正意義上的研究可以追溯到 1876 年貝爾電話的發(fā)明。

從 2009 年開(kāi)始,借助機(jī)器學(xué)習(xí)領(lǐng)域深度學(xué)習(xí)研究的發(fā)展及大數(shù)據(jù)語(yǔ)料的積累,以語(yǔ)音識(shí)別為突出代表的語(yǔ)音技術(shù)得到了突飛猛進(jìn)的發(fā)展。如將深度學(xué)習(xí)引入語(yǔ)音識(shí)別聲學(xué)模型訓(xùn)練,使用基于 RBM 預(yù)訓(xùn)練的多層神經(jīng)網(wǎng)絡(luò),以提高聲學(xué)模型的準(zhǔn)確性,包括蘋(píng)果公司的 Siri、谷歌公司的 Google Assistant 的面世曾一時(shí)引起了不小轟動(dòng)。2015 年,亞馬遜 Amazon Echo 的誕生正式開(kāi)啟了智能語(yǔ)音技術(shù)的競(jìng)爭(zhēng)局面。從智能音箱到主打語(yǔ)音交互的智能設(shè)備,國(guó)內(nèi)外巨頭們不惜輪番價(jià)格戰(zhàn)。

截止到目前,國(guó)內(nèi)外的戰(zhàn)場(chǎng)上有阿里、騰訊、百度,也有谷歌、微軟、亞馬遜、Facebook,它們的介入導(dǎo)致不少創(chuàng)新公司展開(kāi)了激烈競(jìng)爭(zhēng),也對(duì)未來(lái)十年產(chǎn)生了極其重要的影響。

在眾多語(yǔ)音技術(shù)中,語(yǔ)音識(shí)別、語(yǔ)音合成、聲紋識(shí)別、語(yǔ)音喚醒、端信號(hào)處理等語(yǔ)音技術(shù)伴隨著算法統(tǒng)計(jì)模型的迭代有了新的重大創(chuàng)新,也成為當(dāng)前最具有挑戰(zhàn)性和應(yīng)用場(chǎng)景的技術(shù)。

以聲紋識(shí)別為例,即通過(guò)對(duì)一種或多種語(yǔ)音信號(hào)的特征分析來(lái)判斷說(shuō)話人身份的技術(shù)。由于任何兩個(gè)人的聲紋圖譜都有所差異,所以聲紋同樣具有如指紋生物特征一樣的唯一性。聲音不涉及隱私問(wèn)題,麥克風(fēng)和傳感器等相關(guān)設(shè)備成本低廉,傳輸帶寬窄,而語(yǔ)音又是一個(gè)形簡(jiǎn)意豐的信號(hào),口音、語(yǔ)種、情感等各種信息通過(guò)一段聲音便傳輸了出來(lái)。

清華大學(xué)語(yǔ)音和語(yǔ)言技術(shù)中心主任、得意音通董事長(zhǎng)鄭方博士接受 CSDN 采訪時(shí)表示:“目前在聲紋識(shí)別這個(gè)領(lǐng)域,不同技術(shù)或產(chǎn)品提供商參差不齊、差異很大;與此同時(shí),聲紋識(shí)別不再是單一強(qiáng)調(diào)準(zhǔn)確性,而是變得更為成熟、完備和可用。”

不過(guò)相對(duì)來(lái)講,聲紋識(shí)別仍是一個(gè)應(yīng)用相對(duì)較窄的領(lǐng)域。就目前來(lái)看,語(yǔ)音識(shí)別、語(yǔ)音合成的應(yīng)用更為廣泛。

例如在年初舉辦的Google I/O 大會(huì)上,機(jī)器語(yǔ)音助手的一聲“嗯哼”震驚了全場(chǎng),然后微軟小冰為知乎寫(xiě)歌又刷了一波屏。我們才意識(shí)到,AI 語(yǔ)音正悄然從原來(lái)的“機(jī)械式語(yǔ)音”變成了“像人類一樣說(shuō)話”的自然語(yǔ)言。

語(yǔ)音產(chǎn)業(yè)雖然可以由概念觸發(fā),但最終仍由技術(shù)驅(qū)動(dòng),打磨好技術(shù)和產(chǎn)品仍是第一要?jiǎng)?wù)。

出門(mén)問(wèn)問(wèn) CTO 雷欣曾表示,“從技術(shù)上來(lái)講,機(jī)器學(xué)習(xí)、人工智能跟其他功能性的東西不太一樣,它非常強(qiáng)調(diào)學(xué)習(xí)的過(guò)程,訓(xùn)練跟實(shí)際使用場(chǎng)景越匹配越好,做得越通用,就代表在某一個(gè)垂直領(lǐng)域做不到最優(yōu)。”

那么,隨著語(yǔ)音市場(chǎng)需求的爆發(fā),如何更好地通過(guò)智能技術(shù)解決聲學(xué)、語(yǔ)音、語(yǔ)義等各方面的問(wèn)題,對(duì)于任何一位語(yǔ)音技術(shù)相關(guān)領(lǐng)域的工程師而言,將是未來(lái)長(zhǎng)期時(shí)間內(nèi)必然面臨的挑戰(zhàn)。

現(xiàn)在,CSDN 就為大家提供了這樣一個(gè)機(jī)會(huì),讓你能夠聆聽(tīng)頭部 AI 公司的最新技術(shù)實(shí)踐,并有機(jī)會(huì)與這些公司的資深技術(shù)人員面對(duì)面交流。

2018 年 11 月 8-9 日,由中國(guó) IT 社區(qū) CSDN 與硅谷 AI 社區(qū) AICamp 聯(lián)合出品的 2018 AI 開(kāi)發(fā)者大會(huì)(AI NEXTCon)將于北京召開(kāi)。

本次大會(huì)設(shè)有“語(yǔ)音技術(shù)專場(chǎng)”,我們很榮幸邀請(qǐng)到在研究和工業(yè)界都極富盛名的一線技術(shù)專家們:清華大學(xué)語(yǔ)音和語(yǔ)言技術(shù)中心主任、得意音通董事長(zhǎng) 鄭方,聲智科技創(chuàng)始人、董事長(zhǎng)兼 CEO 陳孝良,出門(mén)問(wèn)問(wèn) CTO 雷欣、云知聲董事長(zhǎng)、CTO梁家恩,以及標(biāo)貝科技聯(lián)合創(chuàng)始人&CTO 李秀林。

下面重磅介紹語(yǔ)音技術(shù)專題的講師團(tuán)和他們的議題概要:

陳孝良:聲智科技創(chuàng)始人、董事長(zhǎng)兼 CEO

演講議題:遠(yuǎn)場(chǎng)語(yǔ)音交互技術(shù)與實(shí)踐

陳孝良,2017年度中關(guān)村高端領(lǐng)軍人才,計(jì)算機(jī)學(xué)會(huì)語(yǔ)音對(duì)話與聽(tīng)覺(jué)專業(yè)組常務(wù)委員,中國(guó)聲學(xué)學(xué)會(huì)聲頻工程分會(huì)委員,中國(guó)人工智能和大數(shù)據(jù)專家委員,美國(guó) AES/JASA會(huì)員。先后于北京航空航天大學(xué)和中國(guó)科學(xué)院大學(xué)(聲學(xué)研究所)獲得管理學(xué)學(xué)士和工學(xué)博士學(xué)位。

曾任職于金山軟件股份有限公司和中國(guó)科學(xué)院聲學(xué)研究所,歷任初級(jí)工程師、助理研究員、副研究員,兼任首屆信息化辦公室主任和中國(guó)科學(xué)院上海高等研究院客座副教授,主要參與海軍某重大型號(hào)艦艇、863、973、國(guó)家自然科學(xué)基金、中科院戰(zhàn)略先導(dǎo)等國(guó)家重要項(xiàng)目,共發(fā)表文章36篇,申請(qǐng)專利 35項(xiàng)。

鄭方:清華大學(xué)語(yǔ)音和語(yǔ)言技術(shù)中心主任、得意音通董事長(zhǎng)

演講議題:聲紋識(shí)別技術(shù)及其應(yīng)用現(xiàn)狀

鄭方,博士、教授、博士生導(dǎo)師,清華大學(xué)語(yǔ)音和語(yǔ)言技術(shù)中心主任;北京得意音通技術(shù)有限責(zé)任公司董事長(zhǎng);亞太區(qū)信號(hào)與信息處理聯(lián)合會(huì)副主席、中國(guó)中文信息學(xué)會(huì)語(yǔ)音專委會(huì)主任、中國(guó)計(jì)算機(jī)學(xué)會(huì)語(yǔ)音對(duì)話與聽(tīng)覺(jué)專業(yè)組副主任。

鄭方博士從事語(yǔ)音語(yǔ)言處理和生物特征識(shí)別的研發(fā)近 30 年,是全國(guó)安防標(biāo)委會(huì)人體生物特征識(shí)別應(yīng)用分委會(huì)副主任委員、中文語(yǔ)音交互技術(shù)標(biāo)準(zhǔn)工作組聲紋識(shí)別專題組組長(zhǎng)、全國(guó)信標(biāo)委生物特征識(shí)別分委會(huì)委員等,是許多國(guó)家和行業(yè)標(biāo)準(zhǔn)的起草者。

梁家恩:云知聲董事長(zhǎng)、CTO

演講議題:AIoT 智能交互技術(shù)與應(yīng)用

梁家恩博士畢業(yè)于中國(guó)科技大學(xué),獲中國(guó)科學(xué)院識(shí)別與智能系統(tǒng)專業(yè)博士學(xué)位,畢業(yè)后留校負(fù)責(zé)語(yǔ)音識(shí)別核心技術(shù)研發(fā)及其產(chǎn)業(yè)化,在國(guó)家863語(yǔ)音識(shí)別核心技術(shù)評(píng)測(cè)中多次獲第一名,在廣電、安全、教育等領(lǐng)域?qū)崿F(xiàn)產(chǎn)業(yè)化應(yīng)用。

2012 年,由梁家恩博士主導(dǎo)創(chuàng)立人工智能公司云知聲,并率先在國(guó)內(nèi)實(shí)現(xiàn)深度學(xué)習(xí)和5米遠(yuǎn)講識(shí)別技術(shù)的產(chǎn)業(yè)化,在業(yè)內(nèi)首次提出的“云端芯”一體化解決方案已經(jīng)在家居、車載、醫(yī)療、教育等領(lǐng)域規(guī)?;涞亍T谒蛨F(tuán)隊(duì)的共同努力下,云知聲先后被福布斯評(píng)為“中國(guó)成長(zhǎng)最快科技企業(yè)”、科技部評(píng)為“中國(guó)獨(dú)角獸企業(yè)”。2013 年底,梁家恩博士出任云知聲 CTO,負(fù)責(zé)技術(shù)領(lǐng)域。

李秀林:標(biāo)貝科技聯(lián)合創(chuàng)始人&CTO

演講議題:標(biāo)貝科技的語(yǔ)音超市實(shí)踐——助力智能產(chǎn)品人性化

李秀林,中國(guó)科學(xué)院博士,15 年語(yǔ)音相關(guān)技術(shù)研發(fā)和學(xué)術(shù)研究,申請(qǐng)專利三十余項(xiàng),在國(guó)內(nèi)外語(yǔ)音界有很高的知名度;曾帶領(lǐng)團(tuán)隊(duì)獲得百度百萬(wàn)美元大獎(jiǎng)。2006 年— 2013 年,松下研發(fā)中心高級(jí)研發(fā)經(jīng)理;2013 年— 2016 年,百度語(yǔ)音合成技術(shù)負(fù)責(zé)人;2016 年—2018 年,滴滴研究院語(yǔ)音團(tuán)隊(duì)負(fù)責(zé)人&首席算法工程師;2018年3月份加盟標(biāo)貝科技,作為聯(lián)合創(chuàng)始人兼 CTO。

雷欣:出門(mén)問(wèn)問(wèn)(Mobvoi)CTO

演講議題:語(yǔ)音交互的軟硬結(jié)合

雷欣,人工智能專家,在人工智能尤其是語(yǔ)音識(shí)別領(lǐng)域至今已有十多年研究及從業(yè)經(jīng)驗(yàn)。2006 年,雷欣獲得美國(guó)華盛頓大學(xué)電子工程博士后,加入了微軟總部任軟件設(shè)計(jì)工程師及 Speech Scientist,負(fù)責(zé)開(kāi)發(fā)微軟語(yǔ)音識(shí)別引擎內(nèi)的說(shuō)話人自適應(yīng)模塊;后加入斯坦福研究所(SRI)任研究工程師,領(lǐng)導(dǎo)開(kāi)發(fā)了SRI 2008 年大規(guī)模中文語(yǔ)音識(shí)別系統(tǒng);隨后進(jìn)入 Google 研究院任 Staff Research Scientist,領(lǐng)導(dǎo)開(kāi)發(fā) Google 基于深度神經(jīng)網(wǎng)絡(luò)的離線語(yǔ)音識(shí)別系統(tǒng)。

目前,雷欣所帶領(lǐng)的出門(mén)問(wèn)問(wèn) AI 團(tuán)隊(duì),正進(jìn)行人工智能落地在生活場(chǎng)景(可穿戴、車載、家居)上的研究開(kāi)發(fā)。

除了語(yǔ)音技術(shù)專題之外,我們還為大家準(zhǔn)備了“自然語(yǔ)言處理”、“機(jī)器學(xué)習(xí)工具”、“數(shù)據(jù)分析”、“機(jī)器學(xué)習(xí)”、“計(jì)算機(jī)視覺(jué)”、“知識(shí)圖譜”等技術(shù)專題,以及“智慧金融”、“智能駕駛”、“智慧醫(yī)療”等行業(yè)峰會(huì)。大會(huì)完整日程以及嘉賓議題請(qǐng)查看下方海報(bào)。

聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 人機(jī)交互
    +關(guān)注

    關(guān)注

    12

    文章

    1207

    瀏覽量

    55403
  • 智能手機(jī)
    +關(guān)注

    關(guān)注

    66

    文章

    18493

    瀏覽量

    180231
  • 機(jī)器學(xué)習(xí)

    關(guān)注

    66

    文章

    8418

    瀏覽量

    132654

原文標(biāo)題:解放雙手,人機(jī)交互真的只需要一張嘴嗎?

文章出處:【微信號(hào):rgznai100,微信公眾號(hào):rgznai100】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏

    評(píng)論

    相關(guān)推薦

    的人機(jī)交互入口?大模型加持、AI眼鏡賽道開(kāi)啟百鏡大戰(zhàn)

    電子發(fā)燒友網(wǎng)報(bào)道(文/莫婷婷)隨著智能眼鏡的出現(xiàn),加之AI技術(shù)的應(yīng)用,AI智能眼鏡被認(rèn)為是下一代人機(jī)交互的入口。在今年,不少品牌廠商都推出了AI智能眼鏡新品,包括李未可推出的Meta Lens
    的頭像 發(fā)表于 11-21 00:57 ?2853次閱讀
    新<b class='flag-5'>的人機(jī)交互</b>入口?大模型加持、AI眼鏡賽道開(kāi)啟百鏡大戰(zhàn)

    具身智能對(duì)人機(jī)交互的影響

    在人工智能的發(fā)展歷程中,人機(jī)交互直是研究的核心領(lǐng)域之。隨著技術(shù)的進(jìn)步,人機(jī)交互方式也在不斷演變。從最初的命令行界面,到圖形用戶界面,再
    的頭像 發(fā)表于 10-27 09:58 ?344次閱讀

    聚徽-工控體機(jī)是如何實(shí)現(xiàn)人機(jī)交互

    工控體機(jī)實(shí)現(xiàn)人機(jī)交互方式是多種多樣的,結(jié)合搜索結(jié)果,我們可以歸納出以下幾種主要的實(shí)現(xiàn)方式
    的頭像 發(fā)表于 09-10 09:31 ?358次閱讀

    基于傳感器的人機(jī)交互技術(shù)

    基于傳感器的人機(jī)交互技術(shù)是現(xiàn)代科技發(fā)展的重要領(lǐng)域之,它極大地推動(dòng)了人機(jī)交互的便捷性、自然性和智能性。本文將詳細(xì)探討基于傳感器的人機(jī)交互技術(shù),包括其基本原理、關(guān)鍵技術(shù)、應(yīng)用領(lǐng)域以及未來(lái)
    的頭像 發(fā)表于 07-17 16:52 ?815次閱讀

    人機(jī)界面交互方式的介紹

    : 圖形用戶界面(Graphical User Interface, GUI) 圖形用戶界面是最常見(jiàn)的人機(jī)交互方式。它通過(guò)圖形元素(如圖標(biāo)、按鈕、菜單等)來(lái)實(shí)現(xiàn)用戶與計(jì)算機(jī)的交互。
    的頭像 發(fā)表于 07-01 14:22 ?842次閱讀

    人機(jī)交互界面是什么_人機(jī)交互界面的功能

    人機(jī)交互界面(Human-Computer Interaction Interface,簡(jiǎn)稱HCI或HMI),也被稱為人機(jī)界面(MMI)、操作員界面終端(OIT)、本地操作員界面(LOI)或操作員
    的頭像 發(fā)表于 06-22 11:03 ?2547次閱讀

    工業(yè)平板電腦在人機(jī)交互中的應(yīng)用

    工業(yè)平板電腦在人機(jī)交互(Human-Machine Interaction,HMI)中扮演著至關(guān)重要的角色,它們通過(guò)直觀的界面和強(qiáng)大的計(jì)算能力,極大地提升了工業(yè)環(huán)境下的操作效率和用戶體驗(yàn)。以下是工業(yè)平板電腦在人機(jī)交互中的具體應(yīng)用:
    的頭像 發(fā)表于 06-18 12:00 ?299次閱讀

    24芯M16插頭在下一代技術(shù)中的潛力

      德索工程師說(shuō)道隨著科技的飛速發(fā)展,下一代技術(shù)正逐漸展現(xiàn)出其獨(dú)特的魅力和潛力。在這背景下,24芯M16插頭作為種高性能、多功能的連接器,將在下一代技術(shù)中發(fā)揮至關(guān)重要的作用。以下是
    的頭像 發(fā)表于 06-15 18:03 ?339次閱讀
    24芯M16插頭在<b class='flag-5'>下一代</b>技術(shù)中的潛力

    人機(jī)交互與人機(jī)界面的區(qū)別與聯(lián)系

    隨著信息技術(shù)的飛速發(fā)展,人機(jī)交互(Human-Computer Interaction,HCI)已成為現(xiàn)代社會(huì)不可或缺的部分。人機(jī)交互技術(shù),作為實(shí)現(xiàn)人與計(jì)算機(jī)之間有效通信的橋梁,不僅改變了我們
    的頭像 發(fā)表于 06-07 15:29 ?1006次閱讀

    技術(shù)干貨|下一代 HMI 的三個(gè)關(guān)鍵考慮因素

    在日常生活中,我們不斷發(fā)現(xiàn)與機(jī)器相關(guān)的接觸點(diǎn)越來(lái)越多。那么,HMI 的未來(lái)如何?除了數(shù)據(jù)收集、控制和顯示外,新一代 HMI 將拋開(kāi)傳統(tǒng)的人機(jī)界面,在各種應(yīng)用中提供人機(jī)交互,使機(jī)器可以智能地作業(yè)并與人類交流。例如,通過(guò)無(wú)接觸
    的頭像 發(fā)表于 04-19 12:49 ?315次閱讀

    淺談下一代HMI的三個(gè)考慮因素

    步入人機(jī)交互的新世界,將需要交互式的智能應(yīng)用,同時(shí),用于支持實(shí)現(xiàn) HMI 的處理器也面臨系列新的挑戰(zhàn)。下面,我們來(lái)詳細(xì)了解下一代 HMI 的三個(gè)考慮因素。
    發(fā)表于 04-19 11:15 ?233次閱讀

    使用NVIDIA Holoscan for Media構(gòu)建下一代直播媒體應(yīng)用

    NVIDIA Holoscan for Media 現(xiàn)已向所有希望在完全可重復(fù)使用的集群上構(gòu)建下一代直播媒體應(yīng)用的開(kāi)發(fā)者開(kāi)放。
    的頭像 發(fā)表于 04-16 14:04 ?674次閱讀

    人機(jī)交互的三個(gè)階段 人機(jī)交互的常用方式

    機(jī)交互經(jīng)歷的三個(gè)階段:命令行界面交互階段、圖形用戶界面交互階段、自然和諧的人機(jī)交互階段。
    的頭像 發(fā)表于 03-13 17:25 ?3078次閱讀

    人機(jī)交互技術(shù)有哪幾種 人機(jī)交互技術(shù)的發(fā)展趨勢(shì)

    人機(jī)交互技術(shù)是指人與計(jì)算機(jī)之間通過(guò)各種交互方式進(jìn)行信息傳遞、操作和控制的技術(shù)。隨著科技的進(jìn)步,人機(jī)交互技術(shù)也在不斷發(fā)展創(chuàng)新。以下將介紹人機(jī)交互
    的頭像 發(fā)表于 01-22 17:47 ?3668次閱讀

    榮耀發(fā)布MagicOS 8.0,首次實(shí)現(xiàn)意圖識(shí)別人機(jī)交互

    在科技圈掀起股熱潮的榮耀正式發(fā)布了其自主研發(fā)的全新操作系統(tǒng)——MagicOS 8.0,并賦予其個(gè)富有魔法的中文名字:魔法OS 8.0。這款新操作系統(tǒng)憑借其獨(dú)創(chuàng)的平臺(tái)級(jí)AI使能的意圖識(shí)別人機(jī)交互,重新定義了智能終端的
    的頭像 發(fā)表于 01-12 14:50 ?906次閱讀