自互聯(lián)網(wǎng)誕生以來(lái),人與機(jī)器的信息交互方式就在不斷演進(jìn)和發(fā)展。從早期單一的鼠標(biāo)、鍵盤(pán)操作方式,再到如今以智能手機(jī)為代表的觸控交互。我們急切地想知道:下一代的人機(jī)交互方式是什么?
智能語(yǔ)音,賦予了機(jī)器可以像人類一樣“講話”并與人類“對(duì)話”的能力,也讓不少人看到了語(yǔ)音技術(shù)的巨大潛力。追溯起來(lái),有關(guān)語(yǔ)音技術(shù)真正意義上的研究可以追溯到 1876 年貝爾電話的發(fā)明。
從 2009 年開(kāi)始,借助機(jī)器學(xué)習(xí)領(lǐng)域深度學(xué)習(xí)研究的發(fā)展及大數(shù)據(jù)語(yǔ)料的積累,以語(yǔ)音識(shí)別為突出代表的語(yǔ)音技術(shù)得到了突飛猛進(jìn)的發(fā)展。如將深度學(xué)習(xí)引入語(yǔ)音識(shí)別聲學(xué)模型訓(xùn)練,使用基于 RBM 預(yù)訓(xùn)練的多層神經(jīng)網(wǎng)絡(luò),以提高聲學(xué)模型的準(zhǔn)確性,包括蘋(píng)果公司的 Siri、谷歌公司的 Google Assistant 的面世曾一時(shí)引起了不小轟動(dòng)。2015 年,亞馬遜 Amazon Echo 的誕生正式開(kāi)啟了智能語(yǔ)音技術(shù)的競(jìng)爭(zhēng)局面。從智能音箱到主打語(yǔ)音交互的智能設(shè)備,國(guó)內(nèi)外巨頭們不惜輪番價(jià)格戰(zhàn)。
截止到目前,國(guó)內(nèi)外的戰(zhàn)場(chǎng)上有阿里、騰訊、百度,也有谷歌、微軟、亞馬遜、Facebook,它們的介入導(dǎo)致不少創(chuàng)新公司展開(kāi)了激烈競(jìng)爭(zhēng),也對(duì)未來(lái)十年產(chǎn)生了極其重要的影響。
在眾多語(yǔ)音技術(shù)中,語(yǔ)音識(shí)別、語(yǔ)音合成、聲紋識(shí)別、語(yǔ)音喚醒、端信號(hào)處理等語(yǔ)音技術(shù)伴隨著算法統(tǒng)計(jì)模型的迭代有了新的重大創(chuàng)新,也成為當(dāng)前最具有挑戰(zhàn)性和應(yīng)用場(chǎng)景的技術(shù)。
以聲紋識(shí)別為例,即通過(guò)對(duì)一種或多種語(yǔ)音信號(hào)的特征分析來(lái)判斷說(shuō)話人身份的技術(shù)。由于任何兩個(gè)人的聲紋圖譜都有所差異,所以聲紋同樣具有如指紋生物特征一樣的唯一性。聲音不涉及隱私問(wèn)題,麥克風(fēng)和傳感器等相關(guān)設(shè)備成本低廉,傳輸帶寬窄,而語(yǔ)音又是一個(gè)形簡(jiǎn)意豐的信號(hào),口音、語(yǔ)種、情感等各種信息通過(guò)一段聲音便傳輸了出來(lái)。
清華大學(xué)語(yǔ)音和語(yǔ)言技術(shù)中心主任、得意音通董事長(zhǎng)鄭方博士接受 CSDN 采訪時(shí)表示:“目前在聲紋識(shí)別這個(gè)領(lǐng)域,不同技術(shù)或產(chǎn)品提供商參差不齊、差異很大;與此同時(shí),聲紋識(shí)別不再是單一強(qiáng)調(diào)準(zhǔn)確性,而是變得更為成熟、完備和可用。”
不過(guò)相對(duì)來(lái)講,聲紋識(shí)別仍是一個(gè)應(yīng)用相對(duì)較窄的領(lǐng)域。就目前來(lái)看,語(yǔ)音識(shí)別、語(yǔ)音合成的應(yīng)用更為廣泛。
例如在年初舉辦的Google I/O 大會(huì)上,機(jī)器語(yǔ)音助手的一聲“嗯哼”震驚了全場(chǎng),然后微軟小冰為知乎寫(xiě)歌又刷了一波屏。我們才意識(shí)到,AI 語(yǔ)音正悄然從原來(lái)的“機(jī)械式語(yǔ)音”變成了“像人類一樣說(shuō)話”的自然語(yǔ)言。
語(yǔ)音產(chǎn)業(yè)雖然可以由概念觸發(fā),但最終仍由技術(shù)驅(qū)動(dòng),打磨好技術(shù)和產(chǎn)品仍是第一要?jiǎng)?wù)。
出門(mén)問(wèn)問(wèn) CTO 雷欣曾表示,“從技術(shù)上來(lái)講,機(jī)器學(xué)習(xí)、人工智能跟其他功能性的東西不太一樣,它非常強(qiáng)調(diào)學(xué)習(xí)的過(guò)程,訓(xùn)練跟實(shí)際使用場(chǎng)景越匹配越好,做得越通用,就代表在某一個(gè)垂直領(lǐng)域做不到最優(yōu)。”
那么,隨著語(yǔ)音市場(chǎng)需求的爆發(fā),如何更好地通過(guò)智能技術(shù)解決聲學(xué)、語(yǔ)音、語(yǔ)義等各方面的問(wèn)題,對(duì)于任何一位語(yǔ)音技術(shù)相關(guān)領(lǐng)域的工程師而言,將是未來(lái)長(zhǎng)期時(shí)間內(nèi)必然面臨的挑戰(zhàn)。
現(xiàn)在,CSDN 就為大家提供了這樣一個(gè)機(jī)會(huì),讓你能夠聆聽(tīng)頭部 AI 公司的最新技術(shù)實(shí)踐,并有機(jī)會(huì)與這些公司的資深技術(shù)人員面對(duì)面交流。
2018 年 11 月 8-9 日,由中國(guó) IT 社區(qū) CSDN 與硅谷 AI 社區(qū) AICamp 聯(lián)合出品的 2018 AI 開(kāi)發(fā)者大會(huì)(AI NEXTCon)將于北京召開(kāi)。
本次大會(huì)設(shè)有“語(yǔ)音技術(shù)專場(chǎng)”,我們很榮幸邀請(qǐng)到在研究和工業(yè)界都極富盛名的一線技術(shù)專家們:清華大學(xué)語(yǔ)音和語(yǔ)言技術(shù)中心主任、得意音通董事長(zhǎng) 鄭方,聲智科技創(chuàng)始人、董事長(zhǎng)兼 CEO 陳孝良,出門(mén)問(wèn)問(wèn) CTO 雷欣、云知聲董事長(zhǎng)、CTO梁家恩,以及標(biāo)貝科技聯(lián)合創(chuàng)始人&CTO 李秀林。
下面重磅介紹語(yǔ)音技術(shù)專題的講師團(tuán)和他們的議題概要:
陳孝良:聲智科技創(chuàng)始人、董事長(zhǎng)兼 CEO
演講議題:遠(yuǎn)場(chǎng)語(yǔ)音交互技術(shù)與實(shí)踐
陳孝良,2017年度中關(guān)村高端領(lǐng)軍人才,計(jì)算機(jī)學(xué)會(huì)語(yǔ)音對(duì)話與聽(tīng)覺(jué)專業(yè)組常務(wù)委員,中國(guó)聲學(xué)學(xué)會(huì)聲頻工程分會(huì)委員,中國(guó)人工智能和大數(shù)據(jù)專家委員,美國(guó) AES/JASA會(huì)員。先后于北京航空航天大學(xué)和中國(guó)科學(xué)院大學(xué)(聲學(xué)研究所)獲得管理學(xué)學(xué)士和工學(xué)博士學(xué)位。
曾任職于金山軟件股份有限公司和中國(guó)科學(xué)院聲學(xué)研究所,歷任初級(jí)工程師、助理研究員、副研究員,兼任首屆信息化辦公室主任和中國(guó)科學(xué)院上海高等研究院客座副教授,主要參與海軍某重大型號(hào)艦艇、863、973、國(guó)家自然科學(xué)基金、中科院戰(zhàn)略先導(dǎo)等國(guó)家重要項(xiàng)目,共發(fā)表文章36篇,申請(qǐng)專利 35項(xiàng)。
鄭方:清華大學(xué)語(yǔ)音和語(yǔ)言技術(shù)中心主任、得意音通董事長(zhǎng)
演講議題:聲紋識(shí)別技術(shù)及其應(yīng)用現(xiàn)狀
鄭方,博士、教授、博士生導(dǎo)師,清華大學(xué)語(yǔ)音和語(yǔ)言技術(shù)中心主任;北京得意音通技術(shù)有限責(zé)任公司董事長(zhǎng);亞太區(qū)信號(hào)與信息處理聯(lián)合會(huì)副主席、中國(guó)中文信息學(xué)會(huì)語(yǔ)音專委會(huì)主任、中國(guó)計(jì)算機(jī)學(xué)會(huì)語(yǔ)音對(duì)話與聽(tīng)覺(jué)專業(yè)組副主任。
鄭方博士從事語(yǔ)音語(yǔ)言處理和生物特征識(shí)別的研發(fā)近 30 年,是全國(guó)安防標(biāo)委會(huì)人體生物特征識(shí)別應(yīng)用分委會(huì)副主任委員、中文語(yǔ)音交互技術(shù)標(biāo)準(zhǔn)工作組聲紋識(shí)別專題組組長(zhǎng)、全國(guó)信標(biāo)委生物特征識(shí)別分委會(huì)委員等,是許多國(guó)家和行業(yè)標(biāo)準(zhǔn)的起草者。
梁家恩:云知聲董事長(zhǎng)、CTO
演講議題:AIoT 智能交互技術(shù)與應(yīng)用
梁家恩博士畢業(yè)于中國(guó)科技大學(xué),獲中國(guó)科學(xué)院識(shí)別與智能系統(tǒng)專業(yè)博士學(xué)位,畢業(yè)后留校負(fù)責(zé)語(yǔ)音識(shí)別核心技術(shù)研發(fā)及其產(chǎn)業(yè)化,在國(guó)家863語(yǔ)音識(shí)別核心技術(shù)評(píng)測(cè)中多次獲第一名,在廣電、安全、教育等領(lǐng)域?qū)崿F(xiàn)產(chǎn)業(yè)化應(yīng)用。
2012 年,由梁家恩博士主導(dǎo)創(chuàng)立人工智能公司云知聲,并率先在國(guó)內(nèi)實(shí)現(xiàn)深度學(xué)習(xí)和5米遠(yuǎn)講識(shí)別技術(shù)的產(chǎn)業(yè)化,在業(yè)內(nèi)首次提出的“云端芯”一體化解決方案已經(jīng)在家居、車載、醫(yī)療、教育等領(lǐng)域規(guī)?;涞亍T谒蛨F(tuán)隊(duì)的共同努力下,云知聲先后被福布斯評(píng)為“中國(guó)成長(zhǎng)最快科技企業(yè)”、科技部評(píng)為“中國(guó)獨(dú)角獸企業(yè)”。2013 年底,梁家恩博士出任云知聲 CTO,負(fù)責(zé)技術(shù)領(lǐng)域。
李秀林:標(biāo)貝科技聯(lián)合創(chuàng)始人&CTO
演講議題:標(biāo)貝科技的語(yǔ)音超市實(shí)踐——助力智能產(chǎn)品人性化
李秀林,中國(guó)科學(xué)院博士,15 年語(yǔ)音相關(guān)技術(shù)研發(fā)和學(xué)術(shù)研究,申請(qǐng)專利三十余項(xiàng),在國(guó)內(nèi)外語(yǔ)音界有很高的知名度;曾帶領(lǐng)團(tuán)隊(duì)獲得百度百萬(wàn)美元大獎(jiǎng)。2006 年— 2013 年,松下研發(fā)中心高級(jí)研發(fā)經(jīng)理;2013 年— 2016 年,百度語(yǔ)音合成技術(shù)負(fù)責(zé)人;2016 年—2018 年,滴滴研究院語(yǔ)音團(tuán)隊(duì)負(fù)責(zé)人&首席算法工程師;2018年3月份加盟標(biāo)貝科技,作為聯(lián)合創(chuàng)始人兼 CTO。
雷欣:出門(mén)問(wèn)問(wèn)(Mobvoi)CTO
演講議題:語(yǔ)音交互的軟硬結(jié)合
雷欣,人工智能專家,在人工智能尤其是語(yǔ)音識(shí)別領(lǐng)域至今已有十多年研究及從業(yè)經(jīng)驗(yàn)。2006 年,雷欣獲得美國(guó)華盛頓大學(xué)電子工程博士后,加入了微軟總部任軟件設(shè)計(jì)工程師及 Speech Scientist,負(fù)責(zé)開(kāi)發(fā)微軟語(yǔ)音識(shí)別引擎內(nèi)的說(shuō)話人自適應(yīng)模塊;后加入斯坦福研究所(SRI)任研究工程師,領(lǐng)導(dǎo)開(kāi)發(fā)了SRI 2008 年大規(guī)模中文語(yǔ)音識(shí)別系統(tǒng);隨后進(jìn)入 Google 研究院任 Staff Research Scientist,領(lǐng)導(dǎo)開(kāi)發(fā) Google 基于深度神經(jīng)網(wǎng)絡(luò)的離線語(yǔ)音識(shí)別系統(tǒng)。
目前,雷欣所帶領(lǐng)的出門(mén)問(wèn)問(wèn) AI 團(tuán)隊(duì),正進(jìn)行人工智能落地在生活場(chǎng)景(可穿戴、車載、家居)上的研究開(kāi)發(fā)。
除了語(yǔ)音技術(shù)專題之外,我們還為大家準(zhǔn)備了“自然語(yǔ)言處理”、“機(jī)器學(xué)習(xí)工具”、“數(shù)據(jù)分析”、“機(jī)器學(xué)習(xí)”、“計(jì)算機(jī)視覺(jué)”、“知識(shí)圖譜”等技術(shù)專題,以及“智慧金融”、“智能駕駛”、“智慧醫(yī)療”等行業(yè)峰會(huì)。大會(huì)完整日程以及嘉賓議題請(qǐng)查看下方海報(bào)。
-
人機(jī)交互
+關(guān)注
關(guān)注
12文章
1207瀏覽量
55403 -
智能手機(jī)
+關(guān)注
關(guān)注
66文章
18493瀏覽量
180231 -
機(jī)器學(xué)習(xí)
+關(guān)注
關(guān)注
66文章
8418瀏覽量
132654
原文標(biāo)題:解放雙手,人機(jī)交互真的只需要一張嘴嗎?
文章出處:【微信號(hào):rgznai100,微信公眾號(hào):rgznai100】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
評(píng)論