您好,歡迎來電子發(fā)燒友網(wǎng)! ,新用戶?[免費(fèi)注冊]

您的位置:電子發(fā)燒友網(wǎng)>源碼下載>數(shù)值算法/人工智能>

鄢志杰談深度學(xué)習(xí)要基于問題來選擇工具

大?。?/span>0.03 MB 人氣: 2017-10-13 需要積分:1
 鄢志杰將在12月11日下午的深度學(xué)習(xí)論壇進(jìn)行題為“Deep Learning 助力客服小二:數(shù)據(jù)技術(shù)及機(jī)器學(xué)習(xí)在客服中心的應(yīng)用”的主題演講,分享基于DNN、CNN、RNN(LSTM)及其各種組合模型的語音識別、自然語言處理技術(shù)在客服領(lǐng)域的應(yīng)用。
  鄢志杰在接受采訪時(shí)表示,他的分享內(nèi)容將包括Deep Learning 判斷小二對問題定位的一致性、采用Deep Learning自動(dòng)識別用戶問題等,iDST在數(shù)據(jù)技術(shù)及機(jī)器學(xué)習(xí)方面的嘗試,已經(jīng)在阿里巴巴集團(tuán)及螞蟻金服助力客服小二,向客服機(jī)器人的引入邁出了第一步。不過,他認(rèn)為,客服機(jī)器人不是要取代人工,而是要學(xué)習(xí)人、幫助人。比如阿里巴巴客服中心的很多Machine Learning的工作,都是去學(xué)習(xí)客服小二是如何服務(wù)的,沒有客服小二,學(xué)習(xí)無從入手。
  談到深度學(xué)習(xí)的挑戰(zhàn),鄢志杰表示,近年來在DL領(lǐng)域不管三七二十一加數(shù)據(jù)、加運(yùn)算能力、增加模型規(guī)模的brute-force方法從某種意義上講是相當(dāng)成功的。DL在Feature Engineering上的成功也帶來了似乎不需要再關(guān)注問題本身、不需要任何Domain Knowledge,只需要把Raw Feature扔進(jìn)Deep Model訓(xùn)練一下就能打敗歷史上所有模型的假象——這恰恰只是說明了我們很多人對DL的理解還比較膚淺。他認(rèn)為,DL目前的挑戰(zhàn)之一就是需要重新去嚴(yán)肅的思考我們要解的問題、了解我們的模型、分析我們的數(shù)據(jù),而不是一味的強(qiáng)調(diào)“大數(shù)據(jù)”、“大模型”、“大計(jì)算”。
  此外,對于機(jī)器學(xué)習(xí)開源工具的選擇,鄢志杰認(rèn)為,工具就是工具,不必抱有“宗教信仰”,比較合適的態(tài)度也許是更關(guān)注你要解的問題,基于問題來選擇工具。
  
  鄢志杰
  阿里巴巴iDST語音組高級專家
  鄢志杰,阿里巴巴 iDST(Institute of Data Science and Technologies)語音組高級專家。在加入阿里巴巴前,就職于微軟亞洲研究院,任語音組主管研究員。畢業(yè)于中國科學(xué)技術(shù)大學(xué)訊飛語音實(shí)驗(yàn)室,獲博士學(xué)位。研究領(lǐng)域主要包括語音識別、語音合成、說話人識別驗(yàn)證、OCR/ 手寫識別、機(jī)器學(xué)習(xí)算法等。在語音及文本識別領(lǐng)域頂級學(xué)術(shù)期刊及會議發(fā)表多篇論文,長期擔(dān)任語音領(lǐng)域頂級學(xué)術(shù)會議及期刊的專家評審,并擁有多項(xiàng)美國及PCT專利,目前是 IEEE senior member。其研究成果被轉(zhuǎn)化并應(yīng)用于微軟公司及阿里巴巴集團(tuán)的多項(xiàng)產(chǎn)品中。
  以下為鄢志杰采訪實(shí)錄:
  CSDN:請介紹一下您自己以及當(dāng)前的主要工作。
  鄢志杰:我主要在阿里云iDST負(fù)責(zé)語音技術(shù)方面的工作,為集團(tuán)和螞蟻金服各個(gè)業(yè)務(wù)部門,以及外部客戶提供各種與語音有關(guān)的服務(wù),包括語音識別、語音合成、說話人識別/驗(yàn)證、對話系統(tǒng)等。由于語音領(lǐng)域是Deep Learning的最重要的試金石之一,我們也應(yīng)用各種機(jī)器學(xué)習(xí)算法到更廣泛的領(lǐng)域,如客服問題定位等等當(dāng)中去。
  CSDN:在您的語音識別工作中采用了哪些DL模型?從這些模型在標(biāo)準(zhǔn)數(shù)據(jù)集上實(shí)現(xiàn)的精度,到實(shí)現(xiàn)在淘寶客服的實(shí)際應(yīng)用,還需要做哪些方面的工作?
  鄢志杰:語音識別領(lǐng)域是DL最重要的應(yīng)用領(lǐng)域之一,很多DL算法都首先在語音識別上得到實(shí)踐。因此,我們所采用的DL模型也較多,包括DNN、CNN、RNN(LSTM)及其各種組合。當(dāng)前語音識別研究的重心早已從學(xué)術(shù)界向工業(yè)界傾斜,因此通常所說的標(biāo)準(zhǔn)數(shù)據(jù)集一般規(guī)模較小,主要是為快速驗(yàn)證算法來使用。像客服語音識別這樣的實(shí)際應(yīng)用場景,還需要做以下幾個(gè)方面的工作:
  沉淀數(shù)據(jù),構(gòu)造feedback loop,即能夠形成數(shù)據(jù)的閉環(huán),將線上實(shí)際數(shù)據(jù)很快應(yīng)用到模型迭代更新中去;提高模型訓(xùn)練的周轉(zhuǎn)率,降低訓(xùn)練時(shí)間,通過大規(guī)模并行計(jì)算實(shí)現(xiàn)高速DL模型訓(xùn)練;構(gòu)造高水平的云端線上服務(wù),包括高效的解碼器、自動(dòng)部署、運(yùn)維等等。
  CSDN:您的工作也涉及到文本分析,如何看待DL在文本分析領(lǐng)域的進(jìn)展和前景?
  鄢志杰:DL在文本領(lǐng)域有非常令人興奮的進(jìn)展。從早前的“看圖說話”、“sequence-to-sequence翻譯、語言生成”,到最近的“看圖回答問題”等等,DL在文本上的應(yīng)用正向縱深發(fā)展,應(yīng)該說前景是很廣闊的。我們自己也在這方面有一些工作,包括客服問題聚類、分類、對話理解、語言生成等。
  CSDN:基于數(shù)據(jù)技術(shù)和ML,您認(rèn)為客服機(jī)器人技術(shù)將能夠取代多少的人工工作?時(shí)間節(jié)點(diǎn)如何?
  鄢志杰:我個(gè)人有一個(gè)理念,就是永遠(yuǎn)不去取代人工,而是讓客服機(jī)器人去學(xué)習(xí)人、幫助人。就像我們在客服中心的很多Machine Learning的工作,都是去學(xué)習(xí)客服小二是如何服務(wù)的,沒有客服小二,學(xué)習(xí)無從入手。例如,我們會將客服小二的真實(shí)IVR服務(wù)進(jìn)行語音識別,從沉淀下來的數(shù)據(jù)中去做Machine Learning,去做各種后續(xù)的工作。我認(rèn)為客服機(jī)器人的價(jià)值在于可以減少人工,讓客服中心可以隨公司業(yè)務(wù)智能的擴(kuò)展,而不是一味擴(kuò)大人的規(guī)模,使得服務(wù)質(zhì)量無法保證。
  CSDN:當(dāng)前的開源DL工具越來越多,您嘗試過哪些工具?最喜歡什么樣的工具?最終選擇的標(biāo)準(zhǔn)是什么?
  鄢志杰:我們擁抱開源。開源的、得到大家認(rèn)可而發(fā)展起來的東西肯定是好東西。在語音領(lǐng)域目前最活躍的開源工具是Kaldi,是微軟的前同事Povey從幾年前開始一步步做起來、逐漸變得流行的。我們也是通過改造Kaldi來搭建我們系統(tǒng)的某些環(huán)節(jié)的,改造的工作一方面是使之適應(yīng)工業(yè)界需求(如大規(guī)模的GPU多機(jī)多卡訓(xùn)練)、一方面是基于它的codebase來快速的做創(chuàng)新性研究。我認(rèn)為工具就是工具,不必抱有“宗教信仰”,比較合適的態(tài)度也許是更關(guān)注你要解的問題,基于問題來選擇工具。這也正是我們開發(fā)GPU多機(jī)多卡 Machine Learning Middleware的原因。這個(gè)Middleware的功能就是把各種各樣的開源DL訓(xùn)練工具通過很少的修改,就變成可以利用多機(jī)多卡的大規(guī)模并行化訓(xùn)練工具。這樣一來,我們就可以迅速消化、吸收,并改造層出不窮的新的DL開源工具。
  CSDN:DL的領(lǐng)軍人物Yann LeCun曾經(jīng)多次談到DL的挑戰(zhàn),如推理機(jī)制、無監(jiān)督學(xué)習(xí)等等,您如何看待DL的挑戰(zhàn)?
  鄢志杰:DL近年來發(fā)展得太快了,也太熱了。有一些brute-force的研究方法太過成功,容易給人造成誤導(dǎo)。傳統(tǒng)的機(jī)器學(xué)習(xí)講究對問題的分析、對數(shù)據(jù)本身的理解、“Occam‘s razor”是研究者樂于奉行的原則。我們看到近年來在DL領(lǐng)域,不管三七二十一加數(shù)據(jù)、加運(yùn)算能力、增加模型規(guī)模的brute-force方法從某種意義上講是相當(dāng)成功的。DL在Feature Engineering上的成功也帶來了似乎不需要再關(guān)注問題本身、不需要任何Domain Knowledge,只需要把Raw Feature扔進(jìn)Deep Model訓(xùn)練一下就能打敗歷史上所有模型的假象。我個(gè)人認(rèn)為這恰恰只是說明了我們很多人對DL的理解還比較膚淺。多年后回過頭來看,也許會發(fā)現(xiàn),現(xiàn)在的我們只不過是正處在DL野蠻發(fā)展的初級階段而已。
  在我所在的語音領(lǐng)域,現(xiàn)在要找一個(gè)篇非DL的論文已經(jīng)很難了。今年開InterSpeech國際會議的時(shí)候,聲學(xué)所一名同學(xué)做Oral Presentation,一上臺就說今天我全篇沒有DL,沒想到贏得臺下一片掌聲。我覺得DL目前的挑戰(zhàn)之一就是需要重新去嚴(yán)肅的思考我們要解的問題、了解我們的模型、分析我們的數(shù)據(jù),而不是一味的強(qiáng)調(diào)“大數(shù)據(jù)”、“大模型”、“大計(jì)算”。
  CSDN:您對目前的DL硬件系統(tǒng)的滿意度如何?對于DL的硬件平臺的發(fā)展,您有什么期待?
  鄢志杰:很樂于看到Intel找到了一個(gè)不同以往的對手NVIDIA,此外也看到DL在其它一些硬件(如FPGA等)上的發(fā)展。因?yàn)镈L的推動(dòng),硬件在這方面的運(yùn)算能力、通訊能力近年來都得到了很大的進(jìn)步,期待硬件廠商給我們更強(qiáng)大的支撐。
  CSDN:請談?wù)勀谶@次大會上即將分享的話題。
  鄢志杰:我會介紹數(shù)據(jù)技術(shù)、Machine Learning在阿里巴巴集團(tuán)和螞蟻金服客服系統(tǒng)中的好幾個(gè)很接地氣的應(yīng)用。我們通過自動(dòng)語音識別將IVR系統(tǒng)的客服對話數(shù)據(jù)全部轉(zhuǎn)換成文本,這些文本可以用于客服質(zhì)檢、用于提升客服小二對問題解答的一致性,還可以讓機(jī)器學(xué)習(xí)客服人員是如何一步步定位用戶的問題,并做出解答的??头緛硎且粋€(gè)非常傳統(tǒng)的領(lǐng)域,對客服系統(tǒng)刻板的印象就是人海戰(zhàn)術(shù)、手寫規(guī)則等等。但由于機(jī)器學(xué)習(xí)的加入,這個(gè)領(lǐng)域正發(fā)生奇妙的變化。新一代的客服背后站著的是數(shù)據(jù)科學(xué)家,現(xiàn)在講的都是Data-driven、Deep Learning等等。這些嘗試應(yīng)該說只是一個(gè)開始,是我們后續(xù)通向機(jī)器人客服的必由之路。
  CSDN:哪些聽眾最應(yīng)該了解您所分享的主題?這些話題可以幫助聽眾解決哪些問題?
  鄢志杰:一些對語音識別、文本分析、自然語言處理等DL話題感興趣的聽眾應(yīng)該會想來聽聽。我希望給大家一些全新的角度——原來DL還可以幫助客服這樣的傳統(tǒng)領(lǐng)域。
  CSDN:您最希望在BDTC上聽到什么樣的分享話題?
  鄢志杰:最新的來自Machine Learning Community的聲音,以及DL的一些落地。
?

非常好我支持^.^

(0) 0%

不好我反對

(0) 0%

      發(fā)表評論

      用戶評論
      評價(jià):好評中評差評

      發(fā)表評論,獲取積分! 請遵守相關(guān)規(guī)定!

      ?