1. 自從來到阿里做自然語言理解的工程師,睡眠時(shí)間還能保證嗎?
在阿里挺多年了,已經(jīng)習(xí)慣了這種工作節(jié)奏,一般我們在項(xiàng)目關(guān)鍵節(jié)點(diǎn)的時(shí)候會比較忙,別的時(shí)候其實(shí)還好的,所以正常情況下每天的睡眠時(shí)間還是有保證的。
2. 每天睜開眼后,最大的壓力是什么?
現(xiàn)在線上每天有非常多的用戶在使用我們的nlp服務(wù),第一在阿里的技術(shù)體系里,服務(wù)的可用性是底線,所以一部分壓力來自擔(dān)心我們服務(wù)會不會出故障,第二用戶對自然語言理解的要求是比較高的,我們每天都會收到用戶的反饋,然后我們讓機(jī)器去優(yōu)化語言理解的能力。
3. 作為一個(gè)阿里人工智能實(shí)驗(yàn)室的高級算法專家,您每天的工作日程,包括休息日,您會做些什么呢?
我們每天早上會開一個(gè)晨會,匯總下過去24小時(shí)收集到的用戶反饋,然后討論下解決的方案,接下來就會安排相應(yīng)同學(xué)去解決這些問題。同時(shí)我們自然語言理解模型的優(yōu)化也是一個(gè)持續(xù)的過程,這里面涉及到我們對深度學(xué)習(xí)網(wǎng)絡(luò)結(jié)構(gòu)的調(diào)整還有訓(xùn)練方法的優(yōu)化,所以我們每天會有一定的時(shí)間去跟蹤最新的技術(shù)動態(tài)和論文,同時(shí)我們也會按照制定的研發(fā)計(jì)劃做實(shí)驗(yàn),逐步推進(jìn)技術(shù)的進(jìn)步。
4. 您喜歡阿里實(shí)驗(yàn)室里面的工作氛圍嗎?跟您一起在實(shí)驗(yàn)室工作的有多少人呢?都有哪些方向?
目前人工智能實(shí)驗(yàn)室研究的方向包括了自然語言理解、知識圖譜、語音識別、聲音信號處理、計(jì)算機(jī)視覺、機(jī)器人控制、硬件研發(fā)、云端技術(shù)研發(fā)。同時(shí)我們還有市場部和產(chǎn)品部門的同學(xué),來自各種背景的同學(xué)聚集在一起,有很多可以彼此分享的內(nèi)容,對大家的知識和閱歷都是一個(gè)很好的擴(kuò)展。
5. 有人說,自然語言理解是AI領(lǐng)域排名第一的難題和挑戰(zhàn),您認(rèn)同嗎?
確實(shí)自然語言理解是目前非常難的問題,相比語音和圖像的感知智能,語言是認(rèn)知智能,人類的知識乃至我們的文明都是通過文字來記載的,所以如果機(jī)器可以實(shí)現(xiàn)完善的自然語言理解,那么這個(gè)和科幻片中的人工智能就很接近了。
所以我認(rèn)為自然語言理解也是可以分層來看的,目前我們在天貓精靈里做的大量的任務(wù)型的理解,是第一個(gè)層次的理解能力,我們認(rèn)為基于目前的技術(shù),這部分已經(jīng)可以做得比較好了,換句話說,接下來大量的任務(wù)可以通過語言來指揮機(jī)器去完成。再往深入一點(diǎn),就是信息獲取和問答的能力,這涉及到對人類知識的大規(guī)模建模,以及對用戶問題的深度理解,所以還是目前非常有挑戰(zhàn)的問題。第三個(gè)層面,就是讓機(jī)器和人進(jìn)行自然的交流,機(jī)器能有情商,可以感知到用戶的情緒,機(jī)器也能有一定的性格,目前來看,這是非常困難的工作,目前有挺多類似的demo,但是往往做出來都給人一種智障的感覺。
所以總結(jié)來講,對機(jī)器自然語言理解能力的提升,還有非常漫長的路要走,甚至需要基礎(chǔ)科學(xué)的突破。
6. 在自然語言理解這個(gè)領(lǐng)域,您最欣賞和佩服的人是誰?
在這里領(lǐng)域我最佩服和欣賞的是深度學(xué)習(xí)四大天王之一的Prof. Yoshua Bengio。Bengio教授帶領(lǐng)的團(tuán)隊(duì)在自然語言理解領(lǐng)域的深度網(wǎng)絡(luò)上做了很多大膽的創(chuàng)新,也取得了很不錯(cuò)的成果,始終走在自然語言理解探索的最前沿。
7. 在天貓精靈這款產(chǎn)品的開發(fā)中,您在里面具體會承擔(dān)哪些方面的工作呢?
我及我的團(tuán)隊(duì)主要負(fù)責(zé)天貓精靈的自然語言理解技術(shù),在這里我主要承擔(dān)三部分的工作,第一個(gè)是模型的設(shè)計(jì)及優(yōu)化,選擇合適的算法方案來實(shí)現(xiàn)最優(yōu)的效果,第二個(gè)是設(shè)計(jì)這套自然語言理解系統(tǒng),從無到有,經(jīng)歷了多代的演進(jìn),我們搭建了這套我們認(rèn)為是比較適合目前的語音交互的自然語言理解系統(tǒng),第三個(gè)是解決問題,當(dāng)遇到具體的問題時(shí),我需要去分析這個(gè)問題在哪個(gè)模塊去解決是最合適的。同時(shí)我也會跟進(jìn)團(tuán)隊(duì)同學(xué)的工作,并且review code。
8. 您來實(shí)驗(yàn)室之前,以及工作了這么久之后,對自然語言理解用于解決實(shí)際問題上,會不會有一些不同的新的認(rèn)知和感悟?
我是人工智能實(shí)驗(yàn)室創(chuàng)始團(tuán)隊(duì)成員,之前一直在阿里集團(tuán)大數(shù)據(jù)部門從事圖像識別、推薦系統(tǒng)等算法工作。
在人工智能實(shí)驗(yàn)室一直從事自然語言理解領(lǐng)域的工作,在解決實(shí)際問題的時(shí)候,可以分享下最大的感悟吧,就是細(xì)節(jié)是魔鬼,整個(gè)算法系統(tǒng)涉及到大量的算法子模塊,我們在進(jìn)行效果優(yōu)化的過程中,發(fā)現(xiàn)一些容易被我們忽略的細(xì)節(jié),如果進(jìn)行了優(yōu)化,會對整體效果帶來明顯的提升,感悟就是要嚴(yán)謹(jǐn)?shù)姆治鰡栴}然后要去懷疑細(xì)節(jié)。
9. 在您解決實(shí)際問題中,會綜合用到其他哪些技能呢?比如,知識圖譜?
在解決實(shí)際問題的時(shí)候,我們會去嘗試各種文本的技術(shù),當(dāng)然知識圖譜對我們的自然語言理解是非常重要的。知識圖譜可以給我們很多先驗(yàn)知識,它包含了對這個(gè)世界的認(rèn)知信息,是我們進(jìn)行意圖判斷很重要的參考。
10. 對于對自然語言處理非常感興趣的,正在努力學(xué)習(xí),希望未來從事這個(gè)領(lǐng)域相關(guān)工作的同學(xué),從您自身出發(fā),有沒有想要分享的一些心得感悟?
自然語言理解需要兩方面的能力,機(jī)器學(xué)習(xí)的能力,當(dāng)然也包括目前炙手可熱的深度學(xué)習(xí)方法,和對語言本身特點(diǎn)的理解,所以我覺得這兩部分的內(nèi)容的學(xué)習(xí)和實(shí)踐都很重要。
11.如果讓您給未來會從事自然語言理解實(shí)戰(zhàn)相關(guān)工作的同學(xué)提三個(gè)中肯的建議,您覺得是什么?
第一個(gè),對機(jī)器學(xué)習(xí)和深度學(xué)習(xí)方法能有很扎實(shí)的掌握,更深入一點(diǎn),比如凸優(yōu)化等數(shù)學(xué)理論能有所掌握。
第二個(gè),語音本身是很有魅力的,是一種人類創(chuàng)造出來的符號語言,所以對語言本身的理解,是我們目前發(fā)現(xiàn)自然語言理解技術(shù)進(jìn)一步前進(jìn)很需要去思考的。
第三個(gè),其實(shí)和所有的算法工作是一樣的,就是要養(yǎng)成思辨的思維習(xí)慣(critical thinking)和獨(dú)立的思考能力(independent thinking)。
12. 目前NLP領(lǐng)域,大致會分為哪些具體的工作,一般來說,不同的工種,不同的工作年限,不同的學(xué)歷,工資待遇大致會是什么范圍?
我們這邊,大致會有三種類型的工作,一種是做算法模型的,包括深度學(xué)習(xí)模型還是傳統(tǒng)的模型,第二種是做自然語言理解系統(tǒng)的搭建的,第三種是利用自然語言理解技術(shù)去實(shí)現(xiàn)業(yè)務(wù)邏輯和產(chǎn)品功能的。目前來講這部分工程師的待遇還是相當(dāng)有競爭力的。
13. 如果想加入您的團(tuán)隊(duì),您會有哪些要求呢?
對技術(shù)的熱愛,也就是對做的技術(shù)有熱情,會用心去思考所做技術(shù)的每個(gè)細(xì)節(jié)。有扎實(shí)的技術(shù)基礎(chǔ),算法的基礎(chǔ)和代碼的基礎(chǔ)。
14. 如果重新選擇,還會選擇NLP嗎?
是的,還會選擇nlp,因?yàn)檫@部分的技術(shù)是我們走向真正的智能所需要去突破的核心技術(shù)。這是這幾年發(fā)展速度會非??斓念I(lǐng)域。
15. 從技術(shù)上,以及個(gè)人理解上,您會將NLP的發(fā)展分為幾個(gè)階段?下一個(gè)階段NLP將會是一個(gè)怎樣的趨勢?
我其實(shí)在回答第5個(gè)問題的時(shí)候已經(jīng)回答了這個(gè)問題:
我認(rèn)為自然語言理解也是可以分層來看的,目前我們在天貓精靈里做的大量的任務(wù)型的理解,是第一個(gè)層次的理解能力,我們認(rèn)為基于目前的技術(shù),這部分已經(jīng)可以做得比較好了,換句話說,接下來大量的任務(wù)可以通過語言來指揮機(jī)器去完成。再往深入一點(diǎn),就是信息獲取和問答的能力,這涉及到對人類知識的大規(guī)模建模,以及對用戶問題的深度理解,所以還是目前非常有挑戰(zhàn)的問題。第三個(gè)層面,就是讓機(jī)器和人進(jìn)行自然的連續(xù)交流,機(jī)器能有情商,可以感知到用戶的情緒,機(jī)器也能有一定的性格,目前來看,這是非常困難的工作,目前有挺多類似的demo,但是往往做出來都給人一種智障的感覺。
目前來看,第一個(gè)階段,任務(wù)型的nlp已經(jīng)可以比較好的達(dá)成了,第二個(gè)階段,知識庫的建設(shè)和知識應(yīng)用于自然語言交互,會是接下來很重要的趨勢。
16. 如果用一句話總結(jié)您所做的工作,用一句非常走心的話,別太套路,您覺得是什么?
用最前沿的技術(shù),讓人可以直接用語言與機(jī)器進(jìn)行自然交流,讓內(nèi)容和服務(wù)變得隨口既來,讓更多的人能享受到智能時(shí)代所帶來的便捷。
-
工程師
+關(guān)注
關(guān)注
59文章
1571瀏覽量
68574 -
阿里
+關(guān)注
關(guān)注
6文章
439瀏覽量
32857
發(fā)布評論請先 登錄
相關(guān)推薦
評論