0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

在阿里做自然語言理解工程師是一種什么樣的體驗(yàn)

工程師人生 ? 來源:工程師吳畏 ? 2019-03-20 14:43 ? 次閱讀

1. 自從來到阿里做自然語言理解的工程師,睡眠時(shí)間還能保證嗎?

在阿里挺多年了,已經(jīng)習(xí)慣了這種工作節(jié)奏,一般我們在項(xiàng)目關(guān)鍵節(jié)點(diǎn)的時(shí)候會比較忙,別的時(shí)候其實(shí)還好的,所以正常情況下每天的睡眠時(shí)間還是有保證的。

2. 每天睜開眼后,最大的壓力是什么?

現(xiàn)在線上每天有非常多的用戶在使用我們的nlp服務(wù),第一在阿里的技術(shù)體系里,服務(wù)的可用性是底線,所以一部分壓力來自擔(dān)心我們服務(wù)會不會出故障,第二用戶對自然語言理解的要求是比較高的,我們每天都會收到用戶的反饋,然后我們讓機(jī)器去優(yōu)化語言理解的能力。

3. 作為一個(gè)阿里人工智能實(shí)驗(yàn)室的高級算法專家,您每天的工作日程,包括休息日,您會做些什么呢?

我們每天早上會開一個(gè)晨會,匯總下過去24小時(shí)收集到的用戶反饋,然后討論下解決的方案,接下來就會安排相應(yīng)同學(xué)去解決這些問題。同時(shí)我們自然語言理解模型的優(yōu)化也是一個(gè)持續(xù)的過程,這里面涉及到我們對深度學(xué)習(xí)網(wǎng)絡(luò)結(jié)構(gòu)的調(diào)整還有訓(xùn)練方法的優(yōu)化,所以我們每天會有一定的時(shí)間去跟蹤最新的技術(shù)動態(tài)和論文,同時(shí)我們也會按照制定的研發(fā)計(jì)劃做實(shí)驗(yàn),逐步推進(jìn)技術(shù)的進(jìn)步。

4. 您喜歡阿里實(shí)驗(yàn)室里面的工作氛圍嗎?跟您一起在實(shí)驗(yàn)室工作的有多少人呢?都有哪些方向?

目前人工智能實(shí)驗(yàn)室研究的方向包括了自然語言理解、知識圖譜、語音識別、聲音信號處理、計(jì)算機(jī)視覺、機(jī)器人控制、硬件研發(fā)、云端技術(shù)研發(fā)。同時(shí)我們還有市場部和產(chǎn)品部門的同學(xué),來自各種背景的同學(xué)聚集在一起,有很多可以彼此分享的內(nèi)容,對大家的知識和閱歷都是一個(gè)很好的擴(kuò)展。

5. 有人說,自然語言理解是AI領(lǐng)域排名第一的難題和挑戰(zhàn),您認(rèn)同嗎?

確實(shí)自然語言理解是目前非常難的問題,相比語音和圖像的感知智能,語言是認(rèn)知智能,人類的知識乃至我們的文明都是通過文字來記載的,所以如果機(jī)器可以實(shí)現(xiàn)完善的自然語言理解,那么這個(gè)和科幻片中的人工智能就很接近了。

所以我認(rèn)為自然語言理解也是可以分層來看的,目前我們在天貓精靈里做的大量的任務(wù)型的理解,是第一個(gè)層次的理解能力,我們認(rèn)為基于目前的技術(shù),這部分已經(jīng)可以做得比較好了,換句話說,接下來大量的任務(wù)可以通過語言來指揮機(jī)器去完成。再往深入一點(diǎn),就是信息獲取和問答的能力,這涉及到對人類知識的大規(guī)模建模,以及對用戶問題的深度理解,所以還是目前非常有挑戰(zhàn)的問題。第三個(gè)層面,就是讓機(jī)器和人進(jìn)行自然的交流,機(jī)器能有情商,可以感知到用戶的情緒,機(jī)器也能有一定的性格,目前來看,這是非常困難的工作,目前有挺多類似的demo,但是往往做出來都給人一種智障的感覺。

所以總結(jié)來講,對機(jī)器自然語言理解能力的提升,還有非常漫長的路要走,甚至需要基礎(chǔ)科學(xué)的突破。

6. 在自然語言理解這個(gè)領(lǐng)域,您最欣賞和佩服的人是誰?

在這里領(lǐng)域我最佩服和欣賞的是深度學(xué)習(xí)四大天王之一的Prof. Yoshua Bengio。Bengio教授帶領(lǐng)的團(tuán)隊(duì)在自然語言理解領(lǐng)域的深度網(wǎng)絡(luò)上做了很多大膽的創(chuàng)新,也取得了很不錯(cuò)的成果,始終走在自然語言理解探索的最前沿。

7. 在天貓精靈這款產(chǎn)品的開發(fā)中,您在里面具體會承擔(dān)哪些方面的工作呢?

我及我的團(tuán)隊(duì)主要負(fù)責(zé)天貓精靈的自然語言理解技術(shù),在這里我主要承擔(dān)三部分的工作,第一個(gè)是模型的設(shè)計(jì)及優(yōu)化,選擇合適的算法方案來實(shí)現(xiàn)最優(yōu)的效果,第二個(gè)是設(shè)計(jì)這套自然語言理解系統(tǒng),從無到有,經(jīng)歷了多代的演進(jìn),我們搭建了這套我們認(rèn)為是比較適合目前的語音交互的自然語言理解系統(tǒng),第三個(gè)是解決問題,當(dāng)遇到具體的問題時(shí),我需要去分析這個(gè)問題在哪個(gè)模塊去解決是最合適的。同時(shí)我也會跟進(jìn)團(tuán)隊(duì)同學(xué)的工作,并且review code。

8. 您來實(shí)驗(yàn)室之前,以及工作了這么久之后,對自然語言理解用于解決實(shí)際問題上,會不會有一些不同的新的認(rèn)知和感悟?

我是人工智能實(shí)驗(yàn)室創(chuàng)始團(tuán)隊(duì)成員,之前一直在阿里集團(tuán)大數(shù)據(jù)部門從事圖像識別、推薦系統(tǒng)等算法工作。

在人工智能實(shí)驗(yàn)室一直從事自然語言理解領(lǐng)域的工作,在解決實(shí)際問題的時(shí)候,可以分享下最大的感悟吧,就是細(xì)節(jié)是魔鬼,整個(gè)算法系統(tǒng)涉及到大量的算法子模塊,我們在進(jìn)行效果優(yōu)化的過程中,發(fā)現(xiàn)一些容易被我們忽略的細(xì)節(jié),如果進(jìn)行了優(yōu)化,會對整體效果帶來明顯的提升,感悟就是要嚴(yán)謹(jǐn)?shù)姆治鰡栴}然后要去懷疑細(xì)節(jié)。

9. 在您解決實(shí)際問題中,會綜合用到其他哪些技能呢?比如,知識圖譜?

在解決實(shí)際問題的時(shí)候,我們會去嘗試各種文本的技術(shù),當(dāng)然知識圖譜對我們的自然語言理解是非常重要的。知識圖譜可以給我們很多先驗(yàn)知識,它包含了對這個(gè)世界的認(rèn)知信息,是我們進(jìn)行意圖判斷很重要的參考。

10. 對于對自然語言處理非常感興趣的,正在努力學(xué)習(xí),希望未來從事這個(gè)領(lǐng)域相關(guān)工作的同學(xué),從您自身出發(fā),有沒有想要分享的一些心得感悟?

自然語言理解需要兩方面的能力,機(jī)器學(xué)習(xí)的能力,當(dāng)然也包括目前炙手可熱的深度學(xué)習(xí)方法,和對語言本身特點(diǎn)的理解,所以我覺得這兩部分的內(nèi)容的學(xué)習(xí)和實(shí)踐都很重要。

11.如果讓您給未來會從事自然語言理解實(shí)戰(zhàn)相關(guān)工作的同學(xué)提三個(gè)中肯的建議,您覺得是什么?

第一個(gè),對機(jī)器學(xué)習(xí)和深度學(xué)習(xí)方法能有很扎實(shí)的掌握,更深入一點(diǎn),比如凸優(yōu)化等數(shù)學(xué)理論能有所掌握。

第二個(gè),語音本身是很有魅力的,是一種人類創(chuàng)造出來的符號語言,所以對語言本身的理解,是我們目前發(fā)現(xiàn)自然語言理解技術(shù)進(jìn)一步前進(jìn)很需要去思考的。

第三個(gè),其實(shí)和所有的算法工作是一樣的,就是要養(yǎng)成思辨的思維習(xí)慣(critical thinking)和獨(dú)立的思考能力(independent thinking)。

12. 目前NLP領(lǐng)域,大致會分為哪些具體的工作,一般來說,不同的工種,不同的工作年限,不同的學(xué)歷,工資待遇大致會是什么范圍?

我們這邊,大致會有三種類型的工作,一種是做算法模型的,包括深度學(xué)習(xí)模型還是傳統(tǒng)的模型,第二種是做自然語言理解系統(tǒng)的搭建的,第三種是利用自然語言理解技術(shù)去實(shí)現(xiàn)業(yè)務(wù)邏輯和產(chǎn)品功能的。目前來講這部分工程師的待遇還是相當(dāng)有競爭力的。

13. 如果想加入您的團(tuán)隊(duì),您會有哪些要求呢?

對技術(shù)的熱愛,也就是對做的技術(shù)有熱情,會用心去思考所做技術(shù)的每個(gè)細(xì)節(jié)。有扎實(shí)的技術(shù)基礎(chǔ),算法的基礎(chǔ)和代碼的基礎(chǔ)。

14. 如果重新選擇,還會選擇NLP嗎?

是的,還會選擇nlp,因?yàn)檫@部分的技術(shù)是我們走向真正的智能所需要去突破的核心技術(shù)。這是這幾年發(fā)展速度會非??斓念I(lǐng)域。

15. 從技術(shù)上,以及個(gè)人理解上,您會將NLP的發(fā)展分為幾個(gè)階段?下一個(gè)階段NLP將會是一個(gè)怎樣的趨勢?

我其實(shí)在回答第5個(gè)問題的時(shí)候已經(jīng)回答了這個(gè)問題:

我認(rèn)為自然語言理解也是可以分層來看的,目前我們在天貓精靈里做的大量的任務(wù)型的理解,是第一個(gè)層次的理解能力,我們認(rèn)為基于目前的技術(shù),這部分已經(jīng)可以做得比較好了,換句話說,接下來大量的任務(wù)可以通過語言來指揮機(jī)器去完成。再往深入一點(diǎn),就是信息獲取和問答的能力,這涉及到對人類知識的大規(guī)模建模,以及對用戶問題的深度理解,所以還是目前非常有挑戰(zhàn)的問題。第三個(gè)層面,就是讓機(jī)器和人進(jìn)行自然的連續(xù)交流,機(jī)器能有情商,可以感知到用戶的情緒,機(jī)器也能有一定的性格,目前來看,這是非常困難的工作,目前有挺多類似的demo,但是往往做出來都給人一種智障的感覺。

目前來看,第一個(gè)階段,任務(wù)型的nlp已經(jīng)可以比較好的達(dá)成了,第二個(gè)階段,知識庫的建設(shè)和知識應(yīng)用于自然語言交互,會是接下來很重要的趨勢。

16. 如果用一句話總結(jié)您所做的工作,用一句非常走心的話,別太套路,您覺得是什么?

用最前沿的技術(shù),讓人可以直接用語言與機(jī)器進(jìn)行自然交流,讓內(nèi)容和服務(wù)變得隨口既來,讓更多的人能享受到智能時(shí)代所帶來的便捷。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報(bào)投訴
  • 工程師
    +關(guān)注

    關(guān)注

    59

    文章

    1571

    瀏覽量

    68574
  • 阿里
    +關(guān)注

    關(guān)注

    6

    文章

    439

    瀏覽量

    32857
收藏 人收藏

    評論

    相關(guān)推薦

    自然語言處理與機(jī)器學(xué)習(xí)的關(guān)系 自然語言處理的基本概念及步驟

    Learning,簡稱ML)是人工智能的個(gè)核心領(lǐng)域,它使計(jì)算機(jī)能夠從數(shù)據(jù)中學(xué)習(xí)并做出預(yù)測或決策。自然語言處理與機(jī)器學(xué)習(xí)之間有著密切的關(guān)系,因?yàn)闄C(jī)器學(xué)習(xí)提供了一種強(qiáng)大的工具,用于從大量文本數(shù)據(jù)中提取模式和知識,從而提高NLP系
    的頭像 發(fā)表于 12-05 15:21 ?586次閱讀

    ASR與自然語言處理的結(jié)合

    ASR(Automatic Speech Recognition,自動語音識別)與自然語言處理(NLP)是人工智能領(lǐng)域的兩個(gè)重要分支,它們許多應(yīng)用中緊密結(jié)合,共同構(gòu)成了自然語言理解
    的頭像 發(fā)表于 11-18 15:19 ?470次閱讀

    卷積神經(jīng)網(wǎng)絡(luò)自然語言處理中的應(yīng)用

    自然語言處理是人工智能領(lǐng)域的個(gè)重要分支,它致力于使計(jì)算機(jī)能夠理解、解釋和生成人類語言。隨著深度學(xué)習(xí)技術(shù)的發(fā)展,卷積神經(jīng)網(wǎng)絡(luò)(CNNs)作為一種
    的頭像 發(fā)表于 11-15 14:58 ?311次閱讀

    圖像識別技術(shù)包括自然語言處理嗎

    圖像識別技術(shù)與自然語言處理是人工智能領(lǐng)域的兩個(gè)重要分支,它們很多方面有著密切的聯(lián)系,但也存在些區(qū)別。 、圖像識別技術(shù)與自然語言處理的關(guān)
    的頭像 發(fā)表于 07-16 10:54 ?889次閱讀

    Transformer架構(gòu)自然語言處理中的應(yīng)用

    隨著人工智能技術(shù)的飛速發(fā)展,自然語言處理(NLP)領(lǐng)域取得了顯著的進(jìn)步。其中,Transformer架構(gòu)的提出,為NLP領(lǐng)域帶來了革命性的變革。本文將深入探討Transformer架構(gòu)的核心思想、組成部分以及自然語言處理領(lǐng)域的
    的頭像 發(fā)表于 07-09 11:42 ?886次閱讀

    nlp自然語言處理的應(yīng)用有哪些

    自然語言處理(Natural Language Processing,簡稱NLP)是人工智能領(lǐng)域的個(gè)分支,它致力于使計(jì)算機(jī)能夠理解和生成自然語言。隨著技術(shù)的發(fā)展,NLP已經(jīng)
    的頭像 發(fā)表于 07-05 09:55 ?2719次閱讀

    自然語言處理技術(shù)有哪些

    自然語言處理(Natural Language Processing,簡稱NLP)是人工智能領(lǐng)域的個(gè)分支,它致力于使計(jì)算機(jī)能夠理解、解釋和生成人類語言
    的頭像 發(fā)表于 07-03 14:30 ?1253次閱讀

    自然語言處理模式的優(yōu)點(diǎn)

    自然語言處理(Natural Language Processing,簡稱NLP)是人工智能領(lǐng)域的個(gè)重要分支,它致力于使計(jì)算機(jī)能夠理解、生成和處理人類語言。隨著技術(shù)的發(fā)展,
    的頭像 發(fā)表于 07-03 14:24 ?827次閱讀

    自然語言處理是什么技術(shù)的一種應(yīng)用

    自然語言處理(Natural Language Processing,簡稱NLP)是人工智能和語言學(xué)領(lǐng)域的個(gè)分支,它涉及到使用計(jì)算機(jī)技術(shù)來處理、分析和生成自然語言文本。
    的頭像 發(fā)表于 07-03 14:18 ?1052次閱讀

    自然語言處理包括哪些內(nèi)容

    自然語言處理(Natural Language Processing,簡稱NLP)是人工智能領(lǐng)域的個(gè)重要分支,它涉及到計(jì)算機(jī)與人類語言之間的交互。NLP的目標(biāo)是讓計(jì)算機(jī)能夠理解、生成
    的頭像 發(fā)表于 07-03 14:15 ?1063次閱讀

    自然語言列舉法描述法各自的特點(diǎn)

    自然語言文本。自然語言處理中,列舉法和描述法是兩常見的方法。 列舉法 列舉法是一種基于規(guī)則的方法,它通過列舉所有可能的情況來解決問題。
    的頭像 發(fā)表于 07-03 14:13 ?1122次閱讀

    什么是自然語言處理 (NLP)

    自然語言處理(Natural Language Processing, NLP)是人工智能領(lǐng)域中的個(gè)重要分支,它專注于構(gòu)建能夠理解和生成人類語言的計(jì)算機(jī)系統(tǒng)。NLP的目標(biāo)是使計(jì)算機(jī)能
    的頭像 發(fā)表于 07-02 18:16 ?1266次閱讀

    自然語言處理技術(shù)的原理的應(yīng)用

    自然語言處理(Natural Language Processing, NLP)作為人工智能(AI)領(lǐng)域的個(gè)重要分支,旨在使計(jì)算機(jī)能夠理解和處理人類自然語言。隨著互聯(lián)網(wǎng)的普及和大數(shù)據(jù)
    的頭像 發(fā)表于 07-02 12:50 ?591次閱讀

    神經(jīng)網(wǎng)絡(luò)自然語言處理中的應(yīng)用

    自然語言處理(NLP)是人工智能領(lǐng)域中的個(gè)重要分支,它研究的是如何使計(jì)算機(jī)能夠理解和生成人類自然語言。隨著人工智能技術(shù)的飛速發(fā)展,神經(jīng)網(wǎng)絡(luò)
    的頭像 發(fā)表于 07-01 14:09 ?550次閱讀

    一種基于自然語言的軌跡修正方法

    本研究提出了ExTraCT框架,利用自然語言進(jìn)行軌跡校正。該框架結(jié)合了大型語言模型(LLMs)用于自然語言理解和軌跡變形函數(shù)。ExTraCT能夠根據(jù)場景在線生成軌跡修改特征及其
    的頭像 發(fā)表于 01-19 10:45 ?470次閱讀
    <b class='flag-5'>一種</b>基于<b class='flag-5'>自然語言</b>的軌跡修正方法