0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

對(duì)話系統(tǒng)最原始的實(shí)現(xiàn)方式 檢索式對(duì)話

深度學(xué)習(xí)自然語言處理 ? 來源:深度學(xué)習(xí)自然語言處理 ? 作者:深度學(xué)習(xí)自然語言 ? 2020-09-25 17:08 ? 次閱讀

對(duì)話系統(tǒng)可以說是NLP領(lǐng)域目前已知最扎實(shí)的落地場景了,整個(gè)流程都脫離不了NLP的核心作用,而且整個(gè)流程涉及NLP的大量任務(wù),因此大量的研究都圍繞著對(duì)話系統(tǒng)來開展,也因此產(chǎn)生了很多很有意義的新方法。而檢索式對(duì)話作為對(duì)話系統(tǒng)最原始的實(shí)現(xiàn)方式,又蘊(yùn)涵著什么有意思的東西,我們來看看。

什么是對(duì)話系統(tǒng)

對(duì)話從來就不是一個(gè)簡單的任務(wù),這是一個(gè)涉及理解、生成、交互等多個(gè)方向技術(shù)的綜合實(shí)體。

理解:需要理解對(duì)方輸出的內(nèi)容,只有這樣才能給與正確的回應(yīng)。

生成:基于理解的內(nèi)容,給出合適的結(jié)果。

交互:在多輪對(duì)話上,需要記錄跟蹤整個(gè)對(duì)話過程中涉及的內(nèi)容。

要同時(shí)完成這么多任務(wù),相必是非常復(fù)雜的,同時(shí)場景上的復(fù)雜性,客服、語音助手、閑聊等,也造就了對(duì)話系統(tǒng)的復(fù)雜性,最終成為了NLP里面一個(gè)重要的研究抓手和目標(biāo)。

檢索式對(duì)話

檢索式對(duì)話按照個(gè)人理解應(yīng)該是最為經(jīng)典的解決方案,把一個(gè)對(duì)話問題抽象為一個(gè)搜索問題,大量早期的對(duì)話系統(tǒng)都是用這種解決方案來實(shí)現(xiàn)的,甚至在現(xiàn)在,一些簡單的對(duì)話任務(wù),都可以用它來簡單實(shí)現(xiàn),可以說是工業(yè)界最喜歡的一種實(shí)現(xiàn)方式了。簡單地說,整個(gè)檢索式對(duì)話的流程可以用這個(gè)流程來表示:

query理解->檢索召回->相似度排序

沒錯(cuò),看著就是搜索的流程,對(duì)句子進(jìn)行理解,理解后到數(shù)據(jù)庫里面進(jìn)行召回,召回以后再進(jìn)行相似度排序找到最佳答案。既然流程被拆解,那我們來看看每一步里面都會(huì)做什么東西。

query理解

簡單的說,其實(shí)就是去理解用戶輸入的內(nèi)容說的是啥,一般的自然語言理解主要關(guān)心的是這么幾個(gè)技術(shù)細(xì)節(jié):

意圖和話題。即用戶談?wù)摰氖悄膫€(gè)領(lǐng)域的事情,從而剖析用戶期待對(duì)話系統(tǒng)返回的是什么。這個(gè)問題常被當(dāng)成分類問題來處理,用分類規(guī)則或者是方法來進(jìn)行意圖識(shí)別。一旦抽象成分類問題大家就應(yīng)該大概理解了,就是fastext、textcnn之類的玩意了。

槽位和實(shí)體。我們需要知道用戶需要什么,需要抽取用戶的具體實(shí)體,這個(gè)經(jīng)常被抽象為序列標(biāo)注問題,此時(shí)CRF、BILSTM-CRF之類的方法就是基操了。

當(dāng)然,也有一些工程上會(huì)把它抽象化,只是轉(zhuǎn)化為向量或者矩陣,下游用矩陣進(jìn)行搜索。

總之,query理解這塊,主要是為了解析用戶說的內(nèi)容,去理解他的語義,這樣我們才能為用戶找到合適的答案。

檢索召回

召回這塊,按照搜索的操作,就是拿著我們提取的槽位和實(shí)體,甚至是我們解析的向量和矩陣,根據(jù)意圖和話題放到搜索引擎里面去檢索,搜索引擎中有倒排索引,直接拿著關(guān)鍵詞就能找到對(duì)應(yīng)的內(nèi)容。

然而,問題其實(shí)不在怎么檢索召回,而是在于召回的內(nèi)容怎么來。相比搜索引擎,對(duì)話系統(tǒng)的內(nèi)容可能更加不結(jié)構(gòu)化,同時(shí)可得性由于特定需求其實(shí)并不好得,例如淘寶的客服,每家店的商品性質(zhì)各不相同,很難需要召回的結(jié)果,有正確答案的就更難了,所以,常用的方式有這幾種:

對(duì)高頻問題進(jìn)行編輯,然后統(tǒng)一維護(hù)管理。數(shù)白了就是人編。

基于一些模板進(jìn)行組裝生成。

利用文本生成的方式進(jìn)行處理。

相似度排序

一般地,根據(jù)用戶最簡單的query,往往能召回很多可能比較好的答案,此時(shí)我們要選擇最優(yōu)的給用戶。衡量最優(yōu)的標(biāo)準(zhǔn)之一就是相似度,語義相似度就是最為經(jīng)典或者說基本的相似度衡量方式,當(dāng)然搜索領(lǐng)域的ctr(不是點(diǎn)擊率)、cqr、BM25等,這些非?;镜脑亍?/p>

對(duì)經(jīng)典的語義相似度,就要說2013年的DSSM了,這個(gè)模型可謂是開了語義相似度雙塔結(jié)構(gòu)的先河。

優(yōu)缺點(diǎn)和應(yīng)用場景

說完了具體的流程,然后再說說檢索式對(duì)話的優(yōu)點(diǎn)和應(yīng)用場景。

先談?wù)剝?yōu)點(diǎn)吧。

應(yīng)該是這么多種對(duì)話實(shí)現(xiàn)方式中對(duì)樣本依賴最低的。

實(shí)現(xiàn)成本低,初版本實(shí)現(xiàn)速度快,后續(xù)拓展

三段處理,可控性強(qiáng)。

因?yàn)檫@些優(yōu)點(diǎn),檢索式對(duì)話在工程上被廣泛應(yīng)用。

客服機(jī)器人。尤其是淘寶的場景,這里有非常專業(yè)的內(nèi)容,例如用戶會(huì)問浴缸的長寬高,會(huì)問電腦的配置等等,這些用檢索式非常方便。

問答類對(duì)話。例如小猿搜題之類的,還有一些百科類的問答,雖然不知道具體公司的操作,但是用檢索式的確會(huì)非常方便。

對(duì)話系統(tǒng)初版本。即使是很多開放域,第一版本的構(gòu)造都會(huì)嘗試檢索式對(duì)話的架構(gòu)。

當(dāng)然了,檢索式對(duì)話這套實(shí)現(xiàn)方案還是有很大的局限性,因此才會(huì)有很多項(xiàng)目嘗試做一些別的做法,先聊聊缺點(diǎn):

答案相對(duì)固定,靈活性不足,在一些閑聊場景,會(huì)非常困難。如,用戶問一句,你好,后面有很多答案都是合理的。

任務(wù)型的對(duì)話,在各種語音助手,小度、siri之類的很常見,一些引導(dǎo)用戶完成任務(wù)的工作,對(duì)話機(jī)器人是需要做一個(gè)主動(dòng)帶節(jié)奏的角色,檢索式基本辦不到。

多輪對(duì)話。在檢索式對(duì)話基礎(chǔ)上,單輪對(duì)話升級(jí)為多輪對(duì)話其實(shí)是存在明顯的天花板,成本也比較高,雖然已經(jīng)有一些相關(guān)的操作,如Multi-view、SMN之類的,但是實(shí)現(xiàn)的難度還是會(huì)有些高。

小結(jié)

小結(jié)一下,檢索式對(duì)話作為對(duì)話系統(tǒng)一個(gè)經(jīng)典的技術(shù),非常有必要學(xué)習(xí)和探究,今天大概講了一些流程和概述,也希望大家有所收獲。

責(zé)任編輯:xj

原文標(biāo)題:【對(duì)話】對(duì)話系統(tǒng)經(jīng)典:檢索式對(duì)話

文章出處:【微信公眾號(hào):深度學(xué)習(xí)自然語言處理】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • nlp
    nlp
    +關(guān)注

    關(guān)注

    1

    文章

    488

    瀏覽量

    22038
  • 對(duì)話系統(tǒng)
    +關(guān)注

    關(guān)注

    0

    文章

    7

    瀏覽量

    2182

原文標(biāo)題:【對(duì)話】對(duì)話系統(tǒng)經(jīng)典:檢索式對(duì)話

文章出處:【微信號(hào):zenRRan,微信公眾號(hào):深度學(xué)習(xí)自然語言處理】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏

    評(píng)論

    相關(guān)推薦

    天合光能參加第十輪中日企業(yè)家和前高官對(duì)話

    近日,第十輪中日企業(yè)家和前高官對(duì)話在北京舉行,天合光能股份有限公司董事長特別助理?xiàng)顣灾覒?yīng)邀出席本輪對(duì)話,同與會(huì)嘉賓廣泛交流,并就“合作應(yīng)對(duì)氣候變化的機(jī)遇與挑戰(zhàn)”議題發(fā)言。
    的頭像 發(fā)表于 12-17 11:21 ?230次閱讀

    “向新而行,BC共生”BC領(lǐng)袖對(duì)話實(shí)錄

    近日,12月3日下午3點(diǎn),“向新而行 BC共生”BC領(lǐng)袖對(duì)話正式播出。此次對(duì)話由中國綠色供應(yīng)鏈聯(lián)盟光伏專委會(huì)秘書長呂芳主持,隆基綠能科技股份有限公司(以下簡稱“隆基”)董事長鐘寶申、上海愛旭新能源
    的頭像 發(fā)表于 12-05 15:42 ?252次閱讀

    一桿有AI的路燈:感知環(huán)境監(jiān)測路況還能“對(duì)話”無人駕駛AI燈桿屏

    一桿有AI的路燈:感知環(huán)境監(jiān)測路況還能“對(duì)話”無人駕駛AI燈桿屏
    的頭像 發(fā)表于 11-15 09:45 ?339次閱讀
    一桿有AI的路燈:感知環(huán)境監(jiān)測路況還能“<b class='flag-5'>對(duì)話</b>”無人駕駛AI燈桿屏

    AI對(duì)話魔法 Prompt Engineering 探索指南

    Engineering 就是設(shè)計(jì)和優(yōu)化與AI對(duì)話的“提示詞”或“指令”,讓AI能準(zhǔn)確理解并提供有用的回應(yīng)。 Prompt Engineering 主要包括以下幾個(gè)方面: 1.明確目標(biāo):希望AI完成什么任務(wù)。例如:寫一篇文章,回答一個(gè)問題,進(jìn)行一次對(duì)話? 2.設(shè)計(jì)提示詞:
    的頭像 發(fā)表于 11-07 10:11 ?807次閱讀
    AI<b class='flag-5'>對(duì)話</b>魔法 Prompt Engineering 探索指南

    ChatGPT:為未來的個(gè)人和企業(yè)提供革命性的對(duì)話解決方案

    和準(zhǔn)確性。6.增強(qiáng)用戶體驗(yàn):ChatGPT可以為個(gè)人和企業(yè)提供更好的用戶體驗(yàn),通過交互對(duì)話提供個(gè)性化的建議、指導(dǎo)和支持。7.自動(dòng)化客服:ChatGPT可以被用于自動(dòng)化客服系統(tǒng),為用戶提供即時(shí)響應(yīng)
    的頭像 發(fā)表于 11-01 11:12 ?166次閱讀
    ChatGPT:為未來的個(gè)人和企業(yè)提供革命性的<b class='flag-5'>對(duì)話</b>解決方案

    商湯日日新·商量-擬人大模型帶你對(duì)話未來,感受真實(shí)

    對(duì)此,專注于“擬人對(duì)話”領(lǐng)域的商量-擬人大模型(SenseChat-Character)應(yīng)運(yùn)而生,通過實(shí)現(xiàn)精準(zhǔn)人設(shè)展現(xiàn)以及具有沉浸感的交互,讓智能體更像栩栩如生的人。
    的頭像 發(fā)表于 09-18 15:57 ?560次閱讀

    軟件系統(tǒng)的數(shù)據(jù)檢索設(shè)計(jì)

    軟件系統(tǒng)的數(shù)據(jù)檢索設(shè)計(jì) 隨著業(yè)務(wù)量加大,數(shù)據(jù)檢索量也會(huì)日益增多,為了減輕數(shù)據(jù)庫壓力,本系統(tǒng)采用ElasticSearch來實(shí)現(xiàn)數(shù)據(jù)
    的頭像 發(fā)表于 08-22 14:08 ?265次閱讀
    軟件<b class='flag-5'>系統(tǒng)</b>的數(shù)據(jù)<b class='flag-5'>檢索</b>設(shè)計(jì)

    定時(shí)關(guān)閉對(duì)話

    發(fā)一個(gè)項(xiàng)目上用的定時(shí)對(duì)話
    發(fā)表于 06-07 10:07

    中美首次人工智能政府間對(duì)話在瑞士日內(nèi)瓦召開

    據(jù)外交部美大司官方微博“寬廣太平洋”發(fā)布,中國與美國之間的人工智能政府間對(duì)話首次會(huì)議于2024年5月14日在瑞士日內(nèi)瓦召開。
    的頭像 發(fā)表于 05-15 09:20 ?371次閱讀

    潤和軟件與新財(cái)富聯(lián)合發(fā)布金融AI對(duì)話搜索引擎“金融搜一搜”產(chǎn)品

    3月29日,新財(cái)富投顧嘉年華活動(dòng)中,江蘇潤和軟件股份有限公司(以下簡稱“潤和軟件”)與深圳市新財(cái)富數(shù)字科技有限責(zé)任公司(以下簡稱“新財(cái)富”)聯(lián)合發(fā)布了金融AI對(duì)話搜索引擎——“金融搜一搜”產(chǎn)品,助力金融投資場景智能化升級(jí)。
    的頭像 發(fā)表于 04-02 10:15 ?498次閱讀
    潤和軟件與新財(cái)富聯(lián)合發(fā)布金融AI<b class='flag-5'>對(duì)話</b><b class='flag-5'>式</b>搜索引擎“金融搜一搜”產(chǎn)品

    百度地圖AI向?qū)в脩羝苾|,日均提供超千萬次對(duì)話

    百度地圖AI向?qū)в脩羝苾|,日均提供超千萬次對(duì)話
    的頭像 發(fā)表于 03-21 09:44 ?410次閱讀
    百度地圖AI向?qū)в脩羝苾|,日均提供超千萬次<b class='flag-5'>對(duì)話</b>

    育碧發(fā)布全新生成AI原型:NPC以自發(fā)行為展開對(duì)話

    近日,育碧巴黎工作室推出了一款名為 NEON NPC 的全新 AI 原型項(xiàng)目。借助 NVIDIA 的 Audio2Face 及 InWorld 的 LLM 大語言模型技術(shù),NPC可以根據(jù)角色設(shè)定自發(fā)生成對(duì)話。
    的頭像 發(fā)表于 03-20 10:17 ?463次閱讀

    用于對(duì)話AI的高性能MEMS麥克風(fēng),助力改進(jìn)用戶體驗(yàn)

    對(duì)話人工智能(AI)是一個(gè)快速發(fā)展的機(jī)器學(xué)習(xí)(ML)領(lǐng)域,旨在使人機(jī)交互更加自然直觀。
    的頭像 發(fā)表于 03-12 09:44 ?850次閱讀
    用于<b class='flag-5'>對(duì)話</b><b class='flag-5'>式</b>AI的高性能MEMS麥克風(fēng),助力改進(jìn)用戶體驗(yàn)

    鴻蒙開發(fā)實(shí)戰(zhàn)-手寫文心一言AI對(duì)話APP

    本文我們學(xué)習(xí)使用了基本組件的使用,網(wǎng)絡(luò)請(qǐng)求以及狀態(tài)管理,使用了ForEach循環(huán)渲染來構(gòu)建對(duì)話界面。并且在HarmonyOS設(shè)備上成功運(yùn)行
    的頭像 發(fā)表于 01-24 18:02 ?1091次閱讀
    鴻蒙開發(fā)實(shí)戰(zhàn)-手寫文心一言AI<b class='flag-5'>對(duì)話</b>APP

    西門子博途中啟用類型版本對(duì)話

    對(duì)話框中,版本號(hào)在最后一個(gè)位置自動(dòng)遞增。這樣可以識(shí)別字段中的更改。
    的頭像 發(fā)表于 01-18 10:49 ?809次閱讀
    西門子博途中啟用類型版本<b class='flag-5'>對(duì)話</b>框