(文章來源:十輪網(wǎng))
為了滿足智能助理需要執(zhí)行越來越多復(fù)雜任務(wù)的需求,Google發(fā)布了最新的架構(gòu)引導(dǎo)對話(Schema-Guided Dialogue,SGD)數(shù)據(jù)集,以擴(kuò)展智能助理模型,使其有能力處理多重領(lǐng)域的任務(wù)。
現(xiàn)在的智能助理可以完成的任務(wù)越來越多,包括預(yù)定餐廳或是截取網(wǎng)絡(luò)消息等,Google提到,像是Google助理這類智能助理集成了眾多領(lǐng)域的服務(wù),每個服務(wù)可能由不同領(lǐng)域的服務(wù)疊加而成。為了適應(yīng)這樣的發(fā)展,讓智能助理能夠支持更多的新服務(wù),而不需要收集額外的數(shù)據(jù)或是重新訓(xùn)練模型,降低維護(hù)成本。因此Google發(fā)布SGD數(shù)據(jù)集,來填補(bǔ)訓(xùn)練智能助理處理復(fù)雜與大規(guī)模任務(wù)所需要的數(shù)據(jù)集空缺。
SGD數(shù)據(jù)集是目前最大的任務(wù)導(dǎo)向?qū)υ捳Z料庫,Google使用綠野仙蹤(Wizard of Oz)方法產(chǎn)生人類與助理的對話,共包含跨17個領(lǐng)域18,000個對話,并附加了不同的注解。這些對話涉及與服務(wù)和API的交互,包括銀行服務(wù)、事件、日歷甚至是天氣等17個領(lǐng)域,而在多數(shù)的領(lǐng)域,SGD數(shù)據(jù)集包含多個不同的API,不少API接口不同但是功能重復(fù),以反應(yīng)實際的狀況。
Google表示,SGD數(shù)據(jù)集是第一個涵蓋這么多領(lǐng)域,會為每個領(lǐng)域都提供多個API的數(shù)據(jù)集,而且為了量化模型對API接口更新或是新API的強(qiáng)健性,評估數(shù)據(jù)集包含了許多在訓(xùn)練數(shù)據(jù)集中,所沒有的新服務(wù)。
用戶使用SGD數(shù)據(jù)集,可以訓(xùn)練智能助理支持網(wǎng)頁的多樣服務(wù),Google提到,要完成這個目的,通常需要一個大型的主要架構(gòu)(Master Schema),羅列所有支持的功能和參數(shù),但實際上,要開發(fā)適合所有使用案例的主架構(gòu)非常困難,而且即便克服了這項障礙,主架構(gòu)也可能會讓新的或是小型服務(wù)的集成變得復(fù)雜,進(jìn)而增加智能助理的維護(hù)成本。
而且不少服務(wù)之間使用相似的概念,像是訂票服務(wù),電影票、機(jī)票和演奏會門票邏輯都相似,但使用主架構(gòu)的方法,就會不方便對這類概念進(jìn)行連接建模,除非以手動的方式定義之間的映射。
Google提出了一個新的架構(gòu)引導(dǎo)方法解決這些問題,這個新方法不需要為智能助理定義一個主架構(gòu),而是為每個服務(wù)或是API,提供功能與相關(guān)屬性列表的自然語言描述,這些描述可以用于學(xué)習(xí)一個架構(gòu)的分布式語義表達(dá),為對話系統(tǒng)提供額外的輸入,并將對話系統(tǒng)以單個統(tǒng)一的模型實例,這個統(tǒng)一模型為不同服務(wù)提供相似概念的表示,并通過架構(gòu)的分布式表達(dá),使得新服務(wù)可以不需要事先有訓(xùn)練數(shù)據(jù)就能運(yùn)行。
Google為此還以架構(gòu)引導(dǎo)方法創(chuàng)建了一個智能助理,在所有服務(wù)和領(lǐng)域使用單一模型,沒有設(shè)置各領(lǐng)域的專門參數(shù),就能處理各式任務(wù),Google開源了用于對話狀態(tài)關(guān)注的模型,可以在新服務(wù)和API沒有訓(xùn)練數(shù)據(jù)的情況下,同時保有與常規(guī)設(shè)置相同的能力。
(責(zé)任編輯:fqj)
-
谷歌
+關(guān)注
關(guān)注
27文章
6171瀏覽量
105504 -
AI
+關(guān)注
關(guān)注
87文章
31028瀏覽量
269371
發(fā)布評論請先 登錄
相關(guān)推薦
評論