【導(dǎo)讀】分析了上萬個交易糾紛類案件,學(xué)習(xí)了近千條交易領(lǐng)域的法律條款,阿里 AI 針對每種案由,整理成計算機(jī)能理解的模型,同時,針對案件的每一個要素,阿里 AI 自動提供相關(guān)法條等判決依據(jù),從而建立了一整套審判知識圖譜,深刻刻畫了交易人、交易行為與法律事實的關(guān)聯(lián)性,并且把這種關(guān)聯(lián)性融入到了 AI 中。當(dāng)法官遇到類似案件時,阿里AI就能夠針對糾紛爭議點迅速開啟“大腦”進(jìn)行分析和判斷,并向法官給出調(diào)解和判案建議。這一研究成果發(fā)表在信息檢索領(lǐng)域的頂級學(xué)術(shù)會議 SIGIR 官網(wǎng)。SIGIR 組委會認(rèn)為,阿里巴巴的這項技術(shù)是司法智能領(lǐng)域的一項開創(chuàng)性成果。目前,該技術(shù)已在杭州互聯(lián)網(wǎng)法院試點應(yīng)用。
前言
2018年4月,杭州西湖區(qū)人民法院出現(xiàn)了令人驚奇的一幕:在一次審判中,原告在家中,被告在1200多公里開外的律師事務(wù)所,靠智能法院在線面對面,現(xiàn)場的書記員也是個“機(jī)器人”,整個庭審現(xiàn)場僅法官一人。這場獨特的“一個人的法庭”打開了社會對“智能司法”的想象空間,其背后正是阿里AI技術(shù)。
如果說“一個人的法庭”還屬于審判流程的數(shù)字化、在線化的1.0階段。那么,阿里的最新研究成果標(biāo)志著智能司法2.0階段到來。AI不再只是停留在完成庭審記錄和證據(jù)鏈條的數(shù)字化工作,而是進(jìn)入到真實訴訟環(huán)節(jié),開始具備自主判案能力,真正成為一名“助理法官”。
以下為研究論文解讀:
摘要
隨著信息技術(shù)的飛速發(fā)展,電子經(jīng)濟(jì)獲得了快速增長,并成為世界上動態(tài)性最強(qiáng)的經(jīng)濟(jì)活動之一。截至2018年,世界上主要的電商平臺(如亞馬遜、eBay、阿里巴巴)等都獲得了巨大成功,并占領(lǐng)了全球零售市場的11.9%。但與此同時,新型法律糾紛也隨著信息技術(shù)的發(fā)展不斷出現(xiàn)。高效處理問題糾紛無論對商家還是用戶都是一件好事,基于此背景下,阿里巴巴進(jìn)行了相關(guān)研究,無論是研究成果還是未來在場景中的應(yīng)用,都值得關(guān)注。
在傳統(tǒng)訴訟流程中,法官判定一個交易糾紛案件的調(diào)解與審判方向,需要經(jīng)過讀案卷、查詢交易對話記錄、提煉爭議焦點、查找相關(guān)法律條款等步驟,大約需要2小時,而通過上述精準(zhǔn)識別模型,阿里AI只需要1秒左右時間,就可得出調(diào)解與審判方向并給出建議。這將大大節(jié)省法官的重復(fù)勞動時間,從而大幅提高司法效率。
在已有的相關(guān)研究中,學(xué)者們指出,無論是 ODR(online dispute resolution, ODR)還是正式的判決系統(tǒng),通過使用多渠道的更好且易用的信息,并去除訴訟當(dāng)事人的外表信息(如種族、性別、體重等),都能夠有效降低判決過程中的主觀偏見性。本文作者依據(jù)這一結(jié)論,決定使用多視圖表示學(xué)習(xí)和多任務(wù)學(xué)習(xí)( ODR 和審判預(yù)測)來解決電子經(jīng)濟(jì)領(lǐng)域的法律智能化問題。在這一聯(lián)合學(xué)習(xí)過程中,本文作者使用了包括法律知識圖譜、消費(fèi)者/售賣方信息、交易信息等多種類數(shù)據(jù),以在對糾紛表示進(jìn)行微調(diào)對過程中對可能的判決結(jié)果進(jìn)行正則化。
本文是第一篇針對網(wǎng)絡(luò)交易糾紛案件的智能化審判的研究論文,該論文對于維護(hù)法律公平性、保護(hù)網(wǎng)絡(luò)交易中雙方利益具有重要意義。不同于之前的分類和推薦類模型和方法,本文提出了一個端到端的多任務(wù)學(xué)習(xí)模型,該模型對法律判決模型和糾紛解決模型進(jìn)行了聯(lián)合訓(xùn)練。另外, ODR 任務(wù)在聯(lián)合學(xué)習(xí)過程中提供了重要的法律數(shù)據(jù),因此本文提出對模型能夠有效解決法律數(shù)據(jù)稀疏對問題。
總體而言,本文的貢獻(xiàn)如下:
(1)提出了一個全新的法律智能化問題;
(2)提出了通過多視圖糾紛表示以量化法律案例對有效方法;
(3)論文模型能夠有效挖掘法律案例背后的判決邏輯,并解釋判例和判決結(jié)果之間的因果關(guān)系;
(4)使用超過百萬級糾紛數(shù)據(jù)對模型進(jìn)行了訓(xùn)練,并使用超過6858個判例對模型進(jìn)行了評估。實驗結(jié)果顯示,本模型有效提高了訴訟結(jié)果預(yù)測的 Micro_F1 和 Micro_F2 分?jǐn)?shù)。
(5)在移除敏感信息后,論文作者還公開了數(shù)據(jù)集
模型架構(gòu)
在本文中,作者提出了一個使用多任務(wù)學(xué)習(xí)的方法,能夠通過 ODR 和法律智能化的方式對 4 種不同類型對分類任務(wù)進(jìn)行聯(lián)合學(xué)習(xí)。在實際操作中,首先要對糾紛對產(chǎn)生原因進(jìn)行分類,然后對可能對糾紛調(diào)解結(jié)果進(jìn)行分類。當(dāng)這一糾紛可能成為訴訟時,模型首先對其進(jìn)行分類,然后基于前述階段產(chǎn)生對訴訟事實對訴訟判決結(jié)果進(jìn)行預(yù)測。在本文中,作者通過對其背后對邏輯體系進(jìn)行思考,對上述對四個任務(wù)進(jìn)行了序列性的處理(見圖1),并假設(shè)糾紛的原因?qū)ζ渑袥Q結(jié)果具有較高的重要性。糾紛原因也反映了訴訟的事實,該事實對判決結(jié)果會產(chǎn)生極大影響。
圖1:本文提出的 LDJ 模型的網(wǎng)絡(luò)結(jié)構(gòu)
主要任務(wù):法律判決預(yù)測
從法律視角而言,判決是對原告陳述對回應(yīng)。本文將此過程定義為一個多標(biāo)簽分類任務(wù),該任務(wù)是一個函數(shù)優(yōu)化問題,該函數(shù)對給定案例表示的標(biāo)簽的實際價值進(jìn)行預(yù)測。在函數(shù)中, x 為給定案例的表示,y 為判例標(biāo)簽, M 是分類的總數(shù)量??紤]到這一任務(wù)的訓(xùn)練數(shù)據(jù)可能較為稀疏,模型使用了多任務(wù)和多視圖表示學(xué)習(xí),通過子任務(wù)的信息對預(yù)測結(jié)果進(jìn)行優(yōu)化。
子任務(wù) 1:糾紛原因預(yù)測
糾紛原因預(yù)測是 ODR 的一部分,是一個單標(biāo)簽多任務(wù)分類任務(wù),在這一任務(wù)中,每一個糾紛都對應(yīng)一個糾紛原因,該原因由用戶基于一個列表進(jìn)行選擇產(chǎn)生。這一任務(wù)和主任務(wù)的不同之處在于, ODR 數(shù)據(jù)庫為該任務(wù)提供了充足的訓(xùn)練數(shù)據(jù)。該任務(wù)嘗試學(xué)習(xí)一個映射函數(shù),該函數(shù)將糾紛表示映射到類別標(biāo)簽中。在函數(shù)中, 向量 x 為糾紛的表示, k 為類別標(biāo)簽,k ∈ RK,K 為種類的總數(shù)量。
子任務(wù) 2:糾紛結(jié)果預(yù)測
通過使用案件信息和用戶選擇的糾紛原因,網(wǎng)絡(luò)交易平臺能夠?qū)m紛調(diào)解結(jié)果進(jìn)行判斷,例如僅退款,退貨并退款,或拒絕。和上一任務(wù)類似,這也是一個 ODR 單標(biāo)簽多類別分類任務(wù)。
子任務(wù) 3:訴訟事實預(yù)測
在實際案例中,如果顧客決定提交一個訴訟,法官會對通過查看所有證據(jù)了解訴訟事實情況,證據(jù)包括交易數(shù)據(jù),協(xié)商結(jié)果等,以及案件被告。由于數(shù)據(jù)獲取的困難性,在本文中,作者僅使用了糾紛數(shù)據(jù),該數(shù)據(jù)可以從電商平臺獲得。
多視圖糾紛表示
在網(wǎng)絡(luò)交易系統(tǒng)中,一個糾紛案例往往包含三種類型的信息,即買賣雙方與交易。從法律角度來看,每個案例都可以表示為法律知識圖譜(legal knwoledge graph, LKG)的節(jié)點和邊。模型需要使用元數(shù)據(jù)和問題數(shù)據(jù)進(jìn)行這一表示。下表描述了本文對三個角度的信息進(jìn)行表示時采用的特征。另外,對于法律表示,本文也適用了法律專家的知識,并同樣將其表示為一個知識圖譜。圖2展示了這一知識圖譜的一部分。
對于每個案例,本文都進(jìn)行了三種表示:離散、文字、法律知識圖譜,并在最后將三種表示結(jié)合,作為特征進(jìn)行輸入。
表1:使用的特征
圖2:法律知識圖譜的部分示例
交易數(shù)據(jù)可以通過商品的數(shù)據(jù)和價格顯示購買行為的狀態(tài)。其中,商品信息包括反映了商品質(zhì)量的負(fù)面評價,物流信息顯示了商品的所屬情況,線上糾紛記錄展示了當(dāng)前交易涉及的買家、賣家和平臺管理者關(guān)于糾紛的對話記錄。從買家角度,本文作者假設(shè),買家的歷史購買和糾紛記錄能夠展示其是一個普通消費(fèi)者還是專業(yè)的欺詐者。與此類似,賣家的信用、評價和糾紛則能夠表示其信用水平和商品質(zhì)量。
從理論上來看,交易數(shù)據(jù)能夠展示顧客提出糾紛的原因,并且在訴訟中,這一數(shù)據(jù)也是支持判決的重要證據(jù)。同時,對買家和賣家雙方進(jìn)行用戶畫像也是給出糾紛結(jié)果的基礎(chǔ)步驟。
本文使用的法律知識圖譜(Legal Knowledge Graph, LKG)是一個有向無環(huán)圖(directed acyclic graph, DAG),LDK 和本體較為相似,其表示了不同場景下常見 OTD 的判決要求。圖2展示了一個示例,在該示例中,電子經(jīng)濟(jì)欺詐案例可能會在多種情況下出現(xiàn):虛假價格,虛假促銷,商品問題等。每一場景都可能包含多個子場景。另外,若要將一個案例判決為欺詐,必須確認(rèn)原告(或買家)是一個真實的消費(fèi)者,而不是一個專業(yè)的欺詐者。在本論文中,作者利用 LKG 對每個案例進(jìn)行了表示,并將其作為預(yù)測任務(wù)的輸入。
法律糾紛判決模型
這一部分介紹本文提出的法律糾紛判決模型(Legal Dispute Judgment, LDJ)的推理步驟。多任務(wù)框架包含 3 個主要的部分:嵌入模塊,共享編碼器,以及基于任務(wù)的解碼器;嵌入部分包括離散、文字和 LKG 三種類型的嵌入,用于表示法律條款之間的離散特征、文字特征的語義含義和語義連接。
輸入:文字輸入 xt 以文檔形式展示,其中,xt = {s1, s2, ..., sL} 是一個包含 L 個句子的序列,其中每個句子 sj = {wi1, wi2,...wiT},語句包含 T 個詞語,詞語用詞嵌入表示。離散輸入 sd = {v1, v2, ..., vK} ,者是一個長度固定為 K 的值集合。 LKG 輸入 xg = {a1, a2, ..., aN} 是一個概率分布,維度 N 表示 LKG 中的結(jié)點個數(shù)。
編碼器:對文字輸入進(jìn)行編碼,本文使用了一個具有等級結(jié)構(gòu)的網(wǎng)絡(luò)來提取文檔結(jié)構(gòu),該網(wǎng)絡(luò)首先建立對句子對表示,之后將其拼合為對文檔對表示。
句子表示,本文使用卷積神經(jīng)網(wǎng)絡(luò)(convolutional neural network, CNN)來計算句子對連續(xù)表示??紤]到在本文處理的數(shù)據(jù),消費(fèi)者常傾向于使用長句子來表達(dá)案例情況, CNN 對本文情景更加適合。本文采用的 CNN 網(wǎng)絡(luò)采用了多個具有不同寬度的卷積核來產(chǎn)生句子的表示。這種網(wǎng)絡(luò)結(jié)構(gòu)能夠更好地學(xué)習(xí)多種粒度的 n-gram 結(jié)構(gòu)的語義信息,這有利于句子分類任務(wù)的進(jìn)行。
文檔表示,本文采用一個雙向 GRU 結(jié)構(gòu)提取句子間的依賴信息,并對文檔進(jìn)行表示。相較于雙向 LSTM ,這一結(jié)構(gòu)能夠?qū)ο噜従渥訉π畔⑦M(jìn)行更有效對總結(jié)。
LKG & 離散表示,為了對 LKG 和離散輸入進(jìn)行編碼,本文使用一個單層全連接神經(jīng)網(wǎng)絡(luò)進(jìn)行了計算,該網(wǎng)絡(luò)包含一個 logistic sigmoid 激活函數(shù)。 hg 和 hd 是 LKG 和離散輸入的隱藏表示:
最后,論文將三種類型的表示進(jìn)行拼接,得到編碼器的最終輸出:
解碼器:本部分,作者介紹了論文的各個子任務(wù),以及主任務(wù)的實現(xiàn)方式。
子任務(wù) 1:糾紛原因預(yù)測
為預(yù)測糾紛的調(diào)解方案,本文使用了交易層的輸出作為輸入,并采用一個 Highway Network 來解決參數(shù)增長帶來的訓(xùn)練困難問題。
子任務(wù) 2:糾紛結(jié)果預(yù)測
糾紛結(jié)果預(yù)測在推理層的最上層進(jìn)行??紤]到使用歷史交易和糾紛記錄有助于達(dá)成更好的調(diào)解結(jié)果,本文將交易層、買家層和賣家層的輸出以及推理層的輸出進(jìn)行了拼接,作為結(jié)果層的共同輸入,這一步驟使用 Highway Network 進(jìn)行了處理。帶權(quán)重的原因標(biāo)簽嵌入表示如下:
子任務(wù) 3:訴訟事實預(yù)測
這一部分的任務(wù)是預(yù)測法官會采用的法律事實,考慮到一些糾紛原因和測定的法律事實存在關(guān)聯(lián),該內(nèi)容涉及糾紛原因預(yù)測過程。本文將交易層和原因?qū)拥钠唇幼鳛檩斎?,并使用Highway Network進(jìn)行處理。之后,模型將結(jié)果輸入了一個包含 sigmoid 函數(shù)的全連接神經(jīng)網(wǎng)絡(luò)。和糾紛層的任務(wù)的不同之處在于,作者在這一部分對 sigmoid 激活使用了二元交叉熵,相較于 softmax 激活函數(shù),這一方法對多標(biāo)簽分類任務(wù)更加有效。
主任務(wù):訴訟判決預(yù)測
這一部分,作者結(jié)合了交易信息、訴訟當(dāng)事人對歷史信息以及訴訟事實,并將四個部分的輸出拼接為這一部分模型的輸入。為了直接使用事實層的輸出,作者對結(jié)果進(jìn)行了標(biāo)簽嵌入。最后的結(jié)果同樣適用Highway Network進(jìn)行拼接,并輸入到判決分類器。該分類器是一個包含 sigmoid 函數(shù)的全連接神經(jīng)層,和事實分類器類似。這一部分,作者同樣使用了二元交叉熵。
訓(xùn)練過程包含兩部分。作者首先使用所有的離散數(shù)據(jù)訓(xùn)練原因?qū)雍徒Y(jié)果層,并在這一步中關(guān)閉了事實層和判決層,以使用大量的數(shù)據(jù)對離散表示進(jìn)行優(yōu)化。之后,作者啟動了四個任務(wù)層,并使用訴訟數(shù)據(jù)來微調(diào)參數(shù)。作者將主任務(wù)和子任務(wù)的損失權(quán)重設(shè)定為0.6, 0.2, 0.1, 0.1,并加和得到最總的損失函數(shù)值。
實驗分析
(1)數(shù)據(jù)集:作者在兩個數(shù)據(jù)集上進(jìn)行了實驗:淘寶歷史糾紛數(shù)據(jù),以及最高法院提供的訴訟數(shù)據(jù)。盡管數(shù)據(jù)集均為中國的電商數(shù)據(jù)和訴訟數(shù)據(jù),但模型可用于世界各國的應(yīng)用。
糾紛數(shù)據(jù)集(ODR):論文收集了40萬條歷史糾紛記錄,記錄包含 46 種糾紛原因和 3 種調(diào)解結(jié)果。最常見的糾紛原因為質(zhì)量問題,錯誤訂單,退換貨和錯誤商品信息。調(diào)解結(jié)果包括退款并退貨,拒絕和僅退款。
訴訟數(shù)據(jù)集:該數(shù)據(jù)集從中國在線判例網(wǎng)站爬取,判決文件由最高法院提供,可在線上公開獲取。本文通過關(guān)鍵詞檢索,將判例限制在和淘寶相關(guān)的內(nèi)容中。本文共收集了6858個案例。
本文使用 Word2Vec 對文本嵌入進(jìn)行了預(yù)訓(xùn)練,使用百萬級的糾紛記錄進(jìn)行了訓(xùn)練。使用的 CNN 網(wǎng)絡(luò)包含的卷積核寬度為{1, 2, 3, 4, 5},輸出維度為{32,32,64,128,256}。GRU維度為100。
(2)評價指標(biāo):本文使用了 Micro_F1 和 Micro_F2 作為主要的的評級指標(biāo)。Macro-average)能夠?qū)γ總€類別的每個矩陣進(jìn)行單獨評估,并取平均值作為最終的分?jǐn)?shù)。這一指標(biāo)對于多標(biāo)簽多分類任務(wù)較為有效。
(3)基線:由于沒有已有的針對法律判決任務(wù)的多任務(wù)學(xué)習(xí)的研究,本文通過比較多個最新的單任務(wù)判決預(yù)測模型效果對模型進(jìn)行了評估,涉及方法包括傳統(tǒng)機(jī)器學(xué)習(xí)模型(BSVM),深度學(xué)習(xí)模型兩種,結(jié)果如下表。
(4)模型表現(xiàn):論文從以下四個角度展示了模型對評估結(jié)果:(a)和基線的比較;(b)使用多任務(wù)框架進(jìn)行訓(xùn)練的優(yōu)勢;(c)使用多視角的有效性;(d)使用電商經(jīng)濟(jì)糾紛數(shù)據(jù)的影響。
從基線比較來看,LDJ_Multi 的效果超越了最好的模型表現(xiàn)。作者對最優(yōu)模型和最優(yōu)基線模型分別進(jìn)行了消融實驗,結(jié)果如表3。
表3:多視角消融實驗
從使用電商糾紛數(shù)據(jù)對影響來看,作者展示了在訴訟判決預(yù)測上使用糾紛數(shù)據(jù)帶帶來的模型效果提升,如圖3。
圖3:電商糾紛數(shù)據(jù)帶來的多任務(wù)效果提升
結(jié)論
作為一個交叉學(xué)科研究,進(jìn)行法律糾紛預(yù)測能夠?qū)蓚€不相關(guān)的領(lǐng)域較好地連接在一起。在本文中,作者介紹了一個多視角糾紛表示技術(shù),并提供了一個針對訴訟判決預(yù)測的端到端解決方法,該方法采用了包含三個子任務(wù)的聯(lián)合學(xué)習(xí)。實驗數(shù)據(jù)表明,聯(lián)合學(xué)習(xí)能夠有效提升現(xiàn)有模型的效果。另外,電商平臺糾紛數(shù)據(jù)的使用也能夠有效提升判決預(yù)測的效果。通過評估結(jié)果和錯誤分析,本文展示了糾紛表示的各個分面,并為未來工作進(jìn)行了鋪墊。
-
機(jī)器人
+關(guān)注
關(guān)注
211文章
28474瀏覽量
207387 -
AI
+關(guān)注
關(guān)注
87文章
31024瀏覽量
269360 -
阿里巴巴
+關(guān)注
關(guān)注
7文章
1617瀏覽量
47287
原文標(biāo)題:阿里達(dá)摩院SIGIR 2019:AI判案1秒鐘,人工2小時 | 技術(shù)頭條
文章出處:【微信號:rgznai100,微信公眾號:rgznai100】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
相關(guān)推薦
評論