0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

可以提高機(jī)器學(xué)習(xí)模型的可解釋性技術(shù)

QQ475400555 ? 來源:機(jī)器視覺沙龍 ? 2023-02-08 14:08 ? 次閱讀

目前很多機(jī)器學(xué)習(xí)模型可以做出非常好的預(yù)測,但是它們并不能很好地解釋他們是如何進(jìn)行預(yù)測的,很多數(shù)據(jù)科學(xué)家都很難知曉為什么該算法會得到這樣的預(yù)測結(jié)果。這是非常致命的,因為如果我們無法知道某個算法是如何進(jìn)行預(yù)測,那么我們將很難將其前一道其它的問題中,很難進(jìn)行算法的debug。

本文介紹目前常見的幾種可以提高機(jī)器學(xué)習(xí)模型的可解釋性的技術(shù),包括它們的相對優(yōu)點和缺點。我們將其分為下面幾種:

Partial Dependence Plot (PDP);

Individual Conditional Expectation (ICE)

Permuted Feature Importance

Global Surrogate

Local Surrogate (LIME)

Shapley Value (SHAP)

六大可解釋性技術(shù) 8c86894c-a20d-11ed-bfe3-dac502259ad0.png

01

Partial Dependence Plot (PDP)

PDP是十幾年之前發(fā)明的,它可以顯示一個或兩個特征對機(jī)器學(xué)習(xí)模型的預(yù)測結(jié)果的邊際效應(yīng)。它可以幫助研究人員確定當(dāng)大量特征調(diào)整時,模型預(yù)測會發(fā)生什么樣的變化。

8c9ef400-a20d-11ed-bfe3-dac502259ad0.png

上面圖中,軸表示特征的值,軸表示預(yù)測值。陰影區(qū)域中的實線顯示了平均預(yù)測如何隨著值的變化而變化。PDP能很直觀地顯示平均邊際效應(yīng),因此可能會隱藏異質(zhì)效應(yīng)。

例如,一個特征可能與一半數(shù)據(jù)的預(yù)測正相關(guān),與另一半數(shù)據(jù)負(fù)相關(guān)。那么PDP圖將只是一條水平線。

02

Individual Conditional Expectation (ICE)

ICE和PDP非常相似,但和PDP不同之處在于,PDP繪制的是平均情況,但是ICE會顯示每個實例的情況。ICE可以幫助我們解釋一個特定的特征改變時,模型的預(yù)測會怎么變化。

8cb12472-a20d-11ed-bfe3-dac502259ad0.png

如上圖所示,與PDP不同,ICE曲線可以揭示異質(zhì)關(guān)系。但其最大的問題在于:它不能像PDP那樣容易看到平均效果,所以可以考慮將二者結(jié)合起來一起使用。

03

Permuted Feature Importance

Permuted Feature Importance的特征重要性是通過特征值打亂后模型預(yù)測誤差的變化得到的。換句話說,Permuted Feature Importance有助于定義模型中的特征對最終預(yù)測做出貢獻(xiàn)的大小。

8cc51888-a20d-11ed-bfe3-dac502259ad0.png

如上圖所示,特征f2在特征的最上面,對模型的誤差影響是最大的,f1在shuffle之后對模型卻幾乎沒什么影響,生息的特征則對于模型是負(fù)面的貢獻(xiàn)。

04

Global Surrogate

Global Surrogate方法采用不同的方法。它通過訓(xùn)練一個可解釋的模型來近似黑盒模型的預(yù)測。

首先,我們使用經(jīng)過訓(xùn)練的黑盒模型對數(shù)據(jù)集進(jìn)行預(yù)測;

然后我們在該數(shù)據(jù)集和預(yù)測上訓(xùn)練可解釋的模型。

訓(xùn)練好的可解釋模型可以近似原始模型,我們需要做的就是解釋該模型。

注:代理模型可以是任何可解釋的模型:線性模型、決策樹、人類定義的規(guī)則等。

8cd69950-a20d-11ed-bfe3-dac502259ad0.png

使用可解釋的模型來近似黑盒模型會引入額外的誤差,但額外的誤差可以通過R平方來衡量。

由于代理模型僅根據(jù)黑盒模型的預(yù)測而不是真實結(jié)果進(jìn)行訓(xùn)練,因此全局代理模型只能解釋黑盒模型,而不能解釋數(shù)據(jù)。

05

Local Surrogate (LIME)

LIME(Local Interpretable Model-agnostic Explanations)和global surrogate是不同的,因為它不嘗試解釋整個模型。相反,它訓(xùn)練可解釋的模型來近似單個預(yù)測。LIME試圖了解當(dāng)我們擾亂數(shù)據(jù)樣本時預(yù)測是如何變化的。

8ce83110-a20d-11ed-bfe3-dac502259ad0.jpg

上面左邊的圖像被分成可解釋的部分。然后,LIME 通過“關(guān)閉”一些可解釋的組件(在這種情況下,使它們變灰)來生成擾動實例的數(shù)據(jù)集。對于每個擾動實例,可以使用經(jīng)過訓(xùn)練的模型來獲取圖像中存在樹蛙的概率,然后在該數(shù)據(jù)集上學(xué)習(xí)局部加權(quán)線性模型。最后,使用具有最高正向權(quán)重的成分來作為解釋。

06

Shapley Value (SHAP)

Shapley Value的概念來自博弈論。我們可以通過假設(shè)實例的每個特征值是游戲中的“玩家”來解釋預(yù)測。每個玩家的貢獻(xiàn)是通過在其余玩家的所有子集中添加和刪除玩家來衡量的。一名球員的Shapley Value是其所有貢獻(xiàn)的加權(quán)總和。Shapley 值是可加的,局部準(zhǔn)確的。如果將所有特征的Shapley值加起來,再加上基值,即預(yù)測平均值,您將得到準(zhǔn)確的預(yù)測值。這是許多其他方法所沒有的功能。

8d168c90-a20d-11ed-bfe3-dac502259ad0.png

該圖顯示了每個特征的Shapley值,表示將模型結(jié)果從基礎(chǔ)值推到最終預(yù)測的貢獻(xiàn)。紅色表示正面貢獻(xiàn),藍(lán)色表示負(fù)面貢獻(xiàn)。

小結(jié)

機(jī)器學(xué)習(xí)模型的可解釋性是機(jī)器學(xué)習(xí)中一個非?;钴S而且重要的研究領(lǐng)域。本文中我們介紹了6種常用的用于理解機(jī)器學(xué)習(xí)模型的算法。大家可以依據(jù)自己的實踐場景進(jìn)行使用。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • PDP
    PDP
    +關(guān)注

    關(guān)注

    0

    文章

    53

    瀏覽量

    36235
  • 機(jī)器學(xué)習(xí)

    關(guān)注

    66

    文章

    8428

    瀏覽量

    132845

原文標(biāo)題:機(jī)器學(xué)習(xí)模型的可解釋性算法匯總!

文章出處:【微信號:機(jī)器視覺沙龍,微信公眾號:機(jī)器視覺沙龍】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏

    評論

    相關(guān)推薦

    【「基于大模型的RAG應(yīng)用開發(fā)與優(yōu)化」閱讀體驗】+大模型微調(diào)技術(shù)解讀

    。通過微調(diào),模型可以學(xué)習(xí)特定領(lǐng)域的專業(yè)知識和語言特征,從而在高度專業(yè)化的領(lǐng)域中展現(xiàn)出卓越的表現(xiàn)。微調(diào)過程主要有這幾項內(nèi)容:數(shù)據(jù)清洗:消除噪聲、提高數(shù)據(jù)質(zhì)量。包括處理缺失值(如用特殊符號
    發(fā)表于 01-14 16:51

    【「具身智能機(jī)器人系統(tǒng)」閱讀體驗】2.具身智能機(jī)器人大模型

    ,能夠利用\"思維鏈\"的技術(shù)將復(fù)雜任務(wù)分解為多個子任務(wù),以漸進(jìn)的方式解決問題。這不僅提高了任務(wù)的成功率,也顯著增強(qiáng)了系統(tǒng)的魯棒,使得機(jī)器可以
    發(fā)表于 12-29 23:04

    《具身智能機(jī)器人系統(tǒng)》第7-9章閱讀心得之具身智能機(jī)器人與大模型

    設(shè)計專門的編碼器處理視覺、觸覺、位置等不同類型的傳感器數(shù)據(jù),再用cross-attention機(jī)制將它們對齊到同一語義空間。這種設(shè)計不僅提高模型的感知能力,還增強(qiáng)了推理過程的可解釋性。在實驗中,RT-1
    發(fā)表于 12-24 15:03

    一種基于因果路徑的層次圖卷積注意力網(wǎng)絡(luò)

    機(jī)電系統(tǒng)中數(shù)據(jù)驅(qū)動故障檢測模型的性能和可解釋性。引入了一種混合因果發(fā)現(xiàn)算法來發(fā)現(xiàn)監(jiān)測變量之間的繼承因果關(guān)系。順序連接因果變量的因果路徑用作接收場,使用多尺度卷積來提取特征?;诜謱幼⒁饬C(jī)制來聚合
    的頭像 發(fā)表于 11-12 09:52 ?335次閱讀
    一種基于因果路徑的層次圖卷積注意力網(wǎng)絡(luò)

    深度學(xué)習(xí)模型的魯棒優(yōu)化

    深度學(xué)習(xí)模型的魯棒優(yōu)化是一個復(fù)雜但至關(guān)重要的任務(wù),它涉及多個方面的技術(shù)和策略。以下是一些關(guān)鍵的優(yōu)化方法: 一、數(shù)據(jù)預(yù)處理與增強(qiáng) 數(shù)據(jù)清洗 :去除數(shù)據(jù)中的噪聲和異常值,這是
    的頭像 發(fā)表于 11-11 10:25 ?329次閱讀

    魯棒機(jī)器學(xué)習(xí)中的重要

    機(jī)器學(xué)習(xí)領(lǐng)域,模型的魯棒是指模型在面對輸入數(shù)據(jù)的擾動、異常值、噪聲或?qū)剐怨魰r,仍能保持性能的能力。隨著人工智能
    的頭像 發(fā)表于 11-11 10:19 ?462次閱讀

    常見AI大模型的比較與選擇指南

    在選擇AI大模型時,明確具體需求、了解模型的訓(xùn)練數(shù)據(jù)、計算資源要求和成本,并考慮模型可解釋性和社區(qū)支持情況等因素至關(guān)重要。以下是對常見AI大模型
    的頭像 發(fā)表于 10-23 15:36 ?997次閱讀

    AI大模型與深度學(xué)習(xí)的關(guān)系

    人類的學(xué)習(xí)過程,實現(xiàn)對復(fù)雜數(shù)據(jù)的學(xué)習(xí)和識別。AI大模型則是指模型的參數(shù)數(shù)量巨大,需要龐大的計算資源來進(jìn)行訓(xùn)練和推理。深度學(xué)習(xí)算法為AI大
    的頭像 發(fā)表于 10-23 15:25 ?1033次閱讀

    AI大模型與傳統(tǒng)機(jī)器學(xué)習(xí)的區(qū)別

    AI大模型與傳統(tǒng)機(jī)器學(xué)習(xí)在多個方面存在顯著的區(qū)別。以下是對這些區(qū)別的介紹: 一、模型規(guī)模與復(fù)雜度 AI大模型 :通常包含數(shù)十億甚至數(shù)萬億的參
    的頭像 發(fā)表于 10-23 15:01 ?853次閱讀

    《AI for Science:人工智能驅(qū)動科學(xué)創(chuàng)新》第二章AI for Science的技術(shù)支撐學(xué)習(xí)心得

    。 4. 物理與AI的融合 在閱讀過程中,我對于物理與AI的融合有了更加深入的認(rèn)識。AI for Science不僅依賴于數(shù)據(jù),還需要結(jié)合物理定律和原理來確保模型的準(zhǔn)確可解釋性。這種融合不僅
    發(fā)表于 10-14 09:16

    【《大語言模型應(yīng)用指南》閱讀體驗】+ 基礎(chǔ)知識學(xué)習(xí)

    能夠關(guān)注到輸入文本中的重要部分,從而提高預(yù)測的準(zhǔn)確和效率。這種機(jī)制允許模型在處理文本時同時考慮多個位置的信息,并根據(jù)重要進(jìn)行加權(quán)處理。 一些關(guān)鍵
    發(fā)表于 08-02 11:03

    Al大模型機(jī)器

    和迭代來不斷改進(jìn)自身性能。它們可以從用戶交互中學(xué)習(xí)并根據(jù)反饋進(jìn)行調(diào)整,以提高對話質(zhì)量和準(zhǔn)確。可定制與整合
    發(fā)表于 07-05 08:52

    【大規(guī)模語言模型:從理論到實踐】- 閱讀體驗

    直觀地解釋和理解。這可能會影響模型可解釋性和可信賴,特別是在需要高度可靠的場景中。 通過修改注意力機(jī)制的計算方式或引入新的架構(gòu)來降低
    發(fā)表于 06-07 14:44

    【大語言模型:原理與工程實踐】核心技術(shù)綜述

    中應(yīng)用,需要考慮到性能、可擴(kuò)展性和安全等因素。 大語言模型正在快速發(fā)展,新技術(shù)不斷涌現(xiàn)。未來的研究可能集中在提高模型效率、理解和
    發(fā)表于 05-05 10:56

    Meta發(fā)布SceneScript視覺模型,高效構(gòu)建室內(nèi)3D模型

    Meta 表示,此模型具備創(chuàng)建室內(nèi) 3D 模型的高效與輕便,僅需幾KB內(nèi)存便能生成完整清晰的幾何圖形,同時,這些形狀數(shù)據(jù)具備可解釋性,便于用戶理解和編輯。
    的頭像 發(fā)表于 03-26 11:16 ?596次閱讀