0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

人工智能的透明度和可解釋性義務

星星科技指導員 ? 來源:NVIDIA ? 作者:NVIDIA ? 2022-04-07 09:12 ? 次閱讀

2021 年 4 月 21 日,歐盟委員會向 h ARM 發(fā)布了一項法規(guī)提案,將 AI 系統(tǒng)的設計和營銷規(guī)則稱為人工智能法( AIA )。

監(jiān)管機構認為人工智能系統(tǒng)存在風險。高風險人工智能系統(tǒng)將受到具體設計和實施義務的約束,以提高透明度。信用評分模型是高風險用例的一個例子。

在《人工智能法》出臺之前,關于透明度的原則已經出現(xiàn)在一些歐洲人工智能準則中。例如,在可信人工智能的道德準則中,數(shù)據(jù)、系統(tǒng)設計和業(yè)務模型應該是透明的。與透明度相關的是,人工智能系統(tǒng)的技術過程和相關的人類決策都必須是可解釋的。

歐盟 Horizon2020 研究與創(chuàng)新項目FIN-TECH中也討論了人工智能的透明度和可解釋性義務。

該項目開發(fā)了新的方法和用例,以管理風險,并在歐洲金融服務領域擴展數(shù)字金融和人工智能。 20 多所大學以及歐洲監(jiān)管和金融服務界參與了研討會、培訓和用例演示,并對用例進行了反饋和評估。

圖 1 :歐盟 Horizon2020 項目FIN-TECH(左)和歐盟委員會(右)的標志。根據(jù)第 825215 號贈款協(xié)議( ICT-35-2018 主題,行動類型: CSA ),該項目獲得了歐盟地平線 2020 研究與創(chuàng)新計劃的資助。內容僅反映了作者的觀點,委員會不負責對其所含信息的任何使用。

該項目中評級最好的 AI 用例是用于信用風險管理的可解釋 AI ( XAI )方法,該方法旨在克服 AI 模型的可解釋性差距。該項目的評估系統(tǒng)根據(jù)歐洲監(jiān)管當局、中央銀行、金融服務公司和金融科技公司的結構化反饋確定了該案例。

該用例在 Springer 上以“可解釋機器學習在信用風險管理中的應用”的形式發(fā)布,并使用夏普利值和SHAP( SHapley 加法解釋)來確定已經訓練過的 AI / ML 模型中決策的最重要變量。它的靈感來源于英格蘭銀行(“金融學中的機器學習可解釋性:在違約風險分析中的應用”)發(fā)布的一個模型。

基礎方法分析本地或全球解釋性數(shù)據(jù),分組或集群,其中每個集群由具有非常相似解釋性數(shù)據(jù)的投資組合組成。通過這種方式,可以深入了解經過訓練的模型的內部工作原理,從而對其進行潛在的調試和控制。該方法還可以在解釋性數(shù)據(jù)中調查網絡和復雜系統(tǒng)的影響。

這是一種非常簡單的技術,工作流和算法組合可以應用于許多人工智能( AI )和機器學習( ML )應用程序。在描述該概念的好處和使用場景之前,我們將討論該方法的計算挑戰(zhàn)以及使用高性能計算( HPC )中使用的技術加速此類模型的需求。

加速建模、解釋性和可視化

與實際數(shù)據(jù)相比, FIN-TECH 中使用的原始數(shù)據(jù)集相當小。由于有必要在更大的數(shù)據(jù)集上測試模型,以了解金融機構大規(guī)模生產環(huán)境的影響, NVIDIA 的一個團隊在RAPIDS中實施了整個工作流,以快速處理大量數(shù)據(jù)。這種改進的性能允許更快的迭代,節(jié)省數(shù)據(jù)科學團隊的時間,并允許更快地獲得更好的結果。

RAPIDS 是一套開源 Python 庫,可以使用 GPU 加速來加速端到端數(shù)據(jù)科學工作流。在本用例中,它加速了整個工作流:

數(shù)據(jù)加載與預處理

Training

解釋(形狀值)

對 SHAP 值進行聚類

降維

可視化與過濾

該團隊處理了一組類似于解釋和加速貸款拖欠的機器學習上相關博客中的數(shù)據(jù)集的房利美數(shù)據(jù)集,其中包含數(shù)百萬個數(shù)據(jù)點。

SHAP 值被分組,但也可以通過網絡圖分析進行分析。 RAPIDS ‘ GPU – 加速庫cuML(機器學習算法)和cuGraph(圖形分析)非常適合此用例。這也適用于降維,以便以后在 2D 或 3D 中繪制形狀點云。此外,可以使用 GPU – 加速Plotly和其他工具構建以下過濾和可視化步驟。

圖 2 :儀表板用戶可以與模型的 SHAP 值交互,并進一步分析模型級別的全貌或深入到模型的特定“區(qū)域”。為了便于解釋,上圖中的每一組點代表一組編號為 0 到 10 的類似貸款。每個簇在底部圖中具有特征,簇編號沿 x 軸。對于給定的簇,矩形的高度對應于數(shù)據(jù)集中的 Shapley 值和 credit customer mortgage loan 特征的顏色。從正 Shapley 值或負 Shapley 值,可以看出集群的功能如何使貸款減少(負方向)或增加(正方向),可能會默認。

例如,可以顯示整個模型的形狀簇,并進一步分析特定簇和數(shù)據(jù)點,在更細粒度的級別上查看特征貢獻和交互。此外,顏色代碼可以從形狀視圖切換到高亮顯示真實和預測的類標簽,并顯示特征。

此外,最近的Captum和Captum軟件包中提供的 GPU 解釋程序加速了任何 cuML 或 scikit 學習模型的預測后解釋。對于基于樹的模型,如 XGBoost , SHAP Explainer 可以計算輸入特征的 Shapley 值。深度學習模型可以使用 SHAP GradientExplainer 或 Captum GradientShap 方法來計算 Shapley 值,方法是計算關于輸入特征和添加高斯隨機噪聲的特征的梯度。 SHAP 和 Captum 都使用 GPU s 來加速 Shapley 值的計算。

對模型的深入研究

本文介紹的基于機器學習的可視化過程處理另一個任意 AI / ML 模型的結果。它為已經訓練過的、可能不透明的機器學習模型提供了更多的 i NSight 、控制和透明度。

它采用了一種模型不可知的方法,旨在以可變重要性(個人輸入變量貢獻)的形式確定人工智能系統(tǒng)的決策標準,并應用于信用風險評估和管理以及投資組合構建等其他金融領域。

關鍵概念是模型的夏普里值分解,這是合作博弈論中的一個收益分配概念。到目前為止,它是唯一植根于經濟基礎的 XAI (可解釋 AI )方法。它提供了對預測概率的變量貢獻的細分,從 0 到 1 。這意味著每個數(shù)據(jù)點(例如,投資組合中的信貸或貸款客戶)不僅由輸入特征(機器學習模型的輸入)表示,而且還由這些輸入特征對經過訓練的機器學習模型的二進制預測的貢獻 0 或 1 表示。

Shapley 解釋值可用于基于降維技術(如 PCA 、 MDS 、 t-SNE )的可視化映射,或用于表示學習(如聚類和圖形分析)(如社區(qū)檢測和網絡中心度測量)。這些數(shù)據(jù)驅動的學習表示揭示了數(shù)據(jù)點的分段(客戶)其中每個集群包含非常相似的決策標準,而其他集群中的數(shù)據(jù)點顯示非常不同的決策標準。

層次聚類,尤其是圖論和網絡分析非常適合研究復雜系統(tǒng),如信貸組合的 Shapley 解釋值。這些系統(tǒng)具有突發(fā)性、自組織性的特點。該方法將(可能不透明的) AI / ML 模型的可變貢獻結果視為一個復雜系統(tǒng),并通過圖論和聚類分析進一步分析其性質。通過這種方式,用戶可以更好、更深入地了解 AI / ML 模型到底學到了什么,因為不同的解釋數(shù)據(jù)點被分組(集群)或作為具有特定鏈接結構的網絡進行排列。

可以分析和理解集群和網絡結構內部的以下現(xiàn)象:趨勢、異常、熱點、緊急效應和引爆點。由于該方法是模型不可知的,因此它可以應用于任何 AI / ML 模型。這還可以對基于相同數(shù)據(jù)訓練的多個模型進行比較。

在下文中,我們描述了基于 SHAP 集群和交互式可解釋性儀表板的擬議方法的一些用例場景:

數(shù)據(jù)點的組或簇表示 AI / ML 模型的類似決策。

聚類間相交處的數(shù)據(jù)點指向模糊決策,可進一步研究。

對默認和非默認的預測量幾乎相等的集群可能會指出機器學習模型中的錯誤或問題。

客戶細分:數(shù)據(jù)點不僅可以通過其輸入變量(代表客戶相似性的聚類)進行聚類,還可以通過其在決策中的變量貢獻進行聚類。

提出的可解釋性模型的目標是傳統(tǒng)銀行以及 P2P 貸款/眾籌的“ fintech ”平臺中信貸組合的風險管理、評估和評分功能。

指導方針和法規(guī)需要模型解釋

AI HLEG 起草的道德準則提出了一種以人為中心的 AI 方法,并列出了 AI 系統(tǒng)應滿足的幾個關鍵要求,以便被認為是可信的。

提出的 SHAP 聚類有助于縮小人工智能的解釋鴻溝。監(jiān)管人員將調整其方法和技能,以支持在銀行業(yè)引入 AI / ML 。銀行需要弄清楚人類在模型監(jiān)管中的位置,并且必須向監(jiān)管人員合理解釋其 AI / ML 系統(tǒng)的實際功能以及目的。

決策必須是知情的,而且必須有人參與監(jiān)督。 SHAP 聚類方法使用戶能夠理解做出決策的原因?!盀槭裁础辈皇且蚬P系,而是表示為輸入變量的數(shù)值貢獻。用戶可以查看特定的數(shù)據(jù)點或集群,并查看輸入變量、變量對預測的貢獻以及預測本身。

一個看似合理的解釋可能會出現(xiàn),使基于機器的決策與“有意義”的人類敘事相協(xié)調。模型可以更好地控制,因為它提供了關于如何在全局層面(全局變量重要性)和局部層面(數(shù)據(jù)點)上做出所有決策的反饋。集群步驟甚至為特定集群的成員提供了可變的貢獻,對于一組客戶也是如此。用戶可以根據(jù)輸入變量識別這組客戶的屬性,以便了解這組客戶的決策過程。所有這些分析功能和工具加上交互式視覺探索,使用戶能夠更好地理解完全黑盒模型的結果。更好的理解導致更有效的控制。

為確保可追溯性,應納入符合最佳標準的文件編制機制。除其他外,這包括用于模型培訓和驗證的數(shù)據(jù)集文檔、任何數(shù)據(jù)標簽的過程和輸出,以及人工智能系統(tǒng)所做決策的明確記錄。

SHAP 聚類方法允許追溯和記錄對決策的可變貢獻。形狀信息的聚類是該方法添加的新信息之一,因此可用于豐富可追溯性和文檔。此外,可以記錄基于新信息改進模型的步驟。

有關該方法及其用例的更多閱讀,請參見出版物“財務風險管理和可解釋、可信、負責任的人工智能’。

結論

SHAP 聚類提供了機器學習模型的局部、全局和組級決策的解釋。這里提供的擴展允許對解釋進行進一步分析。這允許從業(yè)者為基于機器學習的決策構建一個敘述和解釋,以滿足業(yè)務、監(jiān)管和客戶需求。

也許解釋性最重要的方面是受眾。模型解釋的受眾中有許多類型的人和角色:模型構建者、模型檢查者、合規(guī)和治理官、風險經理、產品所有者、高級經理、主管、客戶和監(jiān)管機構。數(shù)據(jù)科學團隊可以理解原始和聚集的 SHAP 信息,銀行或金融科技公司中的大多數(shù)其他人都可以通過培訓理解。這同樣適用于監(jiān)事。對于客戶/和客戶而言,提及哪些變量最重要(可能應告知客戶決策/拒絕的原因)或客戶可以做些什么來改進某些變量以獲得積極決策,這一切都可以從 SHAP 數(shù)據(jù)中得出。形狀信息提供了一個通用、一致和準確的視圖和語言來描述 AI 模型。

關于作者

Jochen Papenbrock 位于德國法蘭克福,在過去的15年中,Jochen一直在金融服務業(yè)人工智能領域擔任各種角色,擔任思想領袖、實施者、研究者和生態(tài)系統(tǒng)塑造者。

Mark J. Bennett 是 NVIDIA 的高級數(shù)據(jù)科學家,他專注于金融機器學習的加速。他擁有南加州大學計算機科學碩士學位和博士學位。來自加州大學洛杉磯分校的計算機科學,并為愛荷華大學和芝加哥大學教授研究生業(yè)務分析。

Emanuel Scoullos 是 NVIDIA 金融服務和技術團隊的數(shù)據(jù)科學家,他專注于 FSI 內的 GPU 應用。此前,他在反洗錢領域的一家初創(chuàng)公司擔任數(shù)據(jù)科學家,應用數(shù)據(jù)科學、分析和工程技術構建機器學習管道。他獲得了博士學位。普林斯頓大學化學工程碩士和羅格斯大學化學工程學士學位。

Miguel Martinez 是 NVIDIA 的高級深度學習數(shù)據(jù)科學家,他專注于 RAPIDS 和 Merlin 。此前,他曾指導過 Udacity 人工智能納米學位的學生。他有很強的金融服務背景,主要專注于支付和渠道。作為一個持續(xù)而堅定的學習者, Miguel 總是在迎接新的挑戰(zhàn)。

John Ashley 目前領導 NVIDIA 的全球金融服務和技術團隊。在此之前,他啟動并領導了 NVIDIA 的專業(yè)服務深度學習實踐和 NVIDIA 深度學習專業(yè)服務合作伙伴計劃,致力于幫助客戶和合作伙伴采用并提供深度學習解決方案。

審核編輯:郭婷

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • NVIDIA
    +關注

    關注

    14

    文章

    4994

    瀏覽量

    103166
  • 機器學習
    +關注

    關注

    66

    文章

    8422

    瀏覽量

    132723
  • 深度學習
    +關注

    關注

    73

    文章

    5504

    瀏覽量

    121229
收藏 人收藏

    評論

    相關推薦

    人工智能推理及神經處理的未來

    、個性化和效率的社會需求,又進一步推動了人工智能技術的集成。此外,不斷發(fā)展的監(jiān)管體系,則強調了合乎倫理道德的人工智能、數(shù)據(jù)隱私和算法透明度的重要,進而指導
    的頭像 發(fā)表于 12-23 11:18 ?249次閱讀
    <b class='flag-5'>人工智能</b>推理及神經處理的未來

    嵌入式和人工智能究竟是什么關系?

    嵌入式和人工智能究竟是什么關系? 嵌入式系統(tǒng)是一種特殊的系統(tǒng),它通常被嵌入到其他設備或機器中,以實現(xiàn)特定功能。嵌入式系統(tǒng)具有非常強的適應和靈活性,能夠根據(jù)用戶需求進行定制化設計。它廣泛應用于各種
    發(fā)表于 11-14 16:39

    《AI for Science:人工智能驅動科學創(chuàng)新》第6章人AI與能源科學讀后感

    和國際合作等多個層面。這些內容讓我更加認識到,在推動人工智能與能源科學融合的過程中,需要不斷探索和創(chuàng)新,以應對各種挑戰(zhàn)和機遇。 最后,通過閱讀這一章,我深刻感受到人工智能對于能源科學的重要。
    發(fā)表于 10-14 09:27

    《AI for Science:人工智能驅動科學創(chuàng)新》第二章AI for Science的技術支撐學習心得

    。 4. 物理與AI的融合 在閱讀過程中,我對于物理與AI的融合有了更加深入的認識。AI for Science不僅依賴于數(shù)據(jù),還需要結合物理定律和原理來確保模型的準確可解釋性。這種融合不僅提高了模型
    發(fā)表于 10-14 09:16

    《AI for Science:人工智能驅動科學創(chuàng)新》第一章人工智能驅動的科學創(chuàng)新學習心得

    的同時,確保其公正、透明度和可持續(xù),是當前和未來科學研究必須面對的重要課題。此外,培養(yǎng)具備AI技能的科研人才,也是推動這一領域發(fā)展的關鍵。 4. 激發(fā)創(chuàng)新思維 閱讀這一章,我被深深啟發(fā)的是
    發(fā)表于 10-14 09:12

    risc-v在人工智能圖像處理應用前景分析

    RISC-V在人工智能圖像處理領域的應用前景十分廣闊,這主要得益于其開源、靈活性和低功耗等特點。以下是對RISC-V在人工智能圖像處理應用前景的詳細分析: 一、RISC-V的基本特點 RISC-V
    發(fā)表于 09-28 11:00

    動態(tài)代理IP的匿名透明度,為主要考慮關鍵!

    動態(tài)代理IP的匿名透明度是用戶選擇代理服務時需要考慮的關鍵因素。根據(jù)用戶的需求和場景,可以選擇不同匿名級別和透明度的代理服務來平衡隱私保護和網絡訪問的需求。
    的頭像 發(fā)表于 09-20 07:36 ?294次閱讀
    動態(tài)代理IP的匿名<b class='flag-5'>性</b>和<b class='flag-5'>透明度</b>,為主要考慮關鍵!

    加州立法推動AI透明度,生成式人工智能迎來數(shù)據(jù)披露新紀元

    的數(shù)據(jù)使用與透明度問題也逐漸成為公眾關注的焦點。8月28日,美國加州立法機構的一項重大舉措——人工智能訓練數(shù)據(jù)透明度法案的通過,標志著該州在推動AI行業(yè)健康發(fā)展、保障公眾權益方面邁出了堅實的一步。
    的頭像 發(fā)表于 08-28 16:20 ?577次閱讀

    FPGA在人工智能中的應用有哪些?

    FPGA(現(xiàn)場可編程門陣列)在人工智能領域的應用非常廣泛,主要體現(xiàn)在以下幾個方面: 一、深度學習加速 訓練和推理過程加速:FPGA可以用來加速深度學習的訓練和推理過程。由于其高并行和低延遲特性
    發(fā)表于 07-29 17:05

    LED透鏡的顏色與透明度基本概念

    如果 LED燈 有透鏡顏色,則無論透鏡透明度如何,LED 在開和關時都會顯示該顏色。如果透鏡顏色為白色或無色,則 LED 有可能發(fā)出白色,另一種顏色或各種顏色的光,然后在關狀態(tài)下返回白色或無色。
    的頭像 發(fā)表于 07-25 09:34 ?438次閱讀

    Mozilla:科技公司廣告透明度工具需進一步完善

    結果表明,X 平臺透明度表現(xiàn)欠佳,僅能通過加載速度較慢的 CSV 文件獲取相關數(shù)據(jù),且缺乏用戶友好型網絡界面;同時,該平臺在目標參數(shù)和接收方數(shù)據(jù)方面亦存在顯著不足,亟待改進。
    的頭像 發(fā)表于 04-17 10:41 ?583次閱讀

    蘋果兩大股東呼吁公司公開人工智能戰(zhàn)略

    據(jù)了解,蘋果公司的重要機構投資者——挪威中央銀行投資管理公司(Norges Bank Investment Management)及法通保險(Legal & General)已向蘋果公司提出明確要求,表達出他們希望蘋果能在提升人工智能方面的數(shù)據(jù)透明度和公開披露。
    的頭像 發(fā)表于 02-28 10:55 ?573次閱讀

    嵌入式人工智能的就業(yè)方向有哪些?

    嵌入式人工智能的就業(yè)方向有哪些? 在新一輪科技革命與產業(yè)變革的時代背景下,嵌入式人工智能成為國家新型基礎建設與傳統(tǒng)產業(yè)升級的核心驅動力。同時在此背景驅動下,眾多名企也紛紛在嵌入式人工智能領域布局
    發(fā)表于 02-26 10:17

    愛立信推出認知軟件新功能

    日前,愛立信宣布在其專為運營商設計的認知軟件組合中,新增采用“可解釋性人工智能(Explainable AI,XAI)”的新功能,進一步加速在網絡設計和優(yōu)化中采用人工智能后的價值轉化。
    的頭像 發(fā)表于 02-22 09:22 ?5260次閱讀

    Cognizant推出支持生成式人工智能的新平臺

    Cognizant,全球領先的信息技術服務公司,近日宣布推出一個革命的平臺——Cognizant Flowsource,旨在為企業(yè)提供下一代軟件工程解決方案。該平臺專注于生成式人工智能(gen AI)的應用,致力于加速軟件開發(fā)進程,并提高代碼質量和
    的頭像 發(fā)表于 02-03 16:11 ?805次閱讀