0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

深度學(xué)習(xí)全新打開方式Google Brain提出概念激活向量新方法

Hf1h_BigDataDig ? 來源:YXQ ? 2019-07-31 14:11 ? 次閱讀

可解釋性仍然是現(xiàn)代深度學(xué)習(xí)應(yīng)用的最大挑戰(zhàn)之一。計算模型和深度學(xué)習(xí)研究的最新進(jìn)展使我們能夠創(chuàng)建極度復(fù)雜的模型,包括數(shù)千隱藏層和數(shù)千萬神經(jīng)元。效果驚人的前沿深度神經(jīng)網(wǎng)絡(luò)模型構(gòu)建相對簡單,但了解這些模型如何創(chuàng)造和使用知識仍然是一個挑戰(zhàn)。

最近,Google Brain團(tuán)隊的研究人員發(fā)表了一篇論文,提出了一種名為概念激活向量(Concept Activation Vectors, CAV)的新方法,它為深度學(xué)習(xí)模型的可解釋性提供了一個新的視角。

可解釋性 vs 準(zhǔn)確性

要理解CAV技術(shù),需要了解深度學(xué)習(xí)模型中可解釋性難題的本質(zhì)。在當(dāng)今一代深度學(xué)習(xí)技術(shù)中,模型的準(zhǔn)確性與可解釋性之間存在著永恒的矛盾。可解釋性-準(zhǔn)確性矛盾存在于完成復(fù)雜知識任務(wù)的能力和理解這些任務(wù)是如何完成能力之間。知識與控制,績效表現(xiàn)與可核查性,效率與簡便性...任意一項抉擇其實都是準(zhǔn)確性和可解釋性之間的權(quán)衡。

你是關(guān)心獲得最佳結(jié)果,還是關(guān)心結(jié)果是如何產(chǎn)生的?這是數(shù)據(jù)科學(xué)家在每個深度學(xué)習(xí)場景中都需要回答的問題。許多深度學(xué)習(xí)技術(shù)本質(zhì)上非常復(fù)雜,盡管它們在許多場景中都很準(zhǔn)確,解釋起來卻非常困難。如果我們在一個準(zhǔn)確性-可解釋性圖表中繪制一些最著名的深度學(xué)習(xí)模型,我們將得到以下結(jié)果:

深度學(xué)習(xí)模型中的可解釋性不是一個單一的概念。我們可以從多個層次理解它:

要得到上圖每層定義的可解釋性,需要幾個基本的構(gòu)建模塊。在最近的一篇論文中,谷歌的研究人員概述了他們看來的一些可解釋性的基本構(gòu)建模塊。

Google總結(jié)了如下幾項可解釋性原則:

- 了解隱藏層的作用:深層學(xué)習(xí)模型中的大部分知識都是在隱藏層中形成的。在宏觀層面理解不同隱藏層的功能對于解釋深度學(xué)習(xí)模型至關(guān)重要。

- 了解節(jié)點的激活方式:可解釋性的關(guān)鍵不在于理解網(wǎng)絡(luò)中各個神經(jīng)元的功能,而在于理解同一空間位置被一起激發(fā)的互連神經(jīng)元群。通過互連神經(jīng)元群對神經(jīng)網(wǎng)絡(luò)進(jìn)行分割能讓我們從一個更簡單的抽象層面來理解其功能。

-理解概念的形成過程:理解深度神經(jīng)網(wǎng)絡(luò)如何形成組成最終輸出的單個概念,這是可解釋性的另一個關(guān)鍵構(gòu)建模塊。

這些原則是Google新CAV技術(shù)背后的理論基礎(chǔ)。

概念激活向量

遵循前文討論的想法,通常所認(rèn)為的可解釋性就是通過深度學(xué)習(xí)模型的輸入特征來描述其預(yù)測。邏輯回歸分類器就是一個典型的例子,其系數(shù)權(quán)重通常被解釋為每個特征的重要性。然而,大多數(shù)深度學(xué)習(xí)模型對諸如像素值之類的特征進(jìn)行操作,這些特征與人類容易理解的高級概念并不對應(yīng)。此外,模型的內(nèi)部值(例如,神經(jīng)元激活)也很晦澀難懂。雖然諸如顯著圖之類的技術(shù)可以有效測量特定像素區(qū)域的重要性,但是它們無法與更高層級的概念相關(guān)聯(lián)。

CAV背后的核心思想是衡量一個概念在模型輸出中的相關(guān)性。概念的CAV就是一組該概念的實例在不同方向的值(例如,激活)構(gòu)成的向量。在論文中,Google研究團(tuán)隊概述了一種名為Testing with CAV(TCAV)的線性可解釋方法,該方法使用偏導(dǎo)數(shù)來量化預(yù)測CAV表示的潛在高級概念的敏感度。他們構(gòu)想TCAV定義有四個目標(biāo):

- 易懂:使用者幾乎不需要機(jī)器學(xué)習(xí)專業(yè)知識。

- 個性化:適應(yīng)任何概念(例如,性別),并且不限于訓(xùn)練中涉及的概念。

- 插入即用:無需重新訓(xùn)練或修改機(jī)器學(xué)習(xí)模型即可運作。

- 全局量化:可以使用單一定量測度來解釋所有類或所有實例,而非僅僅解釋單個數(shù)據(jù)輸入。

為實現(xiàn)上述目標(biāo),TCAV方法分為三個基本步驟:

1)為模型定義相關(guān)概念。

2)理解預(yù)測對這些概念的敏感度。

3)推斷每個概念對每個模型預(yù)測類的相對重要性的全局定量解釋。

TCAV方法的第一步是定義相關(guān)的概念(CAV)。為實現(xiàn)此目的,TCAV選擇一組代表該概念的實例或?qū)ふ覙?biāo)記為該概念的獨立數(shù)據(jù)集。我們可以通過訓(xùn)練線性分類器區(qū)分概念實例產(chǎn)生的激活和各層中的實例來學(xué)習(xí)CAV。

第二步是生成一個TCAV分?jǐn)?shù),用于量化預(yù)測對特定概念的敏感度。TCAV使用了用于衡量ML預(yù)測值在某一概念方向、在激活層對輸入敏感度的偏導(dǎo)數(shù)。

最后一步嘗試評估學(xué)到的CAV的全局相關(guān)性,避免依賴不相關(guān)的CAV。畢竟TCAV技術(shù)的一個缺陷就是可能學(xué)到無意義的CAV,因為使用隨機(jī)選擇的一組圖像仍然能得到CAV,在這種隨機(jī)概念上的測試不太可能有意義。為了應(yīng)對這一難題,TCAV引入了統(tǒng)計顯著性檢驗,該檢驗以隨機(jī)的訓(xùn)練次數(shù)(通常為500次)評估CAV。其基本思想是,有意義的概念應(yīng)該在多次訓(xùn)練中得到一致的TCAV分?jǐn)?shù)。

TCAV的運作

團(tuán)隊進(jìn)行了多次實驗來評估TCAV相比于其他可解釋性方法的效率。在一項最引人注目的測試中,團(tuán)隊使用了一個顯著圖,嘗試預(yù)測出租車這一概念與標(biāo)題或圖像的相關(guān)性。顯著圖的輸出如下所示:

使用這些圖像作為測試數(shù)據(jù)集,Google Brain團(tuán)隊在Amazon Mechanical Turk上邀請50人進(jìn)行了實驗。每個實驗人員執(zhí)行一系列共六個針對單個模型的隨機(jī)順序任務(wù)(3類對象 x 2種顯著圖)。

在每項任務(wù)中,實驗人員首先會看到四幅圖片和相應(yīng)的顯著性蒙版。然后,他們要評估圖像對模型的重要程度(10分制),標(biāo)題對模型的重要程度(10分制),以及他們對答案的自信程度(5分制)。實驗人員總共評定了60個不同的圖像(120個不同的顯著圖)。

實驗的基本事實是圖像概念比標(biāo)題概念更相關(guān)。然而,看顯著圖時,人們認(rèn)為標(biāo)題概念更重要(0%噪聲的模型),或者辨別不出差異(具有100%噪聲的模型)。相比之下,TCAV結(jié)果正確地表明圖像概念更重要。

TCAV是這幾年最具創(chuàng)新性的神經(jīng)網(wǎng)絡(luò)解釋方法之一。初始的代碼可以在GitHub上看到。許多主流深度學(xué)習(xí)框架可能會在不久的將來采用這些想法。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 谷歌
    +關(guān)注

    關(guān)注

    27

    文章

    6223

    瀏覽量

    107520
  • 深度學(xué)習(xí)
    +關(guān)注

    關(guān)注

    73

    文章

    5554

    瀏覽量

    122477

原文標(biāo)題:谷歌大腦發(fā)布概念激活向量,了解神經(jīng)網(wǎng)絡(luò)的思維方式

文章出處:【微信號:BigDataDigest,微信公眾號:大數(shù)據(jù)文摘】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏

    評論

    相關(guān)推薦
    熱點推薦

    岳信儀器告訴你榨汁機(jī)氣密性檢測儀的正確打開方式

    在榨汁機(jī)生產(chǎn)過程中,氣密性是一項關(guān)鍵指標(biāo)。而榨汁機(jī)氣密性檢測儀則是確保產(chǎn)品氣密性達(dá)標(biāo)的重要工具。那么,該如何正確使用它呢?下面就為大家詳細(xì)介紹榨汁機(jī)氣密性檢測儀的正確打開方式。(1)檢測前的準(zhǔn)備工作
    的頭像 發(fā)表于 05-29 15:52 ?90次閱讀
    岳信儀器告訴你榨汁機(jī)氣密性檢測儀的正確<b class='flag-5'>打開方式</b>

    大華股份榮獲中國創(chuàng)新方法大賽一等獎

    近日,備受矚目的2024年中國創(chuàng)新方法大賽全國總決賽在重慶圓滿落下帷幕。此次大賽由中國科協(xié)與重慶市人民政府聯(lián)合主辦,吸引了眾多創(chuàng)新企業(yè)和團(tuán)隊參與,共同展示創(chuàng)新成果,角逐榮譽(yù)獎項。 在這場創(chuàng)新盛宴中
    的頭像 發(fā)表于 12-27 14:50 ?477次閱讀

    基于遺傳算法的QD-SOA設(shè)計新方法

    了QD-SOA的設(shè)計,提出了一種基于遺傳算法的QD-SOA設(shè)計新方法。由于具有用于設(shè)計的模型是必不可少的,因此在第一步中獲得數(shù)值模型。然后,利用從數(shù)值模型中采樣的訓(xùn)練數(shù)據(jù)建立人工神經(jīng)網(wǎng)絡(luò)模型。實驗表明,該神經(jīng)模型具有較高的精度和較
    的頭像 發(fā)表于 12-17 09:58 ?382次閱讀
    基于遺傳算法的QD-SOA設(shè)計<b class='flag-5'>新方法</b>

    一種降低VIO/VSLAM系統(tǒng)漂移的新方法

    本文提出了一種新方法,通過使用點到平面匹配將VIO/VSLAM系統(tǒng)生成的稀疏3D點云與數(shù)字孿生體進(jìn)行對齊,從而實現(xiàn)精確且全球一致的定位,無需視覺數(shù)據(jù)關(guān)聯(lián)。所提方法為VIO/VSLAM系統(tǒng)提供了緊密
    的頭像 發(fā)表于 12-13 11:18 ?589次閱讀
    一種降低VIO/VSLAM系統(tǒng)漂移的<b class='flag-5'>新方法</b>

    大華股份榮獲2024年中國創(chuàng)新方法大賽一等獎

    近日,由中國科協(xié)、重慶市人民政府舉辦的2024年中國創(chuàng)新方法大賽全國總決賽在重慶落下帷幕。大華股份靈活運用創(chuàng)新方法、突破行業(yè)性技術(shù)難題,憑借“不懼強(qiáng)光,分毫必現(xiàn),基于TRIZ的強(qiáng)逆光銳捕技術(shù)”項目,斬獲全國一等獎。
    的頭像 發(fā)表于 12-04 17:19 ?669次閱讀

    利用全息技術(shù)在硅晶圓內(nèi)部制造納米結(jié)構(gòu)的新方法

    本文介紹了一種利用全息技術(shù)在硅晶圓內(nèi)部制造納米結(jié)構(gòu)的新方法。 研究人員提出了一種在硅晶圓內(nèi)部制造納米結(jié)構(gòu)的新方法。傳統(tǒng)上,晶圓上的微結(jié)構(gòu)加工,僅限于通過光刻技術(shù)在晶圓表面加工納米結(jié)構(gòu)。 然而,除了晶
    的頭像 發(fā)表于 11-18 11:45 ?674次閱讀

    Pytorch深度學(xué)習(xí)訓(xùn)練的方法

    掌握這 17 種方法,用最省力的方式,加速你的 Pytorch 深度學(xué)習(xí)訓(xùn)練。
    的頭像 發(fā)表于 10-28 14:05 ?545次閱讀
    Pytorch<b class='flag-5'>深度</b><b class='flag-5'>學(xué)習(xí)</b>訓(xùn)練的<b class='flag-5'>方法</b>

    上海光機(jī)所提出強(qiáng)激光產(chǎn)生高能量子渦旋態(tài)電子新方法

    近期,中國科學(xué)院上海光學(xué)精密機(jī)械研究所強(qiáng)場激光物理國家重點實驗室研究團(tuán)隊發(fā)展了包括軌道角動量量子數(shù)的QED散射理論,并提出強(qiáng)激光產(chǎn)生高能量子渦旋態(tài)電子的新方法。相關(guān)成果以“Generation
    的頭像 發(fā)表于 10-23 10:41 ?444次閱讀
    上海光機(jī)所<b class='flag-5'>提出</b>強(qiáng)激光產(chǎn)生高能量子渦旋態(tài)電子<b class='flag-5'>新方法</b>

    保護(hù)4-20 mA,±20-mA模擬輸入的新方法

    電子發(fā)燒友網(wǎng)站提供《保護(hù)4-20 mA,±20-mA模擬輸入的新方法.pdf》資料免費下載
    發(fā)表于 09-24 09:27 ?0次下載
    保護(hù)4-20 mA,±20-mA模擬輸入的<b class='flag-5'>新方法</b>

    實踐JLink 7.62手動增加新MCU型號支持新方法

    大家好,我是痞子衡,是正經(jīng)搞技術(shù)的痞子。今天痞子衡給大家分享的是實踐JLink 7.62手動增加新MCU型號支持新方法。
    的頭像 發(fā)表于 08-08 15:25 ?1218次閱讀
    實踐JLink 7.62手動增加新MCU型號支持<b class='flag-5'>新方法</b>

    NVIDIA推出全新深度學(xué)習(xí)框架fVDB

    在 SIGGRAPH 上推出的全新深度學(xué)習(xí)框架可用于打造自動駕駛汽車、氣候科學(xué)和智慧城市的 AI 就緒型虛擬表示。
    的頭像 發(fā)表于 08-01 14:31 ?1019次閱讀

    一種無透鏡成像的新方法

    使用OAM-HHG EUV光束對高度周期性結(jié)構(gòu)進(jìn)行成像的EUV聚光顯微鏡 為了研究微電子或光子元件中的納米級圖案,一種基于無透鏡成像的新方法可以實現(xiàn)近乎完美的高分辨率顯微鏡。 層析成像是一種強(qiáng)大的無
    的頭像 發(fā)表于 07-19 06:20 ?683次閱讀
    一種無透鏡成像的<b class='flag-5'>新方法</b>

    新品|酷暑的新打開方式:SXB3568主板

    開源鴻蒙硬件方案領(lǐng)跑者觸覺智能選主板,接口雜太多?成本太高?性能不夠?來看看觸覺智能全新推出基于RockchipRK3568處理器開發(fā)設(shè)計的SXB3568商顯行業(yè)主板,低成本、高性能、全功能模塊拓展
    的頭像 發(fā)表于 07-13 08:33 ?572次閱讀
    新品|酷暑的新<b class='flag-5'>打開方式</b>:SXB3568主板

    深度學(xué)習(xí)中的時間序列分類方法

    的發(fā)展,基于深度學(xué)習(xí)的TSC方法逐漸展現(xiàn)出其強(qiáng)大的自動特征提取和分類能力。本文將從多個角度對深度學(xué)習(xí)在時間序列分類中的應(yīng)用進(jìn)行綜述,探討常用
    的頭像 發(fā)表于 07-09 15:54 ?1924次閱讀

    深度學(xué)習(xí)中的無監(jiān)督學(xué)習(xí)方法綜述

    應(yīng)用中往往難以實現(xiàn)。因此,無監(jiān)督學(xué)習(xí)深度學(xué)習(xí)中扮演著越來越重要的角色。本文旨在綜述深度學(xué)習(xí)中的無監(jiān)督學(xué)
    的頭像 發(fā)表于 07-09 10:50 ?1545次閱讀

    電子發(fā)燒友

    中國電子工程師最喜歡的網(wǎng)站

    • 2931785位工程師會員交流學(xué)習(xí)
    • 獲取您個性化的科技前沿技術(shù)信息
    • 參加活動獲取豐厚的禮品