0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

如何用不確定性解決模型問(wèn)題

zhKF_jqr_AI ? 來(lái)源:未知 ? 作者:李倩 ? 2018-09-07 09:45 ? 次閱讀

隨著深度神經(jīng)網(wǎng)絡(luò)功能越來(lái)越強(qiáng)大,它們的結(jié)構(gòu)也越來(lái)越復(fù)雜。這些復(fù)雜結(jié)構(gòu)也帶來(lái)了新的問(wèn)題,即模型的可解釋性。

想創(chuàng)建穩(wěn)定、不易受對(duì)抗樣本攻擊的模型,可解釋性是很重要的。另外,為新的研究領(lǐng)域設(shè)計(jì)模型也是一項(xiàng)富有挑戰(zhàn)的工作,如果能了解模型在做什么,可以對(duì)這一過(guò)程有所幫助。

過(guò)去幾年,為了對(duì)模型的可解釋性加以研究,研究者們提出了多種方法,包括:

LIME:通過(guò)局部線性近似值計(jì)算解釋模型的預(yù)測(cè)

Activation Maximization:一種能了解那種輸入模式可以生成最大的模型回應(yīng)的方法

特征可視化

在低維解釋空間中嵌入一個(gè)DNN圖層

從認(rèn)知心理學(xué)中借鑒方法

不確定性估計(jì)法——本文關(guān)注的重點(diǎn)

在我們開(kāi)始研究如何用不確定性解決模型問(wèn)題、解釋模型之前,首先讓我們了解一下為什么不確定性如此重要。

你為什么應(yīng)該關(guān)注不確定性?

一個(gè)重要的例子就是高風(fēng)險(xiǎn)的應(yīng)用,假設(shè)你正在創(chuàng)建一個(gè)模型,可以幫助醫(yī)生判斷病人的嚴(yán)重程度。在這種情況下,我們不應(yīng)該僅僅關(guān)心模型的精確度,更要關(guān)注模型對(duì)其預(yù)測(cè)結(jié)果有多大程度的肯定。如果不確定性太高,醫(yī)生需要謹(jǐn)慎決策。

自動(dòng)駕駛汽車(chē)是另外一個(gè)有趣的例子。如果模型不確定是否有行人在馬路上,我們可以利用這一信息讓車(chē)子減速,或者發(fā)出警報(bào)讓駕駛員手動(dòng)操作。

不確定性還可以在缺乏數(shù)據(jù)樣本的情況下幫助我們。如果模型不是在與樣本相似的數(shù)據(jù)上訓(xùn)練的,它可能無(wú)法輸出想要的結(jié)果。谷歌照片曾經(jīng)將黑種人錯(cuò)誤地認(rèn)成了大猩猩,就是由于這個(gè)原因,種類(lèi)單一的訓(xùn)練集可能導(dǎo)致令人尷尬的結(jié)果。

不確定性的最大用途,也是本文的主要目的,就是為模型排除錯(cuò)誤。首先,讓我們了解一下不確定性都有哪幾種不同類(lèi)型。

不確定性的種類(lèi)

不確定性和模型都有多個(gè)種類(lèi),每一種都有不同的用處。

模型不確定性,又稱(chēng)認(rèn)知不確定性(epistemic uncertainty):假設(shè)你有一個(gè)單一數(shù)據(jù)點(diǎn),想知道哪種線性模型是最適合數(shù)據(jù)的。但是沒(méi)有數(shù)據(jù)的話,我們根本無(wú)法判斷,所以需要更多數(shù)據(jù)!

認(rèn)知不確定性是由于模型的參數(shù)不確定。我們不知道模型的哪個(gè)權(quán)重能最好地表現(xiàn)數(shù)據(jù),但是數(shù)據(jù)越多,不確定性越低。這種類(lèi)型的不確定性在數(shù)據(jù)較少的高風(fēng)險(xiǎn)應(yīng)用中很重要。

再比如,你想搭建一個(gè)模型,要在一系列動(dòng)物圖片中預(yù)測(cè)哪種動(dòng)物會(huì)吃掉你。假設(shè)你在訓(xùn)練時(shí)給模型提供的都是獅子和長(zhǎng)頸鹿的照片,現(xiàn)在模型看到了一張僵尸照片。由于之前它沒(méi)有見(jiàn)過(guò)僵尸,所以這里的不確定性就非常高。如果在訓(xùn)練時(shí)能提供足夠的僵尸照片,那么模型的不確定性會(huì)隨之減少。

數(shù)據(jù)不確定性,也被稱(chēng)為“任意不確定性”:能夠捕捉觀察中的噪聲。有時(shí)環(huán)境本身是隨機(jī)的,收集更多數(shù)據(jù)并不會(huì)使不確定性降低,因?yàn)樵肼晛?lái)源于數(shù)據(jù)本身。

為了了解這一點(diǎn),讓我們回顧剛才的動(dòng)物園模型。我們的模型能認(rèn)出含有獅子的圖像,它也許會(huì)判斷你會(huì)被吃掉。但如果獅子此時(shí)此刻并不餓呢?這就是來(lái)源于數(shù)據(jù)的不確定性。另一個(gè)案例是兩條看起來(lái)一模一樣的蛇,一條有毒而另一條無(wú)毒。

數(shù)據(jù)不確定性可以分為兩種類(lèi)別:

同方差性不確定:對(duì)所有輸入來(lái)說(shuō),不確定性都是相同的;

異方差性不確定:不確定性根據(jù)不同的輸入有不同差別。例如,對(duì)于一個(gè)可以預(yù)測(cè)圖像中物體深度的模型,一面墻就比一條漸漸消失的線不確定性要高。

測(cè)量不確定性:顧名思義,當(dāng)測(cè)量方法充滿噪音時(shí),不確定性就會(huì)增加。在上述動(dòng)物的案例中,如果某些圖片拍攝的質(zhì)量不好,就會(huì)損害模型的置信度。

噪聲標(biāo)簽:在監(jiān)督式學(xué)習(xí)下,我們用標(biāo)簽訓(xùn)練模型。如果標(biāo)簽太嘈雜,不確定性將會(huì)增加。

以上就是幾種不確定性的類(lèi)型,在這一系列的后續(xù)文章中,我們會(huì)詳細(xì)解釋?,F(xiàn)在,讓我們假設(shè)有一個(gè)黑箱模型,此時(shí)針對(duì)預(yù)測(cè)結(jié)果出現(xiàn)了不確定,我們應(yīng)該如何用它為模型糾錯(cuò)呢?

這里我們以自己的模型為例,該模型是預(yù)測(cè)用戶點(diǎn)擊某個(gè)推薦內(nèi)容的概率,我們稱(chēng)為CTR(Click Through Rate)。

利用不確定性進(jìn)行debug

模型的嵌入向量表現(xiàn)出了很多分類(lèi)特征,模型可能很難學(xué)習(xí)特殊值的泛化嵌入。一種常見(jiàn)的解決方法是用一種特殊的詞匯表之外(OOV)的嵌入。

每篇推薦文章都有一個(gè)廣告主(advertiser),所有珍貴的廣告主都有同樣的OOV嵌入,所以,從模型的角度,他們實(shí)際上是一個(gè)廣告主。這個(gè)OOV廣告主有很多不同的項(xiàng)目,每個(gè)都有不同的CTR。如果我們只有廣告主作為CTR的預(yù)測(cè)器,那我們應(yīng)該會(huì)得到OOV的高度不確定性。

為了驗(yàn)證模型的輸出符合OOV的高度不確定性,我們用一個(gè)驗(yàn)證集,將所有廣告主的嵌入轉(zhuǎn)化為OOV。之后,我們開(kāi)始觀察轉(zhuǎn)化前后,不確定性有什么變化。如此前預(yù)測(cè)的那樣,不確定性在變化之后增加。模型應(yīng)該能學(xué)習(xí)到,當(dāng)給予了信息廣告主,它應(yīng)該減少不確定性。

我們可以對(duì)不同特征重復(fù)這一過(guò)程,看它們的不確定性如何改變。

我們甚至可以做得更加精細(xì):一些廣告主在不同的項(xiàng)目之間的CTR不同,而其他的項(xiàng)目幾乎有相同的CTR。我們希望模型能對(duì)前者有較高的不確定性。一種有效的分析是觀察不確定性和CTR之間的相關(guān)性。如果呈負(fù)相關(guān),那就意味著模型無(wú)法學(xué)習(xí)不確定性和每個(gè)廣告主之間的關(guān)系。這一工具讓我們了解了,如果在訓(xùn)練過(guò)程中或模型結(jié)構(gòu)中有某一部分出了錯(cuò),我們可以怎樣解決它。

我們還可以進(jìn)行相似的分析,看看如果不確定性與特殊項(xiàng)目連接,是否會(huì)減少更多。另外,我們希望模型對(duì)輸出的結(jié)果更加確定,如果不確定,我們會(huì)盡力修復(fù)模型!

另一個(gè)例子是題目特征:含有不常見(jiàn)詞語(yǔ)的標(biāo)題通常具有高不確定性。這是由于模型不經(jīng)常看到這類(lèi)詞語(yǔ)。我們可以在含有相似題目的驗(yàn)證集中對(duì)模型進(jìn)行驗(yàn)證,估計(jì)模型對(duì)這些標(biāo)題的不確定性是多少。然后重新用這些標(biāo)題訓(xùn)練模型,看看不確定性是否會(huì)下降:

結(jié)語(yǔ)

在很多領(lǐng)域中,不確定性是很重要的問(wèn)題,更重要的是根據(jù)不同應(yīng)用確定不確定性的種類(lèi),然后據(jù)此解決模型的問(wèn)題。這篇文章我們討論了如何利用不確定性對(duì)模型進(jìn)行debug,在下一篇文章中,我們會(huì)講解如何用不同方法從模型中獲得不確定性的估值。

聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 神經(jīng)網(wǎng)絡(luò)

    關(guān)注

    42

    文章

    4810

    瀏覽量

    102921
  • 模型
    +關(guān)注

    關(guān)注

    1

    文章

    3499

    瀏覽量

    50070
  • 自動(dòng)駕駛
    +關(guān)注

    關(guān)注

    788

    文章

    14225

    瀏覽量

    169718

原文標(biāo)題:用模型不確定性理解模型

文章出處:【微信號(hào):jqr_AI,微信公眾號(hào):論智】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    如何創(chuàng)造可信任的機(jī)器學(xué)習(xí)模型?先要理解不確定性

    。 在談到人工智能安全、風(fēng)險(xiǎn)管理、投資組合優(yōu)化、科學(xué)測(cè)量和保險(xiǎn)時(shí),人們都會(huì)提到「不確定性(uncertainty)」的概念。下面有幾個(gè)人們言語(yǔ)中涉及不確定性的例子: 「我們想讓機(jī)器學(xué)習(xí)模型知道它們不知道的東西?!?「負(fù)責(zé)診斷病人
    發(fā)表于 01-10 10:42 ?1148次閱讀
    如何創(chuàng)造可信任的機(jī)器學(xué)習(xí)<b class='flag-5'>模型</b>?先要理解<b class='flag-5'>不確定性</b>

    去嵌入和不確定性是否使用了正確的設(shè)置

    大家好,所以我遇到的問(wèn)題是確定用于測(cè)試夾具糾錯(cuò)過(guò)程的適配器特征的不確定性。我們將使用適配器及其s2p文件對(duì)測(cè)試夾具中的所有信號(hào)路徑進(jìn)行路徑表征,然后移除以進(jìn)行性能測(cè)試。這個(gè)過(guò)程在不確定性計(jì)算器中被
    發(fā)表于 09-27 15:47

    是否可以使用全雙端口校準(zhǔn)中的S11不確定性來(lái)覆蓋單端口校準(zhǔn)的不確定性

    我們一直在使用Agilent VNA不確定度計(jì)算器電子表格,讓我們了解我們測(cè)量的設(shè)備的不確定性。有關(guān)單端口校準(zhǔn)的問(wèn)題:目前您必須從電子表格中選擇您的VNA(帶寬和平均值),然后選擇校準(zhǔn)類(lèi)型(全雙端口
    發(fā)表于 12-29 16:32

    N5531S TRFL不確定性

    我正在嘗試使用N5531S(選擇550傳感器)測(cè)量接收器系統(tǒng)測(cè)量0到-130dBm的絕對(duì)功率水平,然后計(jì)算它的不確定性。安捷倫的應(yīng)用筆記已經(jīng)提到,不確定度可以使用公式+/-計(jì)算(功率計(jì)范圍2-4
    發(fā)表于 02-19 15:40

    測(cè)試系統(tǒng)不確定性分析

    測(cè)試系統(tǒng)不確定性分析
    發(fā)表于 09-18 09:19

    傅里葉變換與不確定性看了就知道

    傅里葉變換與不確定性
    發(fā)表于 12-30 06:41

    基于RFID技術(shù)的供應(yīng)鏈管理項(xiàng)目存在哪些不確定性?

    基于RFID技術(shù)的供應(yīng)鏈管理項(xiàng)目存在哪些不確定性?項(xiàng)目嵌入的實(shí)物期權(quán)類(lèi)型有哪幾種?
    發(fā)表于 05-28 07:08

    運(yùn)算放大器的開(kāi)環(huán)電壓增益有哪些不確定性?

    運(yùn)算放大器的開(kāi)環(huán)電壓增益的值有多大?運(yùn)算放大器的開(kāi)環(huán)電壓增益有哪些不確定性?如何去解決?
    發(fā)表于 07-19 09:11

    基于矩陣分析的一種不確定性推理的數(shù)據(jù)融合方法

    用不確定性推理的矩陣分析方法,建立了用于目標(biāo)識(shí)別的多傳感器數(shù)據(jù)融合的數(shù)學(xué)模型. 該模型綜合了來(lái)自多種不同傳感器的基于正態(tài)分布的檢測(cè)數(shù)據(jù),通過(guò)定義相關(guān)系數(shù)矩陣來(lái)獲
    發(fā)表于 07-04 11:18 ?16次下載

    基于矩陣分析的一種不確定性推理的數(shù)據(jù)融合方法

    用不確定性推理的矩陣分析方法,建立了用于目標(biāo)識(shí)別的多傳感器數(shù)據(jù)融合的數(shù)學(xué)模型.該模型綜合了來(lái)自多種不同傳感器的基于正態(tài)分布的檢測(cè)數(shù)據(jù),通過(guò)定義相關(guān)系數(shù)矩陣來(lái)獲
    發(fā)表于 07-09 14:16 ?28次下載

    考慮模型參數(shù)不確定性的航天器姿態(tài)機(jī)動(dòng)控制

    考慮模型參數(shù)不確定性的航天器姿態(tài)機(jī)動(dòng)控制_李隆
    發(fā)表于 01-07 18:21 ?0次下載

    一種求解動(dòng)態(tài)及不確定性優(yōu)化問(wèn)題的新方法

    一種求解動(dòng)態(tài)及不確定性優(yōu)化問(wèn)題的新方法_劉曉
    發(fā)表于 01-07 18:56 ?0次下載

    基于云模型可靠性數(shù)據(jù)不確定性評(píng)價(jià)

    為了分析和評(píng)價(jià)系統(tǒng)可靠性數(shù)據(jù)中的不確定性,即隨機(jī)性、離散性和模糊性,將云模型與空間故障樹(shù)( space fault tree,SFT)理論相結(jié)合,使用云化SFT作為基礎(chǔ)對(duì)數(shù)據(jù)不確定性進(jìn)行評(píng)價(jià)。首先
    發(fā)表于 01-17 17:39 ?1次下載

    知識(shí)系統(tǒng)中的不確定性分析和概念漂移綜述

    概念漂移探測(cè)是數(shù)據(jù)流挖掘的一個(gè)硏究重點(diǎn),不確定性分析是粗糙集理論的硏究核心之一。大數(shù)據(jù)、數(shù)據(jù)流中存在不確定變化和概念漂移現(xiàn)象,但是,除F粗糙集外,幾乎所有的粗糙集模型都是靜態(tài)模型或半動(dòng)
    發(fā)表于 04-28 11:22 ?1次下載
    知識(shí)系統(tǒng)中的<b class='flag-5'>不確定性</b>分析和概念漂移綜述

    科技云報(bào)到:數(shù)字化轉(zhuǎn)型,從不確定性確定性的關(guān)鍵路徑

    科技云報(bào)到:數(shù)字化轉(zhuǎn)型,從不確定性確定性的關(guān)鍵路徑
    的頭像 發(fā)表于 11-16 16:52 ?685次閱讀
    科技云報(bào)到:數(shù)字化轉(zhuǎn)型,從<b class='flag-5'>不確定性</b>到<b class='flag-5'>確定性</b>的關(guān)鍵路徑

    電子發(fā)燒友

    中國(guó)電子工程師最喜歡的網(wǎng)站

    • 2931785位工程師會(huì)員交流學(xué)習(xí)
    • 獲取您個(gè)性化的科技前沿技術(shù)信息
    • 參加活動(dòng)獲取豐厚的禮品