0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

檢測AI中的常見認(rèn)知偏差

汽車玩家 ? 來源:今日頭條 ? 作者:聞數(shù)起舞 ? 2020-05-03 18:23 ? 次閱讀

在過去的幾年中,隨著AI解決方案在我們的日常生活中越來越根深蒂固,人工智能(AI)的偏見已成為熱門話題。 作為轉(zhuǎn)向數(shù)據(jù)科學(xué)的心理學(xué)家,這個(gè)話題非常貼切。

為了避免使AI模型產(chǎn)生偏差,首先必須意識到存在各種各樣的偏差。

為了檢測偏見,必須意識到它的存在。

為此,本文將指導(dǎo)您解決在開發(fā)AI的不同階段中可能遇到的許多常見和不常見的偏見。 這些階段包括:

· 數(shù)據(jù)采集

· 數(shù)據(jù)預(yù)處理

· 數(shù)據(jù)分析

· 建模

希望,了解您可能遇到的偏見將有助于您開發(fā)偏見較少的AI解決方案。

1.什么是偏見?

偏見被認(rèn)為是對一個(gè)想法或事物的偏愛或偏見。 偏見通常是在人類的背景下想到的,但它可以存在于許多不同的領(lǐng)域:

· 統(tǒng)計(jì)信息-例如,統(tǒng)計(jì)信息的系統(tǒng)失真

· 研究-例如,偏向于發(fā)表某些實(shí)驗(yàn)性重大成果

· 社會科學(xué)-例如,對某些人群的偏見

在本文中,我們將結(jié)合幾個(gè)領(lǐng)域,在這些領(lǐng)域中可能會出現(xiàn)(認(rèn)知)偏差,以了解偏差如何進(jìn)入人工智能。

在下文中,我將經(jīng)歷AI開發(fā)的常見階段,并確定步驟以檢測可能在哪里發(fā)現(xiàn)偏差。

2.數(shù)據(jù)收集

數(shù)據(jù)收集是您會發(fā)現(xiàn)偏見的第一個(gè)也是最常見的地方之一。 造成這種情況的最大原因是,數(shù)據(jù)通常是由人收集或創(chuàng)建的,從而允許錯(cuò)誤,離群值和偏差易于滲入數(shù)據(jù)中。

數(shù)據(jù)收集過程中常見的偏見:

· 選擇偏差-選擇數(shù)據(jù)時(shí)樣本不能代表總體的數(shù)據(jù)選擇

例如,在許多社會研究中,研究人員一直在使用學(xué)生作為參與者,以檢驗(yàn)其假設(shè)。 學(xué)生顯然不能代表一般人群,并且可能會偏向所發(fā)現(xiàn)的結(jié)果。

Selection Bias

· 框架效應(yīng)-調(diào)查以特定傾向構(gòu)建的問題。

如下圖所示,如果這個(gè)問題的答案是肯定的,那么人們更有可能挽救200條生命,而挽救所有人的幾率是33%。

檢測AI中的常見認(rèn)知偏差

當(dāng)出現(xiàn)正構(gòu)架提示(“挽救200條生命”)時(shí),有72%的參與者選擇了治療A,而當(dāng)出現(xiàn)負(fù)構(gòu)架提示(“ 400人將死亡”)時(shí),則下降為22%。

· 系統(tǒng)性偏差-這是一個(gè)一致且可重復(fù)的錯(cuò)誤。

這通常是設(shè)備故障的結(jié)果。 由于此錯(cuò)誤很難檢測,因此更正此錯(cuò)誤很重要。 必須對機(jī)械或過程有充分的了解。

檢測AI中的常見認(rèn)知偏差

Systematic Error

· 回應(yīng)偏見—一系列偏見,參與者對問題的回答不正確或錯(cuò)誤。

答復(fù)偏見經(jīng)常出現(xiàn)在問卷中。 由于這些都是參與者填寫的,因此人為偏見很容易在數(shù)據(jù)中找到。 例如,《社會可取性偏見》指出人們很可能否認(rèn)其反應(yīng)中的不良特征。 這可以通過強(qiáng)調(diào)良好行為或低估不良行為來實(shí)現(xiàn)。 類似地,"問題順序偏向"指出人們可能會根據(jù)問題的順序不同地回答問題。

重要的是要了解,您如何設(shè)計(jì)收集過程會嚴(yán)重影響將要收集的數(shù)據(jù)類型。 如果不小心,您的數(shù)據(jù)將嚴(yán)重偏向某些群體。 任何結(jié)果分析都可能有缺陷!

3.數(shù)據(jù)預(yù)處理

檢測AI中的常見認(rèn)知偏差

處理數(shù)據(jù)時(shí),可以采取許多步驟來準(zhǔn)備進(jìn)行分析:

· 離群值檢測

您通常希望刪除異常值,因?yàn)樗鼈兛赡軐δ承┓治霎a(chǎn)生不成比例的影響。 在所有人都在20到30歲之間的數(shù)據(jù)集中,一個(gè)110歲的人可能不太能代表數(shù)據(jù)。

· 缺失值

您如何處理某些變量的缺失值會引入偏差。 如果要用均值填充所有缺失值,那么您有意將數(shù)據(jù)推向均值。 這可能會使您偏向表現(xiàn)更接近均值的某些群體。

· 篩選資料

我已經(jīng)多次看到這種情況,對數(shù)據(jù)進(jìn)行了如此多的過濾,以致于它幾乎不再代表目標(biāo)人群。 這以某種方式將選擇偏差引入數(shù)據(jù)。

4.數(shù)據(jù)分析

在開發(fā)AI解決方案時(shí),最終產(chǎn)品可能是模型或算法。 但是,在數(shù)據(jù)分析中也很容易發(fā)現(xiàn)偏差。 通常,我們會在數(shù)據(jù)分析中看到以下偏見:

· 誤導(dǎo)圖-扭曲的圖,它歪曲了數(shù)據(jù),因此可能從中得出不正確的結(jié)論。

例如,當(dāng)報(bào)告分析結(jié)果時(shí),數(shù)據(jù)科學(xué)家可以選擇將其圖的y軸從0開始。盡管這不會在數(shù)據(jù)本身中引入偏差,但由于差異似乎是 更明顯(見下圖)。

檢測AI中的常見認(rèn)知偏差

如果Y軸從0%開始,則農(nóng)作物產(chǎn)量的差異似乎很小。但是,簡單地將其更改為從70%開始會產(chǎn)生看似不同的觀點(diǎn),而結(jié)果實(shí)際上是相同的。

如果您想進(jìn)一步了解誤導(dǎo)圖的影響,強(qiáng)烈建議您閱讀"如何利用統(tǒng)計(jì)數(shù)據(jù)撒謊"一書!

· 確認(rèn)偏見—傾向于專注于確認(rèn)先入之見的信息的傾向。

假設(shè)您認(rèn)為癌癥和喝酒之間有很強(qiáng)的關(guān)系。 在執(zhí)行分析時(shí),您僅通過不考慮任何混淆變量來搜索以確認(rèn)該假設(shè)。

檢測AI中的常見認(rèn)知偏差

The confirmation Bias

這似乎是一個(gè)極端的例子,您將永遠(yuǎn)做不到。 但是現(xiàn)實(shí)是,人類天生就有偏見,這很難撼動。 發(fā)生在我身上的次數(shù)比我想承認(rèn)的要多!

5.建模

檢測AI中的常見認(rèn)知偏差

當(dāng)談?wù)揂I的偏見時(shí),人們通常指的是某種程度上有利于特定人群的AI系統(tǒng)。 一個(gè)很好的例子就是亞馬遜創(chuàng)建的招聘算法,該算法在決策中顯示了性別偏見。 他們用于此算法的數(shù)據(jù)主要由擔(dān)任技術(shù)職務(wù)的男性組成,這使其傾向于使用男性作為高潛力候選人。

這是垃圾填充現(xiàn)象的經(jīng)典示例,其中您的AI解決方案僅與您使用的數(shù)據(jù)一樣好。 這就是為什么在開始對數(shù)據(jù)進(jìn)行建模之前檢測數(shù)據(jù)中的偏差如此重要的原因。

讓我們研究一下在創(chuàng)建預(yù)測模型時(shí)經(jīng)常會看到的幾種類型的偏差:

· 偏差/方差折衷-偏差(模型的基本假設(shè))和方差(如果使用不同的數(shù)據(jù),則預(yù)測的變化)之間的折衷。

具有高方差的模型將過多地關(guān)注火車數(shù)據(jù),并且不能很好地推廣。 另一方面,高偏差假定數(shù)據(jù)始終以相同的方式運(yùn)行,這很少是正確的。 當(dāng)增加偏見時(shí),通常會降低方差,反之亦然。 因此,我們經(jīng)常尋求平衡偏見和差異。

檢測AI中的常見認(rèn)知偏差

Demonstrating the effect of the trade-off between bias and variance.

· 概念漂移–一種現(xiàn)象,目標(biāo)變量的統(tǒng)計(jì)屬性會隨時(shí)間發(fā)生意外變化。

假設(shè)您創(chuàng)建了一個(gè)模型,可以預(yù)測在線商店中客戶的行為。 該模型起初很棒,但一年后性能下降。 發(fā)生的事情是客戶的行為在過去一年中發(fā)生了變化。 客戶行為的概念已經(jīng)改變,并對模型的質(zhì)量產(chǎn)生負(fù)面影響。

解決方案可能只是簡單地使用新數(shù)據(jù)重新訓(xùn)練您的模型,以便及時(shí)掌握新行為。 但是,可能需要一個(gè)全新的模型。

檢測AI中的常見認(rèn)知偏差

The original data (left) versus concept drift (right) after time has passed and new data was added.

· 分類不平衡-(目標(biāo))分類頻率的極端不平衡。

假設(shè)您要對圖片包含貓還是狗進(jìn)行分類。 如果您有1000張狗的照片而只有10張貓的照片,則存在類不平衡。

階級失衡的結(jié)果是該模型可能偏向多數(shù)階級。 由于數(shù)據(jù)中的大多數(shù)圖片都是狗,因此該模型只需要始終猜測"狗"即可達(dá)到99%的準(zhǔn)確率。 實(shí)際上,該模型尚未了解到貓和狗的圖片之間的差異。 可以通過選擇正確的驗(yàn)證措施(例如,平衡準(zhǔn)確度或F1得分而不是準(zhǔn)確度)來補(bǔ)救。

6.接下來是什么?

在了解了AI解決方案中的所有這些潛在偏見之后,您可能會認(rèn)為:

"但是我該如何消除解決方案中的偏見?"

我認(rèn)為,要解決偏見,您需要了解其根源。 知道是成功的一半。 之后,由您自己確定消除或處理該特定偏差的方法。 例如,如果您發(fā)現(xiàn)問題是由于數(shù)據(jù)中的選擇偏差引起的,那么最好添加其他數(shù)據(jù)。 如果類別不平衡使您的模型更偏向多數(shù)群體,那么您可以研究重采樣策略(例如SMOTE)。

注意:有關(guān)常見認(rèn)知偏差的交互式概述,請參見此驚人的可視化。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報(bào)投訴
  • AI
    AI
    +關(guān)注

    關(guān)注

    87

    文章

    31028

    瀏覽量

    269371
  • 人工智能
    +關(guān)注

    關(guān)注

    1792

    文章

    47373

    瀏覽量

    238866
收藏 人收藏

    評論

    相關(guān)推薦

    電源檢測設(shè)備如何解決常見問題?

    電源檢測設(shè)備是用于確保電氣系統(tǒng)和設(shè)備正常運(yùn)行的重要工具。它們可以幫助識別和解決各種與電源相關(guān)的問題,包括電壓不穩(wěn)、電流過大、接地問題等。以下是一些常見的電源問題以及電源檢測設(shè)備如何解決這些
    發(fā)表于 01-02 16:10

    常見晶振故障及解決方法 晶振在物聯(lián)網(wǎng)的應(yīng)用

    常見晶振故障及解決方法 晶振(Crystal Oscillator)是一種利用石英晶體的壓電效應(yīng)來產(chǎn)生穩(wěn)定振蕩頻率的電子元件,廣泛應(yīng)用于各種電子設(shè)備,包括物聯(lián)網(wǎng)(IoT)設(shè)備。晶振的穩(wěn)定性和準(zhǔn)確性
    的頭像 發(fā)表于 12-09 09:34 ?388次閱讀

    電子電器氣密性檢測儀使用方法:操作常見錯(cuò)誤與糾正

    電子電器氣密性檢測儀是確保產(chǎn)品質(zhì)量的關(guān)鍵設(shè)備,但在使用過程,操作人員常犯一些錯(cuò)誤,導(dǎo)致測試結(jié)果不準(zhǔn)確或儀器損壞。以下是一些常見的操作錯(cuò)誤及其糾正方法,旨在幫助操作人員正確使用氣密性檢測
    的頭像 發(fā)表于 11-29 11:20 ?180次閱讀
    電子電器氣密性<b class='flag-5'>檢測</b>儀使用方法:操作<b class='flag-5'>中</b>的<b class='flag-5'>常見</b>錯(cuò)誤與糾正

    AI干貨補(bǔ)給站04 | 工業(yè)AI視覺檢測項(xiàng)目實(shí)施第三步:模型構(gòu)建

    在當(dāng)今智能制造的浪潮,AI視覺檢測技術(shù)憑借其高效、精準(zhǔn)的特性,已然成為提升產(chǎn)品質(zhì)量和生產(chǎn)效率的重要工具。為了助力從業(yè)者更好地理解和實(shí)施AI視覺檢測
    的頭像 發(fā)表于 11-29 01:04 ?193次閱讀
    <b class='flag-5'>AI</b>干貨補(bǔ)給站04 | 工業(yè)<b class='flag-5'>AI</b>視覺<b class='flag-5'>檢測</b>項(xiàng)目實(shí)施第三步:模型構(gòu)建

    直播報(bào)名丨第4講:AI檢測系統(tǒng)落地工具詳解

    阿丘工業(yè)AI學(xué)堂上線“AI檢測系統(tǒng)開發(fā)實(shí)戰(zhàn)”系列課程,全面涵蓋AI檢測系統(tǒng)開發(fā)從理論到實(shí)踐、從算法選擇到系統(tǒng)落地的各個(gè)關(guān)鍵環(huán)節(jié),助力您快速了
    的頭像 發(fā)表于 11-23 01:05 ?140次閱讀
    直播報(bào)名丨第4講:<b class='flag-5'>AI</b><b class='flag-5'>檢測</b>系統(tǒng)落地工具詳解

    直播報(bào)名丨第2講:熱門AI檢測案例解析

    阿丘工業(yè)AI學(xué)堂上線“AI檢測系統(tǒng)開發(fā)實(shí)戰(zhàn)”系列課程,全面涵蓋AI檢測系統(tǒng)開發(fā)從理論到實(shí)踐、從算法選擇到系統(tǒng)落地的各個(gè)關(guān)鍵環(huán)節(jié),助力您快速了
    的頭像 發(fā)表于 11-12 01:05 ?205次閱讀
    直播報(bào)名丨第2講:熱門<b class='flag-5'>AI</b><b class='flag-5'>檢測</b>案例解析

    莫拉維克悖論與多模態(tài)AI:邁向機(jī)器人認(rèn)知的新時(shí)代

    莫拉維克悖論揭示了人工智能系統(tǒng)在處理高級推理與基本感知運(yùn)動技能上的巨大差異。對于AI而言,復(fù)雜的邏輯任務(wù)似乎比人類習(xí)以為常的感知運(yùn)動技能更容易實(shí)現(xiàn)。這一悖論凸顯了當(dāng)前AI與人類認(rèn)知能力之間的鴻溝。
    的頭像 發(fā)表于 10-26 15:00 ?640次閱讀

    檢測系統(tǒng)中常見的信號類型有哪些

    檢測系統(tǒng),常見的信號類型多種多樣,這些信號類型根據(jù)被測物理量的不同而有所區(qū)別。以下是一些常見的信號類型: 位移信號 :位移信號是檢測系統(tǒng)
    的頭像 發(fā)表于 10-15 13:57 ?603次閱讀

    THS3491反相放大相位偏差怎么解決?

    實(shí)際電路設(shè)計(jì)拿THS3491做反相放大,仿真發(fā)現(xiàn)輸入輸出相位不是偏差180度。 使用THS3491手冊上的圖62電路做仿真,同樣發(fā)現(xiàn)輸入輸出相位不是偏差180度。見下圖。請問該這么解決,多謝
    發(fā)表于 08-07 07:57

    甲烷濃度檢測儀中常見檢測技術(shù)及其應(yīng)用

    甲烷濃度檢測儀中常見檢測技術(shù)及其應(yīng)用
    的頭像 發(fā)表于 07-08 10:47 ?659次閱讀
    甲烷濃度<b class='flag-5'>檢測</b>儀中<b class='flag-5'>常見</b>的<b class='flag-5'>檢測</b>技術(shù)及其應(yīng)用

    新一代智能插件AOI用極速編程顛覆了傳統(tǒng)AOI認(rèn)知

    為了解決傳統(tǒng)AOI自動光學(xué)檢測設(shè)備存在的問題,新一代AI視覺前沿技術(shù)公司將神經(jīng)網(wǎng)路深度學(xué)習(xí)算法應(yīng)用于AOI,匠心打造了D系列產(chǎn)品,用極速編程顛覆了傳統(tǒng)AOI認(rèn)知
    的頭像 發(fā)表于 06-25 15:00 ?775次閱讀
    新一代智能插件AOI用極速編程顛覆了傳統(tǒng)AOI<b class='flag-5'>認(rèn)知</b>

    三星電容的容量偏差范圍是多少?

    三星電容的容量偏差范圍取決于具體的電容型號、規(guī)格以及精度等級。容量偏差范圍通常用來描述實(shí)際電容量與標(biāo)稱電容量之間的最大允許偏差,這是電容器性能的一個(gè)重要指標(biāo)。 ? 在三星電容,常用的
    的頭像 發(fā)表于 05-21 14:18 ?473次閱讀

    搭載星火認(rèn)知大模型的AI鼠標(biāo):一鍵呼出AI助手,辦公更高效

    搭載星火認(rèn)知大模型的AI鼠標(biāo):一鍵呼出AI助手,辦公更高效 在這個(gè)AI時(shí)代,如果你想在激烈競爭的職場不被淘汰,訊飛
    的頭像 發(fā)表于 03-25 11:52 ?510次閱讀
    搭載星火<b class='flag-5'>認(rèn)知</b>大模型的<b class='flag-5'>AI</b>鼠標(biāo):一鍵呼出<b class='flag-5'>AI</b>助手,辦公更高效

    AI時(shí)代怎么樣不被淘汰?訊飛AI鼠標(biāo)助力你在AI時(shí)代成長

    功能的智能鼠標(biāo),將成為你躋身AI時(shí)代的利器。 下面來聊聊訊飛AI鼠標(biāo)都有哪些令人驚艷的AI功能吧 1.星火認(rèn)知大模型AI助你探索無限可能 訊
    的頭像 發(fā)表于 03-23 11:41 ?715次閱讀
    <b class='flag-5'>AI</b>時(shí)代怎么樣不被淘汰?訊飛<b class='flag-5'>AI</b>鼠標(biāo)助力你在<b class='flag-5'>AI</b>時(shí)代成長

    愛立信推出認(rèn)知軟件新功能

    日前,愛立信宣布在其專為運(yùn)營商設(shè)計(jì)的認(rèn)知軟件組合,新增采用“可解釋性人工智能(Explainable AI,XAI)”的新功能,進(jìn)一步加速在網(wǎng)絡(luò)設(shè)計(jì)和優(yōu)化采用人工智能后的價(jià)值轉(zhuǎn)化。
    的頭像 發(fā)表于 02-22 09:22 ?5261次閱讀