欧美日韩精品综合,久久精品夜夜夜夜夜久久,欧美一区二区人人喊爽

在過去的幾年中，隨著AI解決方案在我們的日常生活中越來越根深蒂固，人工智能（AI）的偏見已成為熱門話題。作為轉(zhuǎn)向數(shù)據(jù)科學(xué)的心理學(xué)家，這個(gè)話題非常貼切。

為了避免使AI模型產(chǎn)生偏差，首先必須意識到存在各種各樣的偏差。

為了檢測偏見，必須意識到它的存在。

為此，本文將指導(dǎo)您解決在開發(fā)AI的不同階段中可能遇到的許多常見和不常見的偏見。這些階段包括：

· 數(shù)據(jù)采集

· 數(shù)據(jù)預(yù)處理

· 數(shù)據(jù)分析

· 建模

希望，了解您可能遇到的偏見將有助于您開發(fā)偏見較少的AI解決方案。

1.什么是偏見？

偏見被認(rèn)為是對一個(gè)想法或事物的偏愛或偏見。偏見通常是在人類的背景下想到的，但它可以存在于許多不同的領(lǐng)域：

· 統(tǒng)計(jì)信息-例如，統(tǒng)計(jì)信息的系統(tǒng)失真

· 研究-例如，偏向于發(fā)表某些實(shí)驗(yàn)性重大成果

· 社會科學(xué)-例如，對某些人群的偏見

在本文中，我們將結(jié)合幾個(gè)領(lǐng)域，在這些領(lǐng)域中可能會出現(xiàn)（認(rèn)知）偏差，以了解偏差如何進(jìn)入人工智能。

在下文中，我將經(jīng)歷AI開發(fā)的常見階段，并確定步驟以檢測可能在哪里發(fā)現(xiàn)偏差。

2.數(shù)據(jù)收集

數(shù)據(jù)收集是您會發(fā)現(xiàn)偏見的第一個(gè)也是最常見的地方之一。造成這種情況的最大原因是，數(shù)據(jù)通常是由人收集或創(chuàng)建的，從而允許錯(cuò)誤，離群值和偏差易于滲入數(shù)據(jù)中。

數(shù)據(jù)收集過程中常見的偏見：

· 選擇偏差-選擇數(shù)據(jù)時(shí)樣本不能代表總體的數(shù)據(jù)選擇

例如，在許多社會研究中，研究人員一直在使用學(xué)生作為參與者，以檢驗(yàn)其假設(shè)。學(xué)生顯然不能代表一般人群，并且可能會偏向所發(fā)現(xiàn)的結(jié)果。

Selection Bias

· 框架效應(yīng)-調(diào)查以特定傾向構(gòu)建的問題。

如下圖所示，如果這個(gè)問題的答案是肯定的，那么人們更有可能挽救200條生命，而挽救所有人的幾率是33％。

檢測AI中的常見認(rèn)知偏差

當(dāng)出現(xiàn)正構(gòu)架提示（“挽救200條生命”）時(shí)，有72％的參與者選擇了治療A，而當(dāng)出現(xiàn)負(fù)構(gòu)架提示（“ 400人將死亡”）時(shí)，則下降為22％。

· 系統(tǒng)性偏差-這是一個(gè)一致且可重復(fù)的錯(cuò)誤。

這通常是設(shè)備故障的結(jié)果。由于此錯(cuò)誤很難檢測，因此更正此錯(cuò)誤很重要。必須對機(jī)械或過程有充分的了解。

檢測AI中的常見認(rèn)知偏差

Systematic Error

· 回應(yīng)偏見—一系列偏見，參與者對問題的回答不正確或錯(cuò)誤。

答復(fù)偏見經(jīng)常出現(xiàn)在問卷中。由于這些都是參與者填寫的，因此人為偏見很容易在數(shù)據(jù)中找到。例如，《社會可取性偏見》指出人們很可能否認(rèn)其反應(yīng)中的不良特征。這可以通過強(qiáng)調(diào)良好行為或低估不良行為來實(shí)現(xiàn)。類似地，"問題順序偏向"指出人們可能會根據(jù)問題的順序不同地回答問題。

重要的是要了解，您如何設(shè)計(jì)收集過程會嚴(yán)重影響將要收集的數(shù)據(jù)類型。如果不小心，您的數(shù)據(jù)將嚴(yán)重偏向某些群體。任何結(jié)果分析都可能有缺陷！

3.數(shù)據(jù)預(yù)處理

檢測AI中的常見認(rèn)知偏差

處理數(shù)據(jù)時(shí)，可以采取許多步驟來準(zhǔn)備進(jìn)行分析：

· 離群值檢測

您通常希望刪除異常值，因?yàn)樗鼈兛赡軐δ承┓治霎a(chǎn)生不成比例的影響。在所有人都在20到30歲之間的數(shù)據(jù)集中，一個(gè)110歲的人可能不太能代表數(shù)據(jù)。

· 缺失值

您如何處理某些變量的缺失值會引入偏差。如果要用均值填充所有缺失值，那么您有意將數(shù)據(jù)推向均值。這可能會使您偏向表現(xiàn)更接近均值的某些群體。

· 篩選資料

我已經(jīng)多次看到這種情況，對數(shù)據(jù)進(jìn)行了如此多的過濾，以致于它幾乎不再代表目標(biāo)人群。這以某種方式將選擇偏差引入數(shù)據(jù)。

4.數(shù)據(jù)分析

在開發(fā)AI解決方案時(shí)，最終產(chǎn)品可能是模型或算法。但是，在數(shù)據(jù)分析中也很容易發(fā)現(xiàn)偏差。通常，我們會在數(shù)據(jù)分析中看到以下偏見：

· 誤導(dǎo)圖-扭曲的圖，它歪曲了數(shù)據(jù)，因此可能從中得出不正確的結(jié)論。

例如，當(dāng)報(bào)告分析結(jié)果時(shí)，數(shù)據(jù)科學(xué)家可以選擇將其圖的y軸從0開始。盡管這不會在數(shù)據(jù)本身中引入偏差，但由于差異似乎是更明顯（見下圖）。

檢測AI中的常見認(rèn)知偏差

如果Y軸從0％開始，則農(nóng)作物產(chǎn)量的差異似乎很小。但是，簡單地將其更改為從70％開始會產(chǎn)生看似不同的觀點(diǎn)，而結(jié)果實(shí)際上是相同的。

如果您想進(jìn)一步了解誤導(dǎo)圖的影響，強(qiáng)烈建議您閱讀"如何利用統(tǒng)計(jì)數(shù)據(jù)撒謊"一書！

· 確認(rèn)偏見—傾向于專注于確認(rèn)先入之見的信息的傾向。

假設(shè)您認(rèn)為癌癥和喝酒之間有很強(qiáng)的關(guān)系。在執(zhí)行分析時(shí)，您僅通過不考慮任何混淆變量來搜索以確認(rèn)該假設(shè)。

檢測AI中的常見認(rèn)知偏差

The confirmation Bias

這似乎是一個(gè)極端的例子，您將永遠(yuǎn)做不到。但是現(xiàn)實(shí)是，人類天生就有偏見，這很難撼動。發(fā)生在我身上的次數(shù)比我想承認(rèn)的要多！

5.建模

檢測AI中的常見認(rèn)知偏差

當(dāng)談?wù)揂I的偏見時(shí)，人們通常指的是某種程度上有利于特定人群的AI系統(tǒng)。一個(gè)很好的例子就是亞馬遜創(chuàng)建的招聘算法，該算法在決策中顯示了性別偏見。他們用于此算法的數(shù)據(jù)主要由擔(dān)任技術(shù)職務(wù)的男性組成，這使其傾向于使用男性作為高潛力候選人。

這是垃圾填充現(xiàn)象的經(jīng)典示例，其中您的AI解決方案僅與您使用的數(shù)據(jù)一樣好。這就是為什么在開始對數(shù)據(jù)進(jìn)行建模之前檢測數(shù)據(jù)中的偏差如此重要的原因。

讓我們研究一下在創(chuàng)建預(yù)測模型時(shí)經(jīng)常會看到的幾種類型的偏差：

· 偏差/方差折衷-偏差（模型的基本假設(shè)）和方差（如果使用不同的數(shù)據(jù)，則預(yù)測的變化）之間的折衷。

具有高方差的模型將過多地關(guān)注火車數(shù)據(jù)，并且不能很好地推廣。另一方面，高偏差假定數(shù)據(jù)始終以相同的方式運(yùn)行，這很少是正確的。當(dāng)增加偏見時(shí)，通常會降低方差，反之亦然。因此，我們經(jīng)常尋求平衡偏見和差異。

檢測AI中的常見認(rèn)知偏差

Demonstrating the effect of the trade-off between bias and variance.

· 概念漂移–一種現(xiàn)象，目標(biāo)變量的統(tǒng)計(jì)屬性會隨時(shí)間發(fā)生意外變化。

假設(shè)您創(chuàng)建了一個(gè)模型，可以預(yù)測在線商店中客戶的行為。該模型起初很棒，但一年后性能下降。發(fā)生的事情是客戶的行為在過去一年中發(fā)生了變化。客戶行為的概念已經(jīng)改變，并對模型的質(zhì)量產(chǎn)生負(fù)面影響。

解決方案可能只是簡單地使用新數(shù)據(jù)重新訓(xùn)練您的模型，以便及時(shí)掌握新行為。但是，可能需要一個(gè)全新的模型。

檢測AI中的常見認(rèn)知偏差

The original data (left) versus concept drift (right) after time has passed and new data was added.

· 分類不平衡-（目標(biāo)）分類頻率的極端不平衡。

假設(shè)您要對圖片包含貓還是狗進(jìn)行分類。如果您有1000張狗的照片而只有10張貓的照片，則存在類不平衡。

階級失衡的結(jié)果是該模型可能偏向多數(shù)階級。由于數(shù)據(jù)中的大多數(shù)圖片都是狗，因此該模型只需要始終猜測"狗"即可達(dá)到99％的準(zhǔn)確率。實(shí)際上，該模型尚未了解到貓和狗的圖片之間的差異。可以通過選擇正確的驗(yàn)證措施（例如，平衡準(zhǔn)確度或F1得分而不是準(zhǔn)確度）來補(bǔ)救。

6.接下來是什么？

在了解了AI解決方案中的所有這些潛在偏見之后，您可能會認(rèn)為：

"但是我該如何消除解決方案中的偏見？"

我認(rèn)為，要解決偏見，您需要了解其根源。知道是成功的一半。之后，由您自己確定消除或處理該特定偏差的方法。例如，如果您發(fā)現(xiàn)問題是由于數(shù)據(jù)中的選擇偏差引起的，那么最好添加其他數(shù)據(jù)。如果類別不平衡使您的模型更偏向多數(shù)群體，那么您可以研究重采樣策略（例如SMOTE）。

注意：有關(guān)常見認(rèn)知偏差的交互式概述，請參見此驚人的可視化。

聲明：本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人，不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用，如有內(nèi)容侵權(quán)或者其他違規(guī)問題，請聯(lián)系本站處理。舉報(bào)投訴

AI

AI

+關(guān)注

關(guān)注
87

文章
31028

瀏覽量
269371
人工智能

人工智能

+關(guān)注

關(guān)注
1792

文章
47373

瀏覽量
238866

電源檢測設(shè)備如何解決常見問題？

電源檢測設(shè)備是用于確保電氣系統(tǒng)和設(shè)備正常運(yùn)行的重要工具。它們可以幫助識別和解決各種與電源相關(guān)的問題，包括電壓不穩(wěn)、電流過大、接地問題等。以下是一些常見的電源問題以及電源檢測設(shè)備如何解決這些

發(fā)表于 01-02 16:10

常見晶振故障及解決方法晶振在物聯(lián)網(wǎng)中的應(yīng)用

常見晶振故障及解決方法晶振（Crystal Oscillator）是一種利用石英晶體的壓電效應(yīng)來產(chǎn)生穩(wěn)定振蕩頻率的電子元件，廣泛應(yīng)用于各種電子設(shè)備中，包括物聯(lián)網(wǎng)（IoT）設(shè)備。晶振的穩(wěn)定性和準(zhǔn)確性

發(fā)表于 12-09 09:34 ?388次閱讀

電子電器氣密性檢測儀使用方法：操作中的常見錯(cuò)誤與糾正

電子電器氣密性檢測儀是確保產(chǎn)品質(zhì)量的關(guān)鍵設(shè)備，但在使用過程中，操作人員常犯一些錯(cuò)誤，導(dǎo)致測試結(jié)果不準(zhǔn)確或儀器損壞。以下是一些常見的操作錯(cuò)誤及其糾正方法，旨在幫助操作人員正確使用氣密性檢測

發(fā)表于 11-29 11:20 ?180次閱讀

AI干貨補(bǔ)給站04 | 工業(yè)AI視覺檢測項(xiàng)目實(shí)施第三步：模型構(gòu)建

在當(dāng)今智能制造的浪潮中，AI視覺檢測技術(shù)憑借其高效、精準(zhǔn)的特性，已然成為提升產(chǎn)品質(zhì)量和生產(chǎn)效率的重要工具。為了助力從業(yè)者更好地理解和實(shí)施AI視覺檢測

發(fā)表于 11-29 01:04 ?193次閱讀

直播報(bào)名丨第4講：AI檢測系統(tǒng)落地工具詳解

阿丘工業(yè)AI學(xué)堂上線“AI檢測系統(tǒng)開發(fā)實(shí)戰(zhàn)”系列課程，全面涵蓋AI檢測系統(tǒng)開發(fā)從理論到實(shí)踐、從算法選擇到系統(tǒng)落地的各個(gè)關(guān)鍵環(huán)節(jié)，助力您快速了

發(fā)表于 11-23 01:05 ?140次閱讀

直播報(bào)名丨第2講：熱門AI檢測案例解析

阿丘工業(yè)AI學(xué)堂上線“AI檢測系統(tǒng)開發(fā)實(shí)戰(zhàn)”系列課程，全面涵蓋AI檢測系統(tǒng)開發(fā)從理論到實(shí)踐、從算法選擇到系統(tǒng)落地的各個(gè)關(guān)鍵環(huán)節(jié)，助力您快速了

發(fā)表于 11-12 01:05 ?205次閱讀

莫拉維克悖論與多模態(tài)AI:邁向機(jī)器人認(rèn)知的新時(shí)代

莫拉維克悖論揭示了人工智能系統(tǒng)在處理高級推理與基本感知運(yùn)動技能上的巨大差異。對于AI而言，復(fù)雜的邏輯任務(wù)似乎比人類習(xí)以為常的感知運(yùn)動技能更容易實(shí)現(xiàn)。這一悖論凸顯了當(dāng)前AI與人類認(rèn)知能力之間的鴻溝。

發(fā)表于 10-26 15:00 ?640次閱讀

檢測系統(tǒng)中常見的信號類型有哪些

在檢測系統(tǒng)中，常見的信號類型多種多樣，這些信號類型根據(jù)被測物理量的不同而有所區(qū)別。以下是一些常見的信號類型：位移信號：位移信號是檢測系統(tǒng)

發(fā)表于 10-15 13:57 ?603次閱讀

THS3491反相放大相位偏差怎么解決？

實(shí)際電路設(shè)計(jì)中拿THS3491做反相放大，仿真發(fā)現(xiàn)輸入輸出相位不是偏差180度。使用THS3491手冊上的圖62電路做仿真，同樣發(fā)現(xiàn)輸入輸出相位不是偏差180度。見下圖。請問該這么解決，多謝

發(fā)表于 08-07 07:57

甲烷濃度檢測儀中常見的檢測技術(shù)及其應(yīng)用

甲烷濃度檢測儀中常見的檢測技術(shù)及其應(yīng)用

發(fā)表于 07-08 10:47 ?659次閱讀

新一代智能插件AOI用極速編程顛覆了傳統(tǒng)AOI認(rèn)知

為了解決傳統(tǒng)AOI自動光學(xué)檢測設(shè)備存在的問題，新一代AI視覺前沿技術(shù)公司將神經(jīng)網(wǎng)路深度學(xué)習(xí)算法應(yīng)用于AOI中，匠心打造了D系列產(chǎn)品，用極速編程顛覆了傳統(tǒng)AOI認(rèn)知。

發(fā)表于 06-25 15:00 ?775次閱讀

三星電容的容量偏差范圍是多少？

三星電容的容量偏差范圍取決于具體的電容型號、規(guī)格以及精度等級。容量偏差范圍通常用來描述實(shí)際電容量與標(biāo)稱電容量之間的最大允許偏差，這是電容器性能的一個(gè)重要指標(biāo)。 ? 在三星電容中，常用的

發(fā)表于 05-21 14:18 ?473次閱讀

搭載星火認(rèn)知大模型的AI鼠標(biāo)：一鍵呼出AI助手，辦公更高效

搭載星火認(rèn)知大模型的AI鼠標(biāo)：一鍵呼出AI助手，辦公更高效在這個(gè)AI時(shí)代，如果你想在激烈競爭的職場中不被淘汰，訊飛

發(fā)表于 03-25 11:52 ?510次閱讀

AI時(shí)代怎么樣不被淘汰？訊飛AI鼠標(biāo)助力你在AI時(shí)代成長

功能的智能鼠標(biāo)，將成為你躋身AI時(shí)代的利器。下面來聊聊訊飛AI鼠標(biāo)都有哪些令人驚艷的AI功能吧 1.星火認(rèn)知大模型AI助你探索無限可能訊

發(fā)表于 03-23 11:41 ?715次閱讀

愛立信推出認(rèn)知軟件新功能

日前，愛立信宣布在其專為運(yùn)營商設(shè)計(jì)的認(rèn)知軟件組合中，新增采用“可解釋性人工智能（Explainable AI，XAI）”的新功能，進(jìn)一步加速在網(wǎng)絡(luò)設(shè)計(jì)和優(yōu)化中采用人工智能后的價(jià)值轉(zhuǎn)化。

發(fā)表于 02-22 09:22 ?5261次閱讀