0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

過去十年引人注目的分析和人工智能錯誤

姚小熊27 ? 來源:企業(yè)網(wǎng)D1Net ? 作者:企業(yè)網(wǎng)D1Net ? 2020-11-04 10:18 ? 次閱讀

數(shù)據(jù)和機器學(xué)習(xí)算法所帶來的洞察可能是無價之寶,但是錯誤會損害你的聲譽,影響你的收入甚至生命安全。這些引人注目的分析和人工智能錯誤說明了一切可能出問題的地方。

2017年,《經(jīng)濟學(xué)人》宣布數(shù)據(jù)(而非石油)已成為全球最具價值的資源。從那以后,這樣的評論屢見不鮮。各行各業(yè)的組織都已經(jīng)在數(shù)據(jù)和分析方面進行大量投資并將持續(xù)投資。但是和石油一樣,數(shù)據(jù)和分析也有不利的一面。

根據(jù)IDG公布的《2020年首席信息官現(xiàn)狀報告》,有37%的IT領(lǐng)導(dǎo)者表示,今年,數(shù)據(jù)分析將成為組織最大的IT投資。機器學(xué)習(xí)算法驅(qū)動的分析和行動可以帶來各種洞察,而這些洞察又可以為組織帶來競爭優(yōu)勢,但是錯誤在聲譽,收入甚至生命安全方面都可能造成巨大的損失。

了解你的數(shù)據(jù)及其含義很重要,但是了解你的工具,數(shù)據(jù)并牢記組織的價值觀也同樣重要。

下面來看看發(fā)生在過去十年的一些引人注目的分析和人工智能錯誤,以此來說明一切可能出問題的地方。

英國因為電子表格數(shù)據(jù)超出規(guī)定限制而丟失了數(shù)千起冠狀病毒病例

2020年10月,負責清點新的冠狀病毒感染的政府機構(gòu)英國公共衛(wèi)生局(PHE)透露,在9月25日至10月2日之間有近16000例冠狀病毒病例沒有列入報告,而問題的罪魁禍首就是Microsoft Excel的數(shù)據(jù)限制。

英國公共衛(wèi)生局使用自動化流程將冠狀病毒陽性實驗測試結(jié)果以CSV文件的格式傳輸?shù)綀蟾鎯x表板和聯(lián)系人跟蹤所使用的Excel模板中。不幸的是,每個Excel電子表格最多支持1048576行和16384列。而且,英國公共衛(wèi)生局將病例列為列而不是行。當病例超過16384列的限制時,Excel會切斷底部的15841條記錄。

雖然發(fā)生了“小小的故障”,但這并沒有阻止接受測試的人獲得測試結(jié)果,但這確實阻礙了聯(lián)系追蹤的工作,使英國國家衛(wèi)生局(NHS)難以發(fā)現(xiàn)與感染者有密切聯(lián)系的人并向他們發(fā)送通知。英國公共衛(wèi)生局的臨時首席執(zhí)行官Michael Brodie在10月4日發(fā)表的聲明中說,NHS Test and Trace應(yīng)用和英國公共衛(wèi)生局迅速解決了該問題并將所有沒有記錄的病例立即轉(zhuǎn)移到NHS Test and Trace的聯(lián)系人跟蹤系統(tǒng)中。

英國公共衛(wèi)生局實施了“快速緩解”措施,該措施可拆分大文件并對所有系統(tǒng)進行了全面的端到端評估以避免類似事件重蹈覆轍。

醫(yī)療算法無法標記黑人患者

在2019年,《科學(xué)》雜志上發(fā)表的一項研究顯示,全美的醫(yī)院和保險公司使用醫(yī)療預(yù)測算法來識別需要納入“高風(fēng)險護理管理”計劃的患者,而這個算法不太可能特別選出黑人患者。

高風(fēng)險護理管理計劃為長期病患者提供訓(xùn)練有素的護理人員和初級護理監(jiān)測以防止他們出現(xiàn)嚴重的并發(fā)癥。但是,該算法更有可能推薦白人患者而不是黑人患者。

該研究發(fā)現(xiàn),該算法以醫(yī)療支出作為指標了確定個人醫(yī)療需求。但是《科學(xué)美國人》的報道稱,病情較為嚴重的黑人患者的醫(yī)療費用與病情較輕的白人患者的醫(yī)療費用相當,這意味著即使前者的需求更大,他們的風(fēng)險評分也還是比較低。

開展該研究的研究人員認為有幾個因素導(dǎo)致了這個結(jié)果。首先,有色人種的收入很可能較低,即使他們有醫(yī)保也很可能無法獲得醫(yī)療服務(wù)。隱性偏見也可能導(dǎo)致他們無法獲得優(yōu)質(zhì)的護理。

盡管該研究沒有提算法或開發(fā)者的名字,但研究人員告訴《科學(xué)美國人》,他們正在與開發(fā)者合作解決這種情況。

經(jīng)由數(shù)據(jù)集訓(xùn)練的微軟聊天機器人發(fā)了帶有種族主義色彩的推文

2016年3月,微軟獲悉,使用推特互動作為機器學(xué)習(xí)算法的訓(xùn)練數(shù)據(jù)可能會產(chǎn)生令人失望的結(jié)果。

微軟在社交媒體平臺上發(fā)布了人工智能聊天機器人Tay并稱其為對“對話理解”所做的實驗?!皩υ捓斫狻被谶@樣一種想法,即聊天機器人化身為一個青少女與人進行互動,其方法是使用結(jié)合了機器學(xué)習(xí)和自然語言處理功能的推特。微軟使用匿名的公共數(shù)據(jù)和喜劇演員事先編寫的一些笑料來使其內(nèi)容更豐富,然后放任其在社交網(wǎng)絡(luò)的交互中學(xué)習(xí)和發(fā)展。

在短短16小時的時間內(nèi),聊天機器人發(fā)布了95000多條推文,這些推文瞬間變調(diào)了,充斥著明顯的種族主義,對女性的厭惡和反猶太主義。微軟迅速暫停了該服務(wù)以進行調(diào)整并最終停用了Tay。

微軟研究與孵化公司的副總裁Peter Lee表示(時任微軟醫(yī)療的公司副總裁):“盡管Tay無意冒犯,但還是發(fā)了令人發(fā)指的推文,對此我們深表歉意。這些推文既不代表微軟的立場,也不代表微軟設(shè)計Tay的方式。事發(fā)后,Lee在微軟官方博客上發(fā)了這樣的博文。

Lee指出,Tay的前身即微軟于2014年在中國發(fā)布的Xiaoice,Xiaoice在Tay發(fā)布前的兩年時間里已成功與超過4000萬人進行了對話。微軟沒有考慮到的情況是有一群推特用戶立即開始向Tay發(fā)推文,其中包括種族主義和厭惡女性的言論。該機器人很快從這樣的材料中學(xué)到了這樣的內(nèi)容并將其納入自身的推文中。

“盡管我們已經(jīng)準備好應(yīng)對多種濫用系統(tǒng)的情況,但我們對這種特定的攻擊疏于監(jiān)督。結(jié)果,Tay在推特上發(fā)了極為不當且應(yīng)該受到譴責的文字和圖像”,Lee這樣寫道。

支持Amazon AI招聘工具僅推薦男性

和許多大公司一樣,亞馬遜希望獲得有助于HR篩選工作申請以尋找最佳人選的工具。2014年,亞馬遜開始研究基于人工智能的招聘軟件。只是有這樣一個問題:該系統(tǒng)極力推薦男性候選人。2018年,路透社爆料稱亞馬遜已經(jīng)取消了該項目。

亞馬遜的系統(tǒng)為候選人實施了從1分到5分的星級評分制。但是,系統(tǒng)核心的機器學(xué)習(xí)模型接受了訓(xùn)練,對其進行訓(xùn)練的是10年以來所有求職者提交給亞馬遜的簡歷,而其中大多數(shù)簡歷是男性提交的。由于使用了這些培訓(xùn)數(shù)據(jù),系統(tǒng)漸漸挑剔簡歷中的某些字眼,其中包括“女性”一詞,甚至將所有畢業(yè)于女子大學(xué)的候選人降級。

當時,亞馬遜表示,亞馬遜招聘人員從未使用該工具來評估候選人。

亞馬遜試圖修改該工具以使其中立化,但最終還是無法保證它不會學(xué)習(xí)其他會對候選人產(chǎn)生歧視的分類方式,因此該項目遭到終止。

塔吉特的分析侵犯了隱私

在2012年,零售業(yè)巨頭塔吉特(Target)的一項分析項目展示了這樣一個事實。即公司到底可以從其數(shù)據(jù)中了解多少客戶信息。據(jù)《紐約時報》報道,在2002,塔吉特的市場部年向知道公司可以通過方式確定客戶是否懷孕。這個問題催生了一個預(yù)測性分析項目,該項目導(dǎo)致該零售商無意間向一個十幾歲的女子的家庭透露了她懷孕的情況,這引起了軒然大波。反過來又導(dǎo)致各種文章和營銷博客鋪天蓋地地引用這一事件,以此作為避免“令人發(fā)紫的因素”的建議的一部分內(nèi)容。

塔吉特的市場部希望識別懷孕的人,因為在生命中的某些時期人們很有可能從根本上改變購買習(xí)慣,其中最重要的是懷孕期。如果塔吉特可以在這個時期接觸到處于懷孕期的客戶,它就可以在這些客戶中培養(yǎng)新的購物行為,使她們到塔吉特購買雜貨,服裝或其他商品。

與所有其他大型零售商一樣,塔吉特一直通過購物碼、信用卡、調(diào)研等收集與客戶有關(guān)的數(shù)據(jù)。它將數(shù)據(jù)與所購買的人口特點統(tǒng)計數(shù)據(jù)和第三方數(shù)據(jù)混合在一起。只要對所有這些數(shù)據(jù)進行處理,塔吉特的分析團隊就可以確定其出售的大約25種產(chǎn)品可以一起進行分析以產(chǎn)生“懷孕預(yù)測”分數(shù)。然后,市場部可以通過優(yōu)惠券和營銷信息來針對高分客戶。

進一步研究表明,研究客戶的生育狀況可能會使其中一些客戶感到十分不安。據(jù)《泰晤士報》報道,塔吉特并沒有放棄其精準營銷,但它確實開始摻入了一些其他東西的廣告,即明知道孕婦不會購買的東西(包括在尿布廣告旁邊添加除草機廣告),從而混淆視聽。
責任編輯:YYX

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 人工智能
    +關(guān)注

    關(guān)注

    1791

    文章

    47314

    瀏覽量

    238648
  • 機器學(xué)習(xí)
    +關(guān)注

    關(guān)注

    66

    文章

    8420

    瀏覽量

    132685
收藏 人收藏

    評論

    相關(guān)推薦

    嵌入式和人工智能究竟是什么關(guān)系?

    領(lǐng)域,如工業(yè)控制、智能家居、醫(yī)療設(shè)備等。 人工智能是計算機科學(xué)的一個分支,它研究如何使計算機具備像人類一樣思考、學(xué)習(xí)、推理和決策的能力。人工智能的發(fā)展歷程可以追溯到上世紀50代,經(jīng)
    發(fā)表于 11-14 16:39

    《AI for Science:人工智能驅(qū)動科學(xué)創(chuàng)新》第6章AI與能源科學(xué)讀后感

    、優(yōu)化等方面的應(yīng)用有了更清晰的認識。特別是書中提到的基于大數(shù)據(jù)和機器學(xué)習(xí)的能源管理系統(tǒng),通過實時監(jiān)測和分析能源數(shù)據(jù),實現(xiàn)了能源的高效利用和智能化管理。 其次,第6章通過多個案例展示了人工智能在能源科學(xué)中
    發(fā)表于 10-14 09:27

    《AI for Science:人工智能驅(qū)動科學(xué)創(chuàng)新》第一章人工智能驅(qū)動的科學(xué)創(chuàng)新學(xué)習(xí)心得

    人工智能:科學(xué)研究的加速器 第一章清晰地闡述了人工智能作為科學(xué)研究工具的強大功能。通過機器學(xué)習(xí)、深度學(xué)習(xí)等先進技術(shù),AI能夠處理和分析海量數(shù)據(jù),發(fā)現(xiàn)傳統(tǒng)方法難以捕捉的模式和規(guī)律。這不僅極大地提高了數(shù)據(jù)處理
    發(fā)表于 10-14 09:12

    risc-v在人工智能圖像處理應(yīng)用前景分析

    RISC-V在人工智能圖像處理領(lǐng)域的應(yīng)用前景分廣闊,這主要得益于其開源性、靈活性和低功耗等特點。以下是對RISC-V在人工智能圖像處理應(yīng)用前景的詳細分析: 一、RISC-V的基本特點
    發(fā)表于 09-28 11:00

    人工智能ai 數(shù)電 模電 模擬集成電路原理 電路分析

    人工智能ai 數(shù)電 模電 模擬集成電路原理 電路分析 想問下哪些比較容易學(xué) 不過好像都是要學(xué)的
    發(fā)表于 09-26 15:24

    串口屏與人工智能的結(jié)合

    在當今智能化浪潮中,傳統(tǒng)設(shè)備與新興技術(shù)的融合正不斷推動產(chǎn)業(yè)升級,其中,串口屏與人工智能(AI)的結(jié)合尤為引人注目。串口屏作為一種常見的信息展示與交互設(shè)備,在工業(yè)控制、智能家居、醫(yī)療健康
    的頭像 發(fā)表于 08-16 12:29 ?1313次閱讀

    FPGA在人工智能中的應(yīng)用有哪些?

    FPGA(現(xiàn)場可編程門陣列)在人工智能領(lǐng)域的應(yīng)用非常廣泛,主要體現(xiàn)在以下幾個方面: 一、深度學(xué)習(xí)加速 訓(xùn)練和推理過程加速:FPGA可以用來加速深度學(xué)習(xí)的訓(xùn)練和推理過程。由于其高并行性和低延遲特性
    發(fā)表于 07-29 17:05

    中國生成式人工智能專利數(shù)量傲視群雄

    人工智能專利態(tài)勢報告》揭示了這一領(lǐng)域的最新發(fā)展動態(tài),其中,中國在生成式人工智能專利領(lǐng)域的卓越表現(xiàn)尤為引人注目
    的頭像 發(fā)表于 07-04 15:39 ?360次閱讀

    自然語言處理屬于人工智能的哪個領(lǐng)域

    之間的交互,旨在使計算機能夠理解、生成和處理自然語言。 自然語言處理:人工智能的皇冠上的明珠 引言 人工智能作為一門跨學(xué)科的研究領(lǐng)域,涵蓋了計算機科學(xué)、數(shù)學(xué)、心理學(xué)、語言學(xué)等多個學(xué)科。在人工智能的眾多分支中,自然語言處理(NLP
    的頭像 發(fā)表于 07-03 14:09 ?1365次閱讀

    中國在人工智能領(lǐng)域嶄露頭角,全球矚目

    近年來,人工智能(AI)已成為全球科技競爭的新高地。在這一領(lǐng)域,中國的表現(xiàn)尤為引人注目,不僅在基礎(chǔ)設(shè)施建設(shè)上取得了顯著成就,更在人才培養(yǎng)方面邁出了堅實的步伐。
    的頭像 發(fā)表于 06-24 14:42 ?460次閱讀

    馬斯克人工智能初創(chuàng)公司xAI將打造超級計算機,引領(lǐng)AI新紀元

    在科技發(fā)展的浪潮中,人工智能(AI)無疑是當今最引人注目的領(lǐng)域之一。近日,馬斯克的人工智能初創(chuàng)公司xAI再次成為了全球關(guān)注的焦點。據(jù)悉,該公司計劃在不久的將來打造一臺裝備有最多10萬塊英偉達H100的超級計算機,這一宏偉的藍圖預(yù)
    的頭像 發(fā)表于 06-22 16:37 ?662次閱讀

    Google開發(fā)專為視頻生成配樂的人工智能技術(shù)

    近日,科技巨頭Google旗下的人工智能研究實驗室DeepMind宣布了一項引人注目的技術(shù)突破——V2A技術(shù)(Video to Audio),這是一項專為視頻生成配樂的人工智能技術(shù)。這項技術(shù)的誕生,標志著
    的頭像 發(fā)表于 06-20 11:03 ?513次閱讀

    智譜AI劉江:5-10內(nèi)AGI會達到普通人水平

    在2024亞馬遜云科技中國峰會上,智譜AI首席生態(tài)官劉江發(fā)表了引人注目的觀點。他預(yù)測,在未來的5至10內(nèi),AGI(通用人工智能)的發(fā)展將達到普通人的水平,這將是“我們這一代遇到的最
    的頭像 發(fā)表于 05-31 10:33 ?733次閱讀

    嵌入式人工智能的就業(yè)方向有哪些?

    嵌入式人工智能的就業(yè)方向有哪些? 在新一輪科技革命與產(chǎn)業(yè)變革的時代背景下,嵌入式人工智能成為國家新型基礎(chǔ)建設(shè)與傳統(tǒng)產(chǎn)業(yè)升級的核心驅(qū)動力。同時在此背景驅(qū)動下,眾多名企也紛紛在嵌入式人工智能領(lǐng)域布局
    發(fā)表于 02-26 10:17

    福布斯公布關(guān)于2024人工智能發(fā)展的大預(yù)見

    近日,福布斯公布了他們對2024人工智能發(fā)展的大預(yù)見,這些預(yù)測簡潔而又充滿洞察力。
    的頭像 發(fā)表于 01-12 10:18 ?1044次閱讀