0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

你社交網(wǎng)站上的照片 也許已經(jīng)被用來(lái)訓(xùn)練人工智能了

KIyT_gh_211d74f ? 來(lái)源:YXQ ? 2019-04-25 14:44 ? 次閱讀

毫無(wú)疑問(wèn),這張家庭照片是非??蓯?ài)的:照片中的爸爸留著短須,戴著無(wú)框眼鏡,棕色頭發(fā)的媽媽咧著嘴笑著。他們正和兩個(gè)蹣跚學(xué)步的女兒一起嬉戲,同時(shí)品嘗著冰淇淋。但是,這張照片于2013年被上傳到照片分享網(wǎng)站Flickr上時(shí),“可愛(ài)”以外的屬性引發(fā)了爭(zhēng)議。對(duì)于面部識(shí)別系統(tǒng)來(lái)說(shuō),這張照片有著獨(dú)特的意義。照片里,人臉出現(xiàn)在了畫面的不同位置。這樣的照片能夠幫助訓(xùn)練人工智能來(lái)識(shí)別照片和視頻中的人臉。

韋斯特于2013年拍攝的這張照片被收錄在IBM的人像數(shù)據(jù)集(Diversity in Faces)中

IBM開發(fā)了一個(gè)名為“人臉多樣性”的新項(xiàng)目,并為其準(zhǔn)備了上百萬(wàn)張圖片,這張其樂(lè)融融的照片就是其中之一,該項(xiàng)目旨在提升人臉識(shí)別的公平性和準(zhǔn)確性。

照片的拍攝者是佛蒙特州農(nóng)村的一名圖書管理員,名叫杰薩姆·韋斯特Jessamyn West。當(dāng)她發(fā)現(xiàn)這張照片被IBM使用了的時(shí)候,她感到既驚訝又憤怒,她曾將這張照片上傳到Flickr,并添加了知識(shí)共享(Creative Commons)協(xié)議,以便讓其他人可以使用這張照片。

但是她不知道的是,包括她拍攝的自畫像在內(nèi)的十幾張照片,和這張照片一樣都包含在了人臉識(shí)別數(shù)據(jù)集中,這讓她感到十分不安。她說(shuō):“如果當(dāng)初有人(就使用我的照片)征求過(guò)我的同意,我不會(huì)如此不安和憤怒。”

多年來(lái),研究人員們通過(guò)互聯(lián)網(wǎng)收集并注釋了各類物體的照片,以此來(lái)訓(xùn)練電腦,讓其可以更好地了解它們周圍的世界。通常,他們通過(guò)谷歌圖片搜索、公共Instagram帳戶和一些其他的途徑(有些合法,有些可能不合法)獲取數(shù)量巨大的圖片。得到的數(shù)據(jù)集通常被用于學(xué)術(shù)研究,比如訓(xùn)練或測(cè)試人臉識(shí)別算法。但隨著微軟、亞馬遜、臉書和谷歌等公司押寶人工智能,人臉識(shí)別正走出實(shí)驗(yàn)室,進(jìn)入大型企業(yè)的視野中。

隨著消費(fèi)者意識(shí)到他們?cè)诨ヂ?lián)網(wǎng)上留下的數(shù)據(jù)能夠產(chǎn)生的巨大威力,人臉識(shí)別數(shù)據(jù)集正在加劇人們對(duì)隱私和監(jiān)控的擔(dān)心。因此,一些研究人員正在重新審視這種野蠻收集他人照片的行徑。在充滿分享精神的互聯(lián)網(wǎng)中,使用他人照片本應(yīng)征求別人同意。

照片從哪里來(lái)?

由于深度學(xué)習(xí)的普及,近年來(lái)機(jī)器學(xué)習(xí)研究蒸蒸日上,人臉識(shí)別技術(shù)也得到了極大的改善。在一個(gè)典型的用例中,照片、視頻或?qū)崟r(shí)流媒體中的人臉會(huì)被掃描、分析,接著,它們的特征會(huì)被拿來(lái)與數(shù)據(jù)庫(kù)中注釋過(guò)的人臉進(jìn)行比較。

這項(xiàng)技術(shù)正被用于打擊人口販運(yùn)和機(jī)場(chǎng)快速安檢,同時(shí)它也被用于監(jiān)視音樂(lè)會(huì)、體育賽事。

然而,面部識(shí)別的準(zhǔn)確性仍是一個(gè)問(wèn)題。研究人員開始擔(dān)心人工智能系統(tǒng)中存在的歧視和偏見(jiàn)。該技術(shù)在正確識(shí)別有色人種和女性等方面還存在著重大缺陷。造成這一問(wèn)題的原因之一,是數(shù)據(jù)集里男性相對(duì)于女性、白人相對(duì)有色人種的懸殊比例。

對(duì)機(jī)器訓(xùn)練來(lái)說(shuō),數(shù)據(jù)多樣性很重要,但數(shù)據(jù)的體量大小也同樣重要。人臉識(shí)別系統(tǒng)的訓(xùn)練和測(cè)試需要在數(shù)千萬(wàn)甚至數(shù)百萬(wàn)張人臉上進(jìn)行。

多年來(lái),研究人員一直通過(guò)IBM的人臉識(shí)別數(shù)據(jù)集來(lái)進(jìn)行相關(guān)研究。這個(gè)包含圖片鏈接的數(shù)據(jù)集都是從Flickr和雅虎發(fā)布一百萬(wàn)張圖片的資源包中整理生成。該資源包被稱為YFCC100M,它被用于各種各樣的科學(xué)項(xiàng)目研究,包括在不使用地理坐標(biāo)的情況下估算照片和視頻的拍攝地點(diǎn)的研究。

許多公司、研究機(jī)構(gòu)和個(gè)人都為面部識(shí)別編制了數(shù)據(jù)集,IBM只是其中之一。其中一些數(shù)據(jù)集由實(shí)際的圖像組成,還有一些類似IBM的數(shù)據(jù)集,是由圖像鏈接組成的。有時(shí),數(shù)據(jù)集也是可以通過(guò)拍攝模特得到的。

這些人像屬于英偉達(dá)用于訓(xùn)練GAN系統(tǒng)的數(shù)據(jù)集

通常情況下,這些數(shù)據(jù)集是知識(shí)共享的,但它們必須用于非商業(yè)目的,比如算法研究。但CNN發(fā)現(xiàn),大量的類似數(shù)據(jù)集可以從Github等網(wǎng)站免費(fèi)下載。

David A. Shamma在雅虎實(shí)驗(yàn)室擔(dān)任研究主管時(shí),幫助整理了Flickr的數(shù)據(jù)集。他認(rèn)為,近些年來(lái)學(xué)術(shù)界為了機(jī)器視覺(jué)和識(shí)別研究,正從他們能接觸到的任何地方,想方設(shè)法地搜集數(shù)據(jù),“在這個(gè)一個(gè)學(xué)術(shù)領(lǐng)域里,人們經(jīng)常說(shuō),‘沒(méi)有造成傷害,就不算犯規(guī)’”。

Shamma認(rèn)為,他和他的同事發(fā)布的Flickr大數(shù)據(jù)集,通過(guò)將大量授權(quán)的圖片交給研究人員,可以幫助學(xué)術(shù)界以此為基礎(chǔ)進(jìn)行研究。

這些被上傳到Flickr上的圖片來(lái)源于像韋斯特這樣的普通人和一些專業(yè)人士。這些圖片擁有的知識(shí)共享協(xié)議是一種特殊類型的版權(quán)許可,?它明確規(guī)定了圖像可以在何種條件下被他人使用和共享。

知識(shí)共享協(xié)議于2002年首次發(fā)布,遠(yuǎn)遠(yuǎn)早于當(dāng)前的人工智能熱潮。

盡管研究人員在Flickr等網(wǎng)站上免費(fèi)使用圖片,但他們也承認(rèn),許多上傳這些照片的人可能會(huì)對(duì)照片被用于訓(xùn)練人工智能的事實(shí)感到驚訝。

Shamma說(shuō):“我認(rèn)為人們對(duì)自己的照片用途有一定的預(yù)計(jì),但是當(dāng)被告知具體的人工智能用途時(shí),他們?nèi)詴?huì)感到意外?!?/p>

不滿在升級(jí)

不論人工智能的從業(yè)者們?nèi)绾谓忉專f斯特在得知自己照片被用作機(jī)器學(xué)習(xí)后大吃一驚。今年3月,她在閱讀了一篇NBC新聞報(bào)道后,搜索了自己的Flickr賬戶。結(jié)果發(fā)現(xiàn)她為朋友的家人拍的照片和其他許多照片一樣,都是數(shù)據(jù)集的一部分時(shí),她很沮喪。她認(rèn)為人工智能的未來(lái)很明朗,但自己的照片在不知情的情況下被用來(lái)訓(xùn)練人工智能使她憂心重重。

Twitter上相關(guān)的帖子充斥著普通網(wǎng)民的抗議。很多人也沮喪地發(fā)現(xiàn),他們?cè)诰W(wǎng)上分享的照片(通常是很久以前的照片)成為了訓(xùn)練人工智能的素材。

韋斯特要求IBM從數(shù)據(jù)集中刪除她的照片,但這只能通過(guò)發(fā)郵件來(lái)完成。她還必須授權(quán)IBM使用她的社交賬號(hào),以便其能夠找到并刪除每一張照片。

IBM表示,它“致力于保護(hù)隱私權(quán)”,數(shù)據(jù)集中涉及到的人隨時(shí)都可以選擇退出。不過(guò),它并沒(méi)有提供工具來(lái)幫助確認(rèn)數(shù)據(jù)集是否包含了特定的圖像,因此人們必須通過(guò)NBC構(gòu)建的搜尋工具來(lái)查找。

與此同時(shí),芯片制造商英偉達(dá)的研究人員正在研究IBM的經(jīng)驗(yàn)教訓(xùn),并考慮改變自己的做法。

今年3月,英偉達(dá)發(fā)布一個(gè)在線工具,幫助人們了解他們的照片是否被包含在用于訓(xùn)練StyleGAN的數(shù)據(jù)集里。StyleGAN是今年2月英偉達(dá)公布的一個(gè)人工智能系統(tǒng),善于創(chuàng)造實(shí)際上并不存在的逼真人臉,它的數(shù)據(jù)集包含70,000張高質(zhì)量的Flickr授權(quán)圖片。

在NBC揭露了私人圖片被用作機(jī)器訓(xùn)練后,英偉達(dá)的在線工具才出現(xiàn)在網(wǎng)絡(luò)上。然而英偉達(dá)負(fù)責(zé)圖形研究的副總裁David Luebke辯稱,這項(xiàng)工具已經(jīng)開發(fā)了一段時(shí)間了。

他說(shuō):“當(dāng)人們慢慢意識(shí)到這一點(diǎn)的同時(shí),我們也一直在為之努力。只要有人(對(duì)搜集自己的圖片)提出反對(duì),我們也希望能贏得他們尊重?!?/p>

如果用戶想從數(shù)據(jù)集中刪除自己的照片,或避免其用于未來(lái)的計(jì)算機(jī)視覺(jué)研究,該公司還列出了一系列預(yù)防措施對(duì)用戶進(jìn)行指導(dǎo)。

這些建議包括將照片設(shè)為私有、更改其附帶的使用許可,以及在照片上添加一個(gè)標(biāo)簽,以表明他們不希望將其用于計(jì)算機(jī)視覺(jué)研究。

Luebke說(shuō):“我認(rèn)為很多人要么不在乎,要么會(huì)很樂(lè)意他們的照片被用在StyleGAN這樣的研究上。但如果有人不喜歡這樣,那也有辦法退出?!?/p>

這張韋斯特的自拍照和其他的照片一起被編入IBM的數(shù)據(jù)集中

一些研究人員認(rèn)為,人們應(yīng)該通過(guò)授權(quán),自己決定圖片是否可以用于計(jì)算機(jī)視覺(jué)或人工智能研究。

對(duì)此,知識(shí)共享協(xié)議并不能幫上大忙。只要遵循相關(guān)的條款,這個(gè)來(lái)自非營(yíng)利組織的許可協(xié)議并不限制任何形式的人工智能開發(fā)。

知識(shí)共享組織首席執(zhí)行官Ryan Merkley稱:“這些協(xié)議并不是為了保護(hù)隱私或研究倫理而設(shè)計(jì)的?!?/p>

等待立法

近年來(lái),人工智能發(fā)展之快,以至于相關(guān)法規(guī)幾乎還沒(méi)有來(lái)得及制定,更不用說(shuō)實(shí)施了。法律上,在收集和使用圖像進(jìn)行面部識(shí)別時(shí),公司并沒(méi)有告知義務(wù)。

目前還沒(méi)有相關(guān)的聯(lián)邦法規(guī)出臺(tái)。在各州,情況則有所不同:例如,伊利諾斯州有一項(xiàng)法律,要求公司在收集生物特征信息之前必須得到客戶的同意;亞馬遜和微軟總部所在地華盛頓州的州參議院最近通過(guò)了一項(xiàng)限制面部識(shí)別使用的法案,該法案仍需在該州眾議院獲得通過(guò)。

Merkley和其他人認(rèn)為應(yīng)該考慮立法來(lái)規(guī)范數(shù)據(jù)收集。今年3月,參議院提出了一項(xiàng)法案,要求企業(yè)在收集和共享識(shí)別數(shù)據(jù)之前必須征得消費(fèi)者的同意。它還要求公司進(jìn)行外部測(cè)試,以確保算法在實(shí)施前是公平的。

數(shù)字版權(quán)組織電子前沿基金會(huì)(Electronic Frontier Foundation)技術(shù)政策主管Jeremy Gillula則表示,即使沒(méi)有嚴(yán)格的法律限制私人照片用于人工智能訓(xùn)練,企業(yè)和研究團(tuán)體也應(yīng)該注意遵守道德規(guī)范。

在他看來(lái),這意味著使用照片就要得到照片中人物的明確同意。即便這很難做到,它也是企業(yè)必須面對(duì)的現(xiàn)實(shí)。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 人工智能
    +關(guān)注

    關(guān)注

    1791

    文章

    47282

    瀏覽量

    238536
  • 照片
    +關(guān)注

    關(guān)注

    0

    文章

    15

    瀏覽量

    9603
收藏 人收藏

    評(píng)論

    相關(guān)推薦

    嵌入式和人工智能究竟是什么關(guān)系?

    領(lǐng)域,如工業(yè)控制、智能家居、醫(yī)療設(shè)備等。 人工智能是計(jì)算機(jī)科學(xué)的一個(gè)分支,它研究如何使計(jì)算機(jī)具備像人類一樣思考、學(xué)習(xí)、推理和決策的能力。人工智能的發(fā)展歷程可以追溯到上世紀(jì)50年代,經(jīng)歷
    發(fā)表于 11-14 16:39

    soc在人工智能中的創(chuàng)新應(yīng)用

    社會(huì)計(jì)算(Social Computing, SOC)是一個(gè)跨學(xué)科領(lǐng)域,它結(jié)合社會(huì)科學(xué)、計(jì)算機(jī)科學(xué)和人工智能,以理解和設(shè)計(jì)社會(huì)互動(dòng)中的技術(shù)系統(tǒng)。隨著人工智能(AI)技術(shù)的發(fā)展,SOC在AI中
    的頭像 發(fā)表于 11-10 09:30 ?390次閱讀

    有沒(méi)有照片素材網(wǎng)站呀,免費(fèi)下載的那種,科技芯片類,用來(lái)寫ppt

    有沒(méi)有照片素材網(wǎng)站呀,免費(fèi)下載的那種,科技芯片類,用來(lái)寫ppt
    發(fā)表于 10-23 10:53

    《AI for Science:人工智能驅(qū)動(dòng)科學(xué)創(chuàng)新》第6章人AI與能源科學(xué)讀后感

    探討了人工智能如何通過(guò)技術(shù)創(chuàng)新推動(dòng)能源科學(xué)的進(jìn)步,為未來(lái)的可持續(xù)發(fā)展提供強(qiáng)大的支持。 首先,書中通過(guò)深入淺出的語(yǔ)言,介紹人工智能在能源領(lǐng)域的基本概念和技術(shù)原理。這使得我對(duì)
    發(fā)表于 10-14 09:27

    AI for Science:人工智能驅(qū)動(dòng)科學(xué)創(chuàng)新》第4章-AI與生命科學(xué)讀后感

    很幸運(yùn)社區(qū)給我一個(gè)閱讀此書的機(jī)會(huì),感謝平臺(tái)。 《AI for Science:人工智能驅(qū)動(dòng)科學(xué)創(chuàng)新》第4章關(guān)于AI與生命科學(xué)的部分,為我們揭示人工智能技術(shù)在生命科學(xué)領(lǐng)域中的廣泛應(yīng)用和深遠(yuǎn)影響。在
    發(fā)表于 10-14 09:21

    《AI for Science:人工智能驅(qū)動(dòng)科學(xué)創(chuàng)新》第一章人工智能驅(qū)動(dòng)的科學(xué)創(chuàng)新學(xué)習(xí)心得

    人工智能:科學(xué)研究的加速器 第一章清晰地闡述人工智能作為科學(xué)研究工具的強(qiáng)大功能。通過(guò)機(jī)器學(xué)習(xí)、深度學(xué)習(xí)等先進(jìn)技術(shù),AI能夠處理和分析海量數(shù)據(jù),發(fā)現(xiàn)傳統(tǒng)方法難以捕捉的模式和規(guī)律。這不僅極大地提高了數(shù)據(jù)處理
    發(fā)表于 10-14 09:12

    risc-v在人工智能圖像處理應(yīng)用前景分析

    和使用該技術(shù),無(wú)需支付專利費(fèi)或使用費(fèi)。這大大降低了人工智能圖像處理技術(shù)的研發(fā)成本,并吸引大量的開發(fā)者、企業(yè)和研究機(jī)構(gòu)參與其生態(tài)建設(shè)。 靈活性則體現(xiàn)在RISC-V可以根據(jù)不同的應(yīng)用場(chǎng)景進(jìn)行定制和優(yōu)化,從而
    發(fā)表于 09-28 11:00

    名單公布!【書籍評(píng)測(cè)活動(dòng)NO.44】AI for Science:人工智能驅(qū)動(dòng)科學(xué)創(chuàng)新

    活的世界? 編輯推薦 《AI for Science:人工智能驅(qū)動(dòng)科學(xué)創(chuàng)新》聚焦于人工智能與材料科學(xué)、生命科學(xué)、電子科學(xué)、能源科學(xué)、環(huán)境科學(xué)五大領(lǐng)域的交叉融合,通過(guò)深入淺出的語(yǔ)言和諸多實(shí)際應(yīng)用案例,介紹
    發(fā)表于 09-09 13:54

    報(bào)名開啟!深圳(國(guó)際)通用人工智能大會(huì)將啟幕,國(guó)內(nèi)外大咖齊聚話AI

    8月28日至30日,2024深圳(國(guó)際)通用人工智能大會(huì)暨深圳(國(guó)際)通用人工智能產(chǎn)業(yè)博覽會(huì)將在深圳國(guó)際會(huì)展中心(寶安)舉辦。大會(huì)以“魅力AI·無(wú)限未來(lái)”為主題,致力于打造全球通用人工智能領(lǐng)域集產(chǎn)品
    發(fā)表于 08-22 15:00

    FPGA在人工智能中的應(yīng)用有哪些?

    FPGA(現(xiàn)場(chǎng)可編程門陣列)在人工智能領(lǐng)域的應(yīng)用非常廣泛,主要體現(xiàn)在以下幾個(gè)方面: 一、深度學(xué)習(xí)加速 訓(xùn)練和推理過(guò)程加速:FPGA可以用來(lái)加速深度學(xué)習(xí)的訓(xùn)練和推理過(guò)程。由于其高并行性和
    發(fā)表于 07-29 17:05

    馬斯克宣布開始在“全球最大AI訓(xùn)練集群”上訓(xùn)練

    在科技界的聚光燈下,埃隆·馬斯克再次以他前瞻性的視野引領(lǐng)人工智能領(lǐng)域的新一輪革新。近日,馬斯克通過(guò)其社交媒體平臺(tái)宣布,旗下新興的AI公司xAI已經(jīng)正式啟動(dòng)了位于美國(guó)田納西州的“孟菲斯
    的頭像 發(fā)表于 07-23 17:44 ?645次閱讀

    Meta據(jù)悉正與出版商討論人工智能模型訓(xùn)練合作

    MetaPlatforms(Meta)最近與多家媒體出版商展開了初步討論,旨在利用他們的新聞文章、照片和視頻等內(nèi)容來(lái)訓(xùn)練其先進(jìn)的人工智能模型。這一合作意向標(biāo)志著Meta在內(nèi)容獲取和人工智能
    的頭像 發(fā)表于 05-24 09:15 ?488次閱讀

    5G智能物聯(lián)網(wǎng)課程之Aidlux下人工智能開發(fā)(SC171開發(fā)套件V2)

    5G智能物聯(lián)網(wǎng)課程之Aidlux下人工智能開發(fā)(SC171開發(fā)套件V2) 課程類別 課程名稱 視頻課程時(shí)長(zhǎng) 視頻課程鏈接 課件鏈接 人工智能 參賽基礎(chǔ)知識(shí)指引 14分50秒 https
    發(fā)表于 05-10 16:46

    5G智能物聯(lián)網(wǎng)課程之Aidlux下人工智能開發(fā)(SC171開發(fā)套件V1)

    課程類別 課程名稱 視頻課程時(shí)長(zhǎng) 視頻課程鏈接 課件鏈接 人工智能 參賽基礎(chǔ)知識(shí)指引 14分50秒 https://t.elecfans.com/v/25508.html *附件:參賽基礎(chǔ)知識(shí)指引
    發(fā)表于 04-01 10:40

    嵌入式人工智能的就業(yè)方向有哪些?

    嵌入式人工智能的就業(yè)方向有哪些? 在新一輪科技革命與產(chǎn)業(yè)變革的時(shí)代背景下,嵌入式人工智能成為國(guó)家新型基礎(chǔ)建設(shè)與傳統(tǒng)產(chǎn)業(yè)升級(jí)的核心驅(qū)動(dòng)力。同時(shí)在此背景驅(qū)動(dòng)下,眾多名企也紛紛在嵌入式人工智能領(lǐng)域布局
    發(fā)表于 02-26 10:17