0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

匿名和去識(shí)別化在數(shù)據(jù)隱私保護(hù)方面的重要性

如意 ? 來源:讀芯術(shù)微信公眾號(hào) ? 作者:讀芯術(shù)微信公眾號(hào) ? 2020-09-16 15:14 ? 次閱讀

匿名化是為了確保數(shù)據(jù)的隱私性,公司用它來保護(hù)敏感數(shù)據(jù)。這類數(shù)據(jù)包括:

私人數(shù)據(jù)

業(yè)務(wù)信息,如財(cái)務(wù)信息或商業(yè)秘密

機(jī)密信息,如軍事機(jī)密或政府信息

匿名化為遵循個(gè)人數(shù)據(jù)相關(guān)隱私條例提供了范例,個(gè)人數(shù)據(jù)和業(yè)務(wù)數(shù)據(jù)的重合之處就是客戶信息所在。但并非所有的業(yè)務(wù)數(shù)據(jù)都受監(jiān)管,本文將重點(diǎn)討論個(gè)人數(shù)據(jù)的保護(hù)。

匿名和去識(shí)別化在數(shù)據(jù)隱私保護(hù)方面的重要性

敏感數(shù)據(jù)類型示例

在歐洲,監(jiān)管機(jī)構(gòu)將任何與某人(如你的名字)有關(guān)的信息定義為“個(gè)人數(shù)據(jù)”。不論形式,任何關(guān)聯(lián)到此人的信息都符合上述定義。從上世紀(jì)起,個(gè)人數(shù)據(jù)收集逐漸民主化,數(shù)據(jù)匿名化問題開始出現(xiàn)。隨著隱私條例在世界各地開始生效,這件事尤顯重要。

什么是數(shù)據(jù)匿名化,為何要關(guān)注它?

我們從經(jīng)典定義開始。歐盟的《通用數(shù)據(jù)保護(hù)條例》(GDPR)是這樣定義對(duì)匿名信息的:“與識(shí)別或可識(shí)別自然人無關(guān)的信息,或以數(shù)據(jù)主體不能或不再可識(shí)別的方式匿名提供的個(gè)人信息?!?/p>

其中,“可識(shí)別”和“不再”至關(guān)重要。這不僅意味著你的名字不應(yīng)再出現(xiàn)在數(shù)據(jù)中,也意味著不能從剩余數(shù)據(jù)中發(fā)現(xiàn)你是誰,這與再認(rèn)同(有時(shí)也叫去匿名化)過程有關(guān)。

同樣,GDPR(契約中)陳述了一個(gè)重要事實(shí):“……因此,數(shù)據(jù)保護(hù)不應(yīng)適用于匿名信息”。所以,若你設(shè)法匿名數(shù)據(jù),就不再受GDPR數(shù)據(jù)保護(hù)法的約束。

你可以執(zhí)行任何處理操作,如分析或數(shù)據(jù)貨幣化。這帶來了大量機(jī)會(huì):

出售數(shù)據(jù)顯然是首選用途。在世界各地,隱私保護(hù)法正在限制個(gè)人數(shù)據(jù)交易,而匿名數(shù)據(jù)為公司提供了另一種選擇。

它帶來了合作機(jī)會(huì)。許多公司為了創(chuàng)新或研究而共享數(shù)據(jù),匿名數(shù)據(jù)有助于降低風(fēng)險(xiǎn)。

它還為數(shù)據(jù)分析和機(jī)器學(xué)習(xí)創(chuàng)造了機(jī)會(huì)。在保持兼容性的同時(shí)運(yùn)行敏感數(shù)據(jù)的操作正變得越來越復(fù)雜,匿名數(shù)據(jù)為統(tǒng)計(jì)分析和模型訓(xùn)練提供了安全的原材料,前景一片光明。但實(shí)際上真正的匿名數(shù)據(jù)往往并不如愿。

數(shù)據(jù)隱私保護(hù)機(jī)制的范圍

數(shù)據(jù)的隱私保護(hù)有一個(gè)范圍。多年來,專家們研發(fā)了一系列集方法、機(jī)制和工具為一體的技術(shù)。這些技術(shù)生成了具有不同的匿名級(jí)別和不同再識(shí)別風(fēng)險(xiǎn)等級(jí)的數(shù)據(jù)??梢哉f,其范圍涵蓋了個(gè)人可識(shí)別數(shù)據(jù)乃至真正的匿名數(shù)據(jù)。

匿名和去識(shí)別化在數(shù)據(jù)隱私保護(hù)方面的重要性

數(shù)據(jù)隱私的范圍

左端,有包含直接個(gè)人識(shí)別碼的數(shù)據(jù)。通過這些元素,可以識(shí)別你的姓名、地址或電話號(hào)碼。另一端,則是GDPR引用的匿名數(shù)據(jù)。

如你所見,這些數(shù)據(jù)有一個(gè)中間范疇。它處于可識(shí)別數(shù)據(jù)和匿名數(shù)據(jù)之間,即假名數(shù)據(jù)和去識(shí)別數(shù)據(jù)。請(qǐng)注意,其界定仍有爭(zhēng)議。有些報(bào)告認(rèn)為假名化是去識(shí)別化的一部分, 而另一些報(bào)告則將其排除在外。

生成這種“中間數(shù)據(jù)”的技術(shù)本身并無問題。它們能有效地將數(shù)據(jù)最小化。根據(jù)用例需求,它們將彼此關(guān)聯(lián),發(fā)揮用處。但切記,它們無法生成真正的匿名數(shù)據(jù),它們的機(jī)制無法保證阻止再識(shí)別,所以將其生成的數(shù)據(jù)稱為“匿名數(shù)據(jù)”是一種誤導(dǎo)。

匿名和“匿名”

假名化和去識(shí)別化確實(shí)能在某些方面保護(hù)數(shù)據(jù)隱私。但根據(jù)GDPR的定義,它們無法生成匿名數(shù)據(jù)。

假名化技術(shù)從數(shù)據(jù)中刪除或替換直接個(gè)人標(biāo)識(shí)碼,例如,從數(shù)據(jù)集中刪除所有名稱和電子郵件,你無法直接從假名數(shù)據(jù)中識(shí)別某人,不過可以間接識(shí)別。實(shí)際上,剩余數(shù)據(jù)通常會(huì)保留間接識(shí)別碼,組合這些信息后,就能創(chuàng)建直接識(shí)別碼,如出生日期,郵編,性別等。

就此而言,假名化在GDPR框架中有一個(gè)單獨(dú)定義:“……以以下方式處理個(gè)人數(shù)據(jù),即在不使用附加信息的情況下,數(shù)據(jù)不再可以歸因于特定數(shù)據(jù)主體”。與匿名數(shù)據(jù)相反,假名數(shù)據(jù)符合GDPR的要求。

去識(shí)別化技術(shù)從數(shù)據(jù)中去除直接和間接的個(gè)人身份識(shí)別碼。理論上,去識(shí)別化數(shù)據(jù)和匿名化數(shù)據(jù)之間的界限很簡(jiǎn)單。最新消息表明:有技術(shù)可保障永遠(yuǎn)無法再識(shí)別數(shù)據(jù)。這是一種“疑罪從無”的情況,去識(shí)別化數(shù)據(jù)在未識(shí)別之前是匿名的。每當(dāng)專家設(shè)法重新識(shí)別那些最初未識(shí)別出的數(shù)據(jù)時(shí),他們都進(jìn)一步推動(dòng)了發(fā)展。

數(shù)據(jù)重新識(shí)別不斷重新定義匿名

上述機(jī)制類型對(duì)隱私保護(hù)沒有同等效力,因此如何處理這些數(shù)據(jù)很重要。公司定期發(fā)布或出售他們聲稱“匿名”的數(shù)據(jù),但當(dāng)他們使用的方法不能保證“匿名”時(shí),就會(huì)帶來隱患。

眾多事件表明,假名化數(shù)據(jù)這種隱私保護(hù)機(jī)制仍有缺陷。數(shù)據(jù)中的間接識(shí)別碼會(huì)帶來巨大的再識(shí)別風(fēng)險(xiǎn)。隨著可用數(shù)據(jù)量的增長(zhǎng),相互參照數(shù)據(jù)集的機(jī)會(huì)也在增加:

1990年,麻省理工學(xué)院的研究生從去識(shí)別化醫(yī)療數(shù)據(jù)中重新確認(rèn)了馬薩諸塞州州長(zhǎng)的身份,她將這些信息與公用人口普查數(shù)據(jù)相互參照來確定患者身份。

2006年,作為研究計(jì)劃的一部分,美國在線公司(AOL)共享了去識(shí)別化搜索數(shù)據(jù),研究人員能夠?qū)⑺阉鞑樵兣c背后的個(gè)人聯(lián)系起來。

2009年,作為比賽的一部分,網(wǎng)飛(Netflix)發(fā)布了一個(gè)匿名電影評(píng)級(jí)數(shù)據(jù)集,德克薩斯州的研究人員成功重新識(shí)別了用戶。

同是2009年,研究人員僅利用公開信息就能預(yù)測(cè)出一個(gè)人的社會(huì)保險(xiǎn)號(hào)。

最近研究表明,去識(shí)別化數(shù)據(jù)實(shí)際上可以被重新識(shí)別。比利時(shí)新魯汶大學(xué)和倫敦帝國理工學(xué)院的研究人員發(fā)現(xiàn):“使用15個(gè)人口統(tǒng)計(jì)屬性,在任何數(shù)據(jù)集中,99.98%的美國人都能被正確地重新識(shí)別。”

另一項(xiàng)針對(duì)匿名手機(jī)數(shù)據(jù)的研究表明:“四個(gè)時(shí)空點(diǎn)就足以唯一識(shí)別95%的個(gè)體用戶”。

技術(shù)日益進(jìn)步,更多的數(shù)據(jù)正在被創(chuàng)建,研究人員正在努力劃定去識(shí)別化數(shù)據(jù)和匿名數(shù)據(jù)之間的界限。2017年,研究人員發(fā)表論文稱:“網(wǎng)絡(luò)瀏覽歷史只能通過公開數(shù)據(jù)鏈接到社交媒體上的個(gè)人資料。”

另一個(gè)令人擔(dān)憂的問題是個(gè)人資料的泄露,越來越多的個(gè)人信息遭到泄露。ForgeRock消費(fèi)者身份泄露報(bào)告預(yù)測(cè),2020年的信息泄露數(shù)量將超過去年,僅美國,2020年第一季度就有超過16億的客戶記錄被泄露。

分開處理的數(shù)據(jù)集無法重新識(shí)別,但與泄露數(shù)據(jù)結(jié)合起來,它會(huì)造成更大的威脅。哈佛大學(xué)的學(xué)生能夠利用泄露的數(shù)據(jù)重新識(shí)別去識(shí)別化數(shù)據(jù)。

總之,那些我們所認(rèn)為的“匿名數(shù)據(jù)”往往并不是真正的匿名數(shù)據(jù)。并非所有的數(shù)據(jù)凈化方法都會(huì)生成真正的匿名數(shù)據(jù)。事事都各有優(yōu)點(diǎn),但沒有一種能提供與匿名同等級(jí)別的隱私。隨著數(shù)據(jù)量的不斷增長(zhǎng),創(chuàng)建真正的匿名數(shù)據(jù)也越來越難,公司發(fā)布潛在可重新識(shí)別的個(gè)人數(shù)據(jù)的風(fēng)險(xiǎn)也在增加。
責(zé)編AJX

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 數(shù)據(jù)
    +關(guān)注

    關(guān)注

    8

    文章

    7115

    瀏覽量

    89333
  • 匿名
    +關(guān)注

    關(guān)注

    0

    文章

    6

    瀏覽量

    6799
  • 隱私保護(hù)
    +關(guān)注

    關(guān)注

    0

    文章

    299

    瀏覽量

    16461
收藏 人收藏

    評(píng)論

    相關(guān)推薦

    深度自然匿名隱私保護(hù)與視覺完整并存的未來!

    在科技快速發(fā)展的當(dāng)下,個(gè)人隱私保護(hù)的需求日益凸顯。如何能在隱私保護(hù)的基礎(chǔ)上,保持視覺完整,從而推動(dòng)企業(yè)開發(fā)與創(chuàng)新? 深度自然
    的頭像 發(fā)表于 01-15 15:57 ?803次閱讀
    深度自然<b class='flag-5'>匿名</b><b class='flag-5'>化</b>:<b class='flag-5'>隱私</b><b class='flag-5'>保護(hù)</b>與視覺完整<b class='flag-5'>性</b>并存的未來!

    浪涌保護(hù)在數(shù)據(jù)中心的重要性

    中心的設(shè)備造成嚴(yán)重?fù)p害。 1. 浪涌保護(hù)器的定義和作用 浪涌保護(hù)器是一種用于限制電氣浪涌電壓的裝置,它能夠吸收多余的電壓或電流,保護(hù)連接的設(shè)備不受損害。在數(shù)據(jù)中心中,浪涌
    的頭像 發(fā)表于 12-05 10:18 ?190次閱讀

    康謀分享 | 數(shù)據(jù)隱私匿名:PIPL與GDPR下,如何確保數(shù)據(jù)合規(guī)?(二)

    自動(dòng)駕駛技術(shù)飛速發(fā)展,但數(shù)據(jù)隱私安全成攔路虎?別擔(dān)心,本文帶您深入剖析PIPL與GDPR在數(shù)據(jù)處理行為及基礎(chǔ)合法方面的異同之處,幫助您準(zhǔn)確
    的頭像 發(fā)表于 10-30 09:30 ?1135次閱讀
    康謀分享 | <b class='flag-5'>數(shù)據(jù)</b><b class='flag-5'>隱私</b>和<b class='flag-5'>匿名</b><b class='flag-5'>化</b>:PIPL與GDPR下,如何確保<b class='flag-5'>數(shù)據(jù)</b>合規(guī)?(二)

    數(shù)據(jù)分析在數(shù)字化中的作用

    重要性 數(shù)據(jù)分析是指使用統(tǒng)計(jì)和邏輯方法對(duì)數(shù)據(jù)進(jìn)行處理和解釋的過程。它涉及到數(shù)據(jù)的收集、清洗、轉(zhuǎn)換、建模和解釋,目的是發(fā)現(xiàn)數(shù)據(jù)中的模式、趨勢(shì)
    的頭像 發(fā)表于 10-27 17:35 ?656次閱讀

    變電所繼電保護(hù)的作用與重要性

    。本文將詳細(xì)探討變電所繼電保護(hù)的功能、常見類型。 1. 繼電保護(hù)的作用與重要性 迅速隔離故障:在電力系統(tǒng)中,任何形式的故障如不即時(shí)處理都可能導(dǎo)致設(shè)備的損壞及廣泛的供電中斷。繼電保護(hù)裝置
    的頭像 發(fā)表于 10-04 14:24 ?463次閱讀

    動(dòng)態(tài)代理IP的匿名和透明度,為主要考慮關(guān)鍵!

    動(dòng)態(tài)代理IP的匿名和透明度是用戶選擇代理服務(wù)時(shí)需要考慮的關(guān)鍵因素。根據(jù)用戶的需求和場(chǎng)景,可以選擇不同匿名級(jí)別和透明度的代理服務(wù)來平衡隱私保護(hù)
    的頭像 發(fā)表于 09-20 07:36 ?315次閱讀
    動(dòng)態(tài)代理IP的<b class='flag-5'>匿名</b><b class='flag-5'>性</b>和透明度,為主要考慮關(guān)鍵!

    工業(yè)智能網(wǎng)關(guān)在數(shù)據(jù)上云方面的作用、優(yōu)勢(shì)以及實(shí)施策略

    的管理效率、安全和智能水平。本文將詳細(xì)探討工業(yè)智能網(wǎng)關(guān)在數(shù)據(jù)上云方面的作用、優(yōu)勢(shì)以及實(shí)施策略。 工業(yè)智能網(wǎng)關(guān)概述 工業(yè)智能網(wǎng)關(guān)是一種用于工業(yè)環(huán)境中的設(shè)備,能夠連接多種網(wǎng)絡(luò)和設(shè)備,實(shí)
    的頭像 發(fā)表于 09-03 13:15 ?331次閱讀

    工業(yè)物聯(lián)網(wǎng)網(wǎng)關(guān)在數(shù)據(jù)融合與邊緣智能方面的作用

    在當(dāng)今數(shù)字轉(zhuǎn)型的浪潮中,工業(yè)物聯(lián)網(wǎng)作為推動(dòng)制造業(yè)智能、自動(dòng)的關(guān)鍵力量,正深刻改變著傳統(tǒng)工業(yè)的生產(chǎn)模式與管理方式。而工業(yè)物聯(lián)網(wǎng)網(wǎng)關(guān),作為連接物理世界與數(shù)字世界的橋梁,其重要性日益凸
    的頭像 發(fā)表于 08-09 17:44 ?364次閱讀

    平衡創(chuàng)新與倫理:AI時(shí)代的隱私保護(hù)和算法公平

    。為此,開發(fā)者應(yīng)采用多元數(shù)據(jù)源,并定期進(jìn)行算法公平的評(píng)估和調(diào)整。在就業(yè)篩選等敏感領(lǐng)域,透明度和公平的結(jié)合尤為重要,這需要確保篩選過程
    發(fā)表于 07-16 15:07

    藍(lán)牙模塊的安全隱私保護(hù)

    傳輸過程中的安全性問題,分析隱私保護(hù)方面的挑戰(zhàn)和解決方案,并介紹一些提高藍(lán)牙模塊安全隱私保護(hù)
    的頭像 發(fā)表于 06-14 16:06 ?583次閱讀

    求助,ADC接地的重要性?

    ADC接地的重要性
    發(fā)表于 06-04 07:56

    論RISC-V的MCU中UART接口的重要性

    RISC-V的MCU(微控制器單元)中UART(通用異步收發(fā)器)接口的重要性主要體現(xiàn)在以下幾個(gè)方面: 廣泛的適用 : UART接口是一種用于連接兩個(gè)計(jì)算機(jī)設(shè)備的接口,允許一個(gè)設(shè)備向另一個(gè)設(shè)備發(fā)送
    發(fā)表于 05-27 15:52

    集成芯片的重要性和必要

    集成芯片在現(xiàn)代科技和工業(yè)中占據(jù)著至關(guān)重要的地位,其重要性和必要主要體現(xiàn)在以下幾個(gè)方面。
    的頭像 發(fā)表于 03-18 15:17 ?1284次閱讀

    PLC網(wǎng)關(guān)的重要性

    的關(guān)鍵組件。 一、PLC網(wǎng)關(guān)簡(jiǎn)介 PLC網(wǎng)關(guān)是一種能夠連接PLC設(shè)備和物聯(lián)網(wǎng)系統(tǒng)的硬件設(shè)備。它一方面提供與PLC設(shè)備的通信接口,另一方面具備聯(lián)網(wǎng)功能,能夠?qū)LC設(shè)備的數(shù)據(jù)上傳到物聯(lián)網(wǎng)云平臺(tái),實(shí)現(xiàn)設(shè)備的遠(yuǎn)程監(jiān)控和管理。 二、PL
    的頭像 發(fā)表于 01-30 15:50 ?610次閱讀
    PLC網(wǎng)關(guān)的<b class='flag-5'>重要性</b>

    一眼看懂鴻蒙OS 應(yīng)用隱私保護(hù)

    隨著移動(dòng)終端及其相關(guān)業(yè)務(wù)(如移動(dòng)支付、終端云等)的普及,用戶隱私保護(hù)重要性愈發(fā)突出。應(yīng)用開發(fā)者在產(chǎn)品設(shè)計(jì)階段就需要考慮保護(hù)的用戶隱私,提高
    的頭像 發(fā)表于 01-26 17:04 ?914次閱讀
    一眼看懂鴻蒙OS 應(yīng)用<b class='flag-5'>隱私</b><b class='flag-5'>保護(hù)</b>