0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內(nèi)不再提示

Web爬蟲現(xiàn)在是不是合法了

Wildesbeast ? 來源:今日頭條 ? 作者:Tom Waterman ? 2020-02-04 14:45 ? 次閱讀

技術無罪?江湖傳言,互聯(lián)網(wǎng)上50%以上的流量都是由爬蟲創(chuàng)造的,很多人都表示:無爬蟲就無互聯(lián)網(wǎng)的繁榮。也正因為此,網(wǎng)上各種爬蟲教程風靡不絕,惹各路大神小白觀之參與之。但是,無節(jié)制的背后往往隱藏著風險,類似“只因寫了一段爬蟲,公司200多人被抓!”、“程序員爬蟲竟構成犯罪?”等報道也時有發(fā)生。關于爬蟲合法性的討論,CSDN也在此前的《爬蟲到底違法嗎?這位爬蟲工程師給出了答案》、《不要在爬蟲犯罪的邊緣瘋狂試探!》等文章中進行了探討——但是,關于爬蟲的爭論一直甚囂塵上。

近日,美國法院駁回 LinkedIn 針對分析公司 HiQ 抓取其數(shù)據(jù)的申訴一事件,似乎又為網(wǎng)絡爬蟲的自由添磚加了瓦。決議表明:任何可公開獲得且未經(jīng)版權保護的數(shù)據(jù)都可供抓??!可以說,這是數(shù)據(jù)隱私和數(shù)據(jù)監(jiān)管時代的歷史性時刻。那么,作為開發(fā)者的你,如何看到這一事件呢?關于爬蟲的風險性又該怎么定論?

2019年末,美國上訴法院駁回了 LinkedIn 針對分析公司 HiQ 抓取其數(shù)據(jù)的申訴。

這項決議是數(shù)據(jù)隱私和數(shù)據(jù)監(jiān)管時代的歷史性時刻。這項決議表明,任何可公開獲得且未經(jīng)版權保護的數(shù)據(jù)都可供網(wǎng)絡爬蟲自由抓取。

但是抓取數(shù)據(jù)的商業(yè)用途仍然有限

然而,這項決議并沒有授予 HiQ 或其他網(wǎng)絡爬蟲將抓取獲得的數(shù)據(jù)用于商業(yè)目的的自由。

例如,網(wǎng)絡爬蟲可以在 YouTube 上搜索視頻標題,但由于這些視頻已獲得版權,因此不可以將 YouTube 視頻轉發(fā)到自己的網(wǎng)站上。

一般來說,無論你以何種方式獲取數(shù)據(jù),數(shù)據(jù)(包括視頻或音樂之類的媒體文件數(shù)據(jù))的版權依然有效。

某些形式的網(wǎng)頁爬蟲仍然是非法的

這項決議也沒有賦予網(wǎng)絡爬蟲自由地從需要身份驗證的站點獲取數(shù)據(jù)的權利。

例如,根據(jù)規(guī)定網(wǎng)絡爬蟲不可以登錄到 Facebook 并下載用戶的數(shù)據(jù)。

該規(guī)則不包括那些要求用戶在認證之前必須同意使用條款的網(wǎng)站,因為通常這些服務條款都會禁止諸如自動收集數(shù)據(jù)之類的活動。

但是,由于公開站點無法要求用戶在訪問數(shù)據(jù)之前同意任何服務條款,因此用戶可以自由使用網(wǎng)絡爬蟲程序從站點收集的數(shù)據(jù)。

各個網(wǎng)站仍然可以使用技術來限制網(wǎng)絡爬蟲

盡管如今各個公司不太可能通過法律途徑應對網(wǎng)絡爬蟲程序,但他們?nèi)匀豢梢酝ㄟ^其他方式限制網(wǎng)絡爬蟲。

例如,各個網(wǎng)站可以使用“限速”等技術來防止爬蟲程序一次下載太多網(wǎng)頁。此外,各個網(wǎng)站還可以使用 CAPTCHA 等技術來測試是用戶還是網(wǎng)絡爬蟲正在請求該頁面。

這些技術通常用于防止惡意機器人導致網(wǎng)站超載,引起網(wǎng)站崩潰。但是,這些技術也可以廣泛用于限制網(wǎng)絡爬蟲的自動抓取。

LinkedIn可能會進一步上訴

盡管美國上訴法院駁回了LinkedIn的請求,但他們可能還有最后一步棋:向美國最高法院提出上訴。

美國最高法院有權推翻上訴法院的判決,而且還可以撤銷網(wǎng)絡爬蟲公開使用非版權數(shù)據(jù)的合法化。但是,并非所有上訴至最高法院的決定都能得到實際的審查。

但是,我們?nèi)匀豢梢哉J為最高法院很可能會審查本案的裁決。畢竟數(shù)據(jù)政策和相關的隱私問題是相對較新的法律,而且會對 LinkedIn 等公司產(chǎn)生重大的商業(yè)影響。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • Web
    Web
    +關注

    關注

    2

    文章

    1266

    瀏覽量

    69571
  • 爬蟲
    +關注

    關注

    0

    文章

    82

    瀏覽量

    6953
收藏 人收藏

    評論

    相關推薦

    ADS8556電路,測干電池電壓得到的結果有上下0.01V的偏差,是不是太大

    我的ADS8556電路,測干電池電壓得到的結果有上下0.01V的偏差,是不是太大
    發(fā)表于 01-15 08:07

    DAC80004的轉換速率是不是用setting time這個參數(shù)來衡量

    DAC的轉換速率是不是用setting time這個參數(shù)來衡量?如果建立時間是1us,是不是表示轉換速率是1Msps,我看到DAC80004的setting time是5.8us,在產(chǎn)品選型的時候
    發(fā)表于 12-31 08:00

    IP地址數(shù)據(jù)信息和爬蟲攔截的關聯(lián)

    IP地址數(shù)據(jù)信息和爬蟲攔截的關聯(lián)主要涉及到兩方面的內(nèi)容,也就是數(shù)據(jù)信息和爬蟲。IP 地址數(shù)據(jù)信息的內(nèi)容豐富,包括所屬地域、所屬網(wǎng)絡運營商、訪問時間序列、訪問頻率等。 從IP地址信息中可以窺見
    的頭像 發(fā)表于 12-23 10:13 ?74次閱讀

    海外爬蟲IP的合法邊界:合規(guī)性探討與實踐

    海外爬蟲IP的合法邊界主要涉及合規(guī)性探討與實踐。
    的頭像 發(fā)表于 10-12 07:56 ?245次閱讀

    揭秘貼片功率電感發(fā)燙究竟是不是燒壞了

    電子發(fā)燒友網(wǎng)站提供《揭秘貼片功率電感發(fā)燙究竟是不是燒壞了.docx》資料免費下載
    發(fā)表于 09-30 14:44 ?0次下載

    詳細解讀爬蟲多開代理IP的用途,以及如何配置!

    爬蟲多開代理IP是一種在爬蟲開發(fā)中常用的技術策略,主要用于提高數(shù)據(jù)采集效率、避免IP被封禁以及獲取地域特定的數(shù)據(jù)。
    的頭像 發(fā)表于 09-14 07:55 ?526次閱讀

    THS3091放大脈寬是1ns的脈沖,脈沖的脈寬展寬,是不是THS3091的壓擺率不夠?

    用THS3091,放大脈寬是1ns的脈沖,脈沖的脈寬展寬,是不是THS3091的壓擺率不夠。 1ns脈寬的脈沖,是不是壓擺率=2×pi×f×Vpk要大于10000V/us,
    發(fā)表于 08-19 06:02

    谷景告訴你屏蔽繞線功率電感是不是感量越大性能越好

    谷景告訴你屏蔽繞線功率電感是不是感量越大性能越好 編輯:谷景電子 屏蔽繞線功率電感是一種普遍的電路電感元件,它對于電路運行的穩(wěn)定性特別重要。而電感量作為屏蔽繞線功率電感的一個性能指標,也是我們在做
    的頭像 發(fā)表于 06-10 18:48 ?565次閱讀

    STM32的USB速度提不上去是怎么回事?

    搞了很久的STM32的USB結果感覺連USB最簡單的都沒搞懂 現(xiàn)在主要是USB速度提不上去,速度一直在20,30KB晃蕩 目前沒開雙緩沖的,不過我看別人的速度都能到100多KB/s; 郁悶現(xiàn)在是
    發(fā)表于 05-17 08:10

    STVD是不是不支持C99?

    內(nèi)容如標題所示,麻煩有懂的朋友告訴下我,這個問題花費我很多時間。 不知道STVD是不是不支持C99??
    發(fā)表于 05-16 08:04

    請問STM32Cube包含的FATFS例程是不是已經(jīng)支持8G以上的SD卡

    STM32Cube包含的FATFS例程是不是已經(jīng)支持8G以上的SD卡? 我手頭沒有合適的卡做測試,有人知道么 stm324xg_eval_sd.c 文件的uint8_t
    發(fā)表于 05-16 06:18

    STM32F207V FSMC是不是上電運行后就應該用示波器測量能夠在PB7管腳上測量到一個鎖存信號?

    現(xiàn)在需要用到FSMC,那是不是上電運行后就應該用示波器測量能夠在PB7管腳上測量到一個鎖存信號?
    發(fā)表于 05-15 08:16

    共模電感是不是感值越大越好

    電子發(fā)燒友網(wǎng)站提供《共模電感是不是感值越大越好.docx》資料免費下載
    發(fā)表于 03-29 14:38 ?2次下載

    浪涌保護器安培是不是越大越好?

    浪涌保護器安培是不是越大越好? 浪涌保護器是一種用于保護電子設備免受電力系統(tǒng)中的浪涌電流或電壓峰值的裝置。它們能夠將過高的電壓或電流引導到地線,并確保設備的正常運行。然而,浪涌保護器的安培值并不總是
    的頭像 發(fā)表于 02-05 14:55 ?1657次閱讀

    浪涌電流是不是啟動電流?

    浪涌電流是不是啟動電流? 浪涌電流不是啟動電流。浪涌電流是指在電器設備開關或連接電源時的瞬時電流峰值。啟動電流是指電動機或其他大功率設備在啟動時需要的電流。 當電器設備啟動或重新連接到電源時,通常會
    的頭像 發(fā)表于 02-05 14:55 ?1327次閱讀