0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
电子发烧友
开通电子发烧友VIP会员 尊享10大特权
海量资料免费下载
精品直播免费看
优质内容免费畅学
课程9折专享价
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

GitHub上開源了個(gè)集眾多數(shù)據(jù)源于一身的爬蟲工具箱——InfoSpider

人工智能與大數(shù)據(jù)技術(shù) ? 來(lái)源:開源最前線 ? 作者:開源最前線 ? 2020-11-23 11:28 ? 次閱讀

國(guó)內(nèi)一位開發(fā)者在 GitHub 上開源了個(gè)集眾多數(shù)據(jù)源于一身的爬蟲工具箱——InfoSpider,一不小心就火了!??!

有多火呢?開源沒幾天就登上GitHub周榜第四,標(biāo)星1.3K,累計(jì)分支172個(gè)(GitHub地址:https://github.com/kangvcar/InfoSpider) 在這樣一個(gè)信息爆炸的時(shí)代,每個(gè)人都有很多個(gè)賬號(hào),賬號(hào)一多就會(huì)出現(xiàn)這么一個(gè)情況:個(gè)人數(shù)據(jù)分散在各種各樣的公司之間,就會(huì)形成數(shù)據(jù)孤島,多維數(shù)據(jù)無(wú)法融合,這個(gè)項(xiàng)目可以幫你將多維數(shù)據(jù)進(jìn)行融合并對(duì)個(gè)人數(shù)據(jù)進(jìn)行分析,這樣你就可以更直觀、深入了解自己的信息。 InfoSpider 是一個(gè)集眾多數(shù)據(jù)源于一身的爬蟲工具箱,旨在安全快捷的幫助用戶拿回自己的數(shù)據(jù),工具代碼開源,流程透明。并提供數(shù)據(jù)分析功能,基于用戶數(shù)據(jù)生成圖表文件,使得用戶更直觀、深入了解自己的信息。

目前支持?jǐn)?shù)據(jù)源包括GitHub、QQ郵箱、網(wǎng)易郵箱、阿里郵箱、新浪郵箱、Hotmail郵箱、Outlook郵箱、京東、淘寶、支付寶、中國(guó)移動(dòng)、中國(guó)聯(lián)通、中國(guó)電信、知乎、嗶哩嗶哩、網(wǎng)易云音樂、QQ好友、QQ群、生成朋友圈相冊(cè)、瀏覽器瀏覽歷史、12306、博客園、CSDN博客、開源中國(guó)博客、簡(jiǎn)書。 根據(jù)創(chuàng)建者介紹,InfoSpider 具有以下特性:

安全可靠:本項(xiàng)目為開源項(xiàng)目,代碼簡(jiǎn)潔,所有源碼可見,本地運(yùn)行,安全可靠。

使用簡(jiǎn)單:提供 GUI 界面,只需點(diǎn)擊所需獲取的數(shù)據(jù)源并根據(jù)提示操作即可。

結(jié)構(gòu)清晰:本項(xiàng)目的所有數(shù)據(jù)源相互獨(dú)立,可移植性高,所有爬蟲腳本在項(xiàng)目的 Spiders 文件下。

數(shù)據(jù)源豐富:本項(xiàng)目目前支持多達(dá)24+個(gè)數(shù)據(jù)源,持續(xù)更新。

數(shù)據(jù)格式統(tǒng)一:爬取的所有數(shù)據(jù)都將存儲(chǔ)為json格式,方便后期數(shù)據(jù)分析。

個(gè)人數(shù)據(jù)豐富:本項(xiàng)目將盡可能多地為你爬取個(gè)人數(shù)據(jù),后期數(shù)據(jù)處理可根據(jù)需要?jiǎng)h減。

數(shù)據(jù)分析:本項(xiàng)目提供個(gè)人數(shù)據(jù)的可視化分析,目前僅部分支持。

InfoSpider使用起來(lái)也非常簡(jiǎn)單,你只需要安裝python3和Chrome瀏覽器,運(yùn)行 python3 main.py,在打開的窗口點(diǎn)擊數(shù)據(jù)源按鈕, 根據(jù)提示選擇數(shù)據(jù)保存路徑,接著輸入賬號(hào)密碼,就會(huì)自動(dòng)爬取數(shù)據(jù),根據(jù)下載的目錄就可以查看爬下來(lái)的數(shù)據(jù)。 是不是很簡(jiǎn)單呢,如果你對(duì)InfoSpider也感興趣,趕緊試一下。

責(zé)任編輯:lq

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 開源
    +關(guān)注

    關(guān)注

    3

    文章

    3582

    瀏覽量

    43452
  • GitHub
    +關(guān)注

    關(guān)注

    3

    文章

    481

    瀏覽量

    17435
  • 爬蟲
    +關(guān)注

    關(guān)注

    0

    文章

    83

    瀏覽量

    7348

原文標(biāo)題:一款爆紅的開源爬蟲工具箱

文章出處:【微信號(hào):TheBigData1024,微信公眾號(hào):人工智能與大數(shù)據(jù)技術(shù)】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 0人收藏

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    Made with KiCad(104):Cynthion - 用于構(gòu)建、分析和 Hack USB 設(shè)備的多功能工具

    “ ?Cynthion 是 USB 設(shè)備構(gòu)建、測(cè)試、監(jiān)控和實(shí)驗(yàn)于一身工具。采用基于 FPGA 的獨(dú)特架構(gòu),其數(shù)字硬件可根據(jù)應(yīng)用進(jìn)行完全定制。因此,它可以充當(dāng)不折不扣的高速 US
    的頭像 發(fā)表于 04-30 16:47 ?918次閱讀
    Made with KiCad(104):Cynthion - 用于構(gòu)建、分析和 Hack USB 設(shè)備的多功能<b class='flag-5'>工具</b>

    NVIDIA推出開源物理AI數(shù)據(jù)

    標(biāo)準(zhǔn)化合成數(shù)據(jù)的初始版本預(yù)計(jì)將成為世界最大的此類數(shù)據(jù),目前已作為開源版本提供給機(jī)器人開發(fā)人員。
    的頭像 發(fā)表于 03-24 17:52 ?536次閱讀

    Open Echo:個(gè)開源的聲納項(xiàng)目

    “ ?這是個(gè)還在迭代中的項(xiàng)目。開源的回聲測(cè)深儀/水深測(cè)量?jī)x/聲吶系統(tǒng),適用于水文測(cè)繪及科研用途。基于Arduino平臺(tái)開發(fā)并具備良好兼容性? ” ? Open Echo 概覽 作為持續(xù)迭代
    的頭像 發(fā)表于 03-20 11:14 ?679次閱讀
    Open Echo:<b class='flag-5'>一</b><b class='flag-5'>個(gè)</b><b class='flag-5'>開源</b>的聲納項(xiàng)目

    十堰新批智慧路燈投用,多種功能于一身 智慧路燈案例分享

    十堰新批智慧路燈投用,多種功能于一身 智慧路燈案例分享
    的頭像 發(fā)表于 01-03 10:39 ?300次閱讀
    十堰新<b class='flag-5'>一</b>批智慧路燈投用,<b class='flag-5'>集</b>多種功能<b class='flag-5'>于一身</b> 智慧路燈案例分享

    性能與成本于一身的IMU,讓無(wú)人機(jī)飛行更穩(wěn)定

    無(wú)人機(jī)在進(jìn)行任何形式的飛行時(shí),必須了解空中平臺(tái)的方向、其運(yùn)動(dòng)的性質(zhì)以及飛行方向。通常用于測(cè)量此運(yùn)動(dòng)的是IMU,IMU提供與無(wú)人機(jī)三個(gè)軸向的加速度和角速度數(shù)據(jù),以及有關(guān)無(wú)人機(jī)在橫滾、俯仰和偏航方面的測(cè)量數(shù)據(jù)。常見應(yīng)用包括控制和穩(wěn)定
    的頭像 發(fā)表于 12-19 15:45 ?833次閱讀
    <b class='flag-5'>集</b>性能與成本<b class='flag-5'>于一身</b>的IMU,讓無(wú)人機(jī)飛行更穩(wěn)定

    手持多參數(shù)速測(cè)記錄儀:多種測(cè)量功能于

    速測(cè)記錄儀的顯著特點(diǎn)便是能夠多種測(cè)量功能于一身,廣泛涵蓋了眾多關(guān)鍵參數(shù)的檢測(cè)。在水質(zhì)分析領(lǐng)域,它可以精確測(cè)量酸堿度(pH),實(shí)時(shí)反映水體的酸堿性程度,這對(duì)于判斷水質(zhì)是否適宜水生生物生存以及評(píng)估水體受污染狀況至
    的頭像 發(fā)表于 12-17 11:13 ?371次閱讀

    Mybatis 攔截器實(shí)現(xiàn)單數(shù)據(jù)源內(nèi)多數(shù)據(jù)庫(kù)切換

    作者:京東保險(xiǎn) 王奕龍 物流的分揀業(yè)務(wù)在某些分揀場(chǎng)地只有個(gè)數(shù)據(jù)源,因?yàn)?b class='flag-5'>數(shù)據(jù)量比較大,將所有數(shù)據(jù)存在張表內(nèi)查詢速度慢,也為了做不同設(shè)備
    的頭像 發(fā)表于 12-12 10:23 ?1246次閱讀

    MathWorks攜手NXP推出用于電池管理系統(tǒng)的新工具箱

    DesignToolbox (MBDT)。該工具箱支持工程師在 MATLAB 和 Simulink 中進(jìn)行 BMS 應(yīng)用的建模、開發(fā)和驗(yàn)證,自動(dòng)從 MATLAB 為 NXP 電芯控制器生成 C 代碼,并支持 NXP 的軟件解決方案,BMS SDK 組件。
    的頭像 發(fā)表于 11-20 14:18 ?618次閱讀

    “0元購(gòu)”智元靈犀X1機(jī)器人,軟硬件全套圖紙和代碼全公開!資料免費(fèi)下載!

    提供核心組件的基礎(chǔ),智元機(jī)器人完整地開源軟硬件全套圖紙和代碼,總資料大小超過(guò)1.2GB。在整機(jī)結(jié)構(gòu)硬件方面,提供整機(jī)結(jié)構(gòu)圖紙、整機(jī)硬件框圖、整機(jī)BOM,細(xì)致到每
    發(fā)表于 10-25 15:20

    雖然下載contourlet工具箱但是運(yùn)行代碼出現(xiàn)函數(shù)或變量 \'resampc\' 無(wú)法識(shí)別。

    下載并將contourlet工具箱放到matlab路徑中了,依然不能使用pdfbdec函數(shù)
    發(fā)表于 08-22 17:14

    RFID手持機(jī)是怎么工作的?

    RFID手持機(jī)是帶有RFID識(shí)讀功能的手持設(shè)備,除了能對(duì)電子標(biāo)簽進(jìn)行識(shí)讀,還其他數(shù)據(jù)采集方式及功能于一身,滿足不同場(chǎng)景的應(yīng)用需求。
    的頭像 發(fā)表于 07-05 15:56 ?535次閱讀

    如何使用MATLAB神經(jīng)網(wǎng)絡(luò)工具箱

    神經(jīng)網(wǎng)絡(luò)是種模擬人腦神經(jīng)元網(wǎng)絡(luò)的計(jì)算模型,廣泛應(yīng)用于各種領(lǐng)域,如圖像識(shí)別、語(yǔ)音識(shí)別、自然語(yǔ)言處理等。在MATLAB中,可以使用神經(jīng)網(wǎng)絡(luò)工具箱(Neural Network Toolbox)來(lái)構(gòu)建
    的頭像 發(fā)表于 07-03 10:34 ?3739次閱讀

    matlab神經(jīng)網(wǎng)絡(luò)工具箱結(jié)果分析

    神經(jīng)網(wǎng)絡(luò)是種強(qiáng)大的機(jī)器學(xué)習(xí)技術(shù),廣泛應(yīng)用于各種領(lǐng)域,如圖像識(shí)別、語(yǔ)音識(shí)別、自然語(yǔ)言處理等。MATLAB提供個(gè)功能強(qiáng)大的神經(jīng)網(wǎng)絡(luò)工具箱,
    的頭像 發(fā)表于 07-03 10:32 ?1096次閱讀

    數(shù)據(jù)采集方法有哪些?工具有哪些?

    上收集數(shù)據(jù)。它通過(guò)模擬用戶瀏覽網(wǎng)頁(yè)的行為,獲取網(wǎng)頁(yè)的文本、圖片、鏈接等信息。網(wǎng)絡(luò)爬蟲可以應(yīng)用于各種場(chǎng)景,如市場(chǎng)調(diào)研、社交媒體分析、新聞聚合等。 常用的網(wǎng)絡(luò)爬蟲
    的頭像 發(fā)表于 07-01 15:35 ?2335次閱讀

    常見的數(shù)據(jù)采集工具的介紹

    數(shù)據(jù)采集是數(shù)據(jù)分析和處理的基礎(chǔ),它涉及到從各種數(shù)據(jù)源中提取、收集和整理數(shù)據(jù)的過(guò)程。數(shù)據(jù)采集工具
    的頭像 發(fā)表于 07-01 14:51 ?1596次閱讀

    電子發(fā)燒友

    中國(guó)電子工程師最喜歡的網(wǎng)站

    • 2931785位工程師會(huì)員交流學(xué)習(xí)
    • 獲取您個(gè)性化的科技前沿技術(shù)信息
    • 參加活動(dòng)獲取豐厚的禮品