0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
电子发烧友
开通电子发烧友VIP会员 尊享10大特权
海量资料免费下载
精品直播免费看
优质内容免费畅学
课程9折专享价
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

Photon:一個(gè)超快的公共情報(bào)搜集爬蟲

科技綠洲 ? 來源:Python實(shí)用寶典 ? 作者:Python實(shí)用寶典 ? 2023-10-31 15:17 ? 次閱讀

Photon是一個(gè)由s0md3v開源的情報(bào)搜集爬蟲,其主要功能有:

1.爬取鏈接(內(nèi)鏈、外鏈)。
2.爬取帶參數(shù)的鏈接,如(pythondict.com/test?id=2)。
3.文件(pdf, png, xml)。
4.密鑰(在前端代碼中不小心被釋放出來的)。
5.js文件和Endpoint(spring中比較重要的監(jiān)視器)
6.匹配自定義正則表達(dá)式的字符串。
7.子域名和DNS相關(guān)數(shù)據(jù)。

你可以用它來干很多事,比如爬圖片、找漏洞、找子域名、爬數(shù)據(jù)等等。而且提取出來的數(shù)據(jù)格式非常整潔:

圖片

不僅如此,它甚至支持json格式 ,僅需要在輸入命令的時(shí)候加上json參數(shù):

python photon.py -u "http://example.com" --export=json

為什么能用來做情報(bào)搜集呢?耐心往后看哦。

1.下載安裝

你可以上photon的github下載完整項(xiàng)目:
https://github.com/s0md3v/Photon

或者關(guān)注下方Python實(shí)用寶典公眾號(hào)在后臺(tái)回復(fù)photon獲得國(guó)內(nèi)網(wǎng)盤下載地址。下載后解壓到你想要使用的地方。如果你還沒有安裝Python,建議閱讀這篇文章:超詳細(xì)Python安裝指南,進(jìn)行Python的安裝。

安裝完P(guān)ython后,打開CMD(windows)/Terminal(macOS),下面簡(jiǎn)稱為終端,進(jìn)入你剛解壓的文件夾,然后輸入以下命令安裝Photon的依賴:

pip install -r requirements.txt

如圖所示:

圖片

2.簡(jiǎn)單使用

注意,使用的時(shí)候要在Photon文件夾下。比如我們隨便提取一個(gè)網(wǎng)站的URL試一下,在終端輸入以下命令:

python photon.py -u https://bk.tencent.com/

結(jié)果如下:

圖片

它會(huì)在當(dāng)前目錄下產(chǎn)生一個(gè)你測(cè)試的域名的文件夾,比如在我這里是 bk.tencent.com:

圖片

嘻嘻,讓我們看看里面有什么東西,有沒有程序員留下的小彩蛋,打開external.txt,這是該網(wǎng)站的外鏈的存放位置??梢钥吹?,這里不僅僅是只有網(wǎng)站頁(yè)面,連CDN文件地址都會(huì)放在這里,所以external可能是個(gè)藏寶庫(kù)哦。

圖片

還能一下找出該網(wǎng)站上鏈接的全部開源項(xiàng)目:

圖片

3.擴(kuò)展

這個(gè)項(xiàng)目的價(jià)值,不僅在于能夠快速拉取你想要得到的數(shù)據(jù),還在于能夠構(gòu)建一個(gè)牛逼轟轟的 情報(bào)系統(tǒng) (如果你技術(shù)夠強(qiáng)的話)。因?yàn)樗悄懿粩嘌由煜氯サ模热鐝耐怄湷霭l(fā),你能找到很多和這個(gè)網(wǎng)站相關(guān)的訊息:

圖片

相比于搜索引擎搜索的結(jié)果,實(shí)際上這些信息更符合情報(bào)的要求。因?yàn)榇嬖诮顾阉饕媾廊〉?robot.txt, 所以 不是網(wǎng)站的所有信息都能在搜索引擎搜索得到 ,而通過這個(gè)Photon,你可以順藤摸瓜找到那些隱藏在互聯(lián)網(wǎng)世界的它們。

試想一下,如果你搜集了很多這樣的網(wǎng)站...然后用正則表達(dá)式搭建一個(gè)屬于你自己的搜索引擎,這樣的感覺是不是很棒?

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 參數(shù)
    +關(guān)注

    關(guān)注

    11

    文章

    1867

    瀏覽量

    32871
  • 開源
    +關(guān)注

    關(guān)注

    3

    文章

    3612

    瀏覽量

    43492
  • 漏洞
    +關(guān)注

    關(guān)注

    0

    文章

    205

    瀏覽量

    15630
  • 爬蟲
    +關(guān)注

    關(guān)注

    0

    文章

    83

    瀏覽量

    7379
  • photon
    +關(guān)注

    關(guān)注

    0

    文章

    33

    瀏覽量

    3755
收藏 0人收藏

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    識(shí)別網(wǎng)絡(luò)爬蟲的策略分析

    的網(wǎng)絡(luò)資源。由爬蟲產(chǎn)生的網(wǎng)絡(luò)流量占總流量的37.2%,其中由惡意爬蟲產(chǎn)生的流量約占65%[1]。如何在網(wǎng)絡(luò)流量中識(shí)別爬蟲,是判斷爬蟲行為意圖的前提,常見的使用
    的頭像 發(fā)表于 09-14 09:08 ?1751次閱讀
    識(shí)別網(wǎng)絡(luò)<b class='flag-5'>爬蟲</b>的策略分析

    項(xiàng)目管理部經(jīng)理/項(xiàng)目管理課課長(zhǎng)/項(xiàng)目管理師-上海

    性電子產(chǎn)品工作經(jīng)歷尤佳項(xiàng)目管理課課長(zhǎng)-上海工作職責(zé):1. 項(xiàng)目開發(fā)進(jìn)程內(nèi)部各單位之溝通協(xié)調(diào)2. 項(xiàng)目開發(fā)進(jìn)程外部單位及客戶之溝通協(xié)調(diào)3. 產(chǎn)業(yè)及客戶訊息情報(bào)搜集及分析4. 金屬產(chǎn)品制程及成本結(jié)構(gòu)掌握
    發(fā)表于 01-20 11:43

    Python爬蟲與Web開發(fā)庫(kù)盤點(diǎn)

    ,高層次的web抓取網(wǎng)頁(yè),并從web站點(diǎn)的頁(yè)面中提取結(jié)構(gòu)化的數(shù)據(jù)Scrapy用途廣泛,可以用于數(shù)據(jù)挖掘、監(jiān)測(cè)和自動(dòng)化測(cè)試。最爽的就是它是個(gè)框架,任何人都可以根據(jù)需求方便的修改,里面有很多類型爬蟲的基
    發(fā)表于 05-10 15:21

    物聯(lián)網(wǎng)網(wǎng)關(guān)系統(tǒng)設(shè)計(jì)是怎么樣的?

    、監(jiān)控和管理的種網(wǎng)絡(luò)。物聯(lián)網(wǎng)是具有全面感知、可靠傳輸、智能處理特征的連接物理世界的網(wǎng)絡(luò)。物聯(lián)網(wǎng)用途廣泛,遍及智能交通、環(huán)境保護(hù)、***工作、公共安全、平安家居、智能消防、工業(yè)監(jiān)測(cè)、老人護(hù)理、個(gè)人健康、*卉栽培、水系監(jiān)測(cè)、食品溯源、敵情偵查和
    發(fā)表于 08-08 07:50

    Python 個(gè)公共情報(bào)搜集爬蟲——Photon

    Photon個(gè)由s0md3v開源的情報(bào)搜集爬蟲,其主要功能有:1.爬取鏈接(內(nèi)鏈、外鏈)。2.爬取帶參數(shù)的鏈接,如(pythondict
    發(fā)表于 06-23 16:35

    基于SVM的主體爬蟲采集方法

    為了準(zhǔn)確高效采集航天領(lǐng)域內(nèi)的競(jìng)爭(zhēng)情報(bào),提出了基于SVM的主題爬蟲采集方法。設(shè)計(jì)了航天領(lǐng)域情報(bào)采集總體框架,采用支持向量機(jī)分類算法,利用適量已有航天情報(bào)信息,強(qiáng)化特定領(lǐng)域特征權(quán)重,訓(xùn)練航
    發(fā)表于 11-13 11:26 ?13次下載
    基于SVM的主體<b class='flag-5'>爬蟲</b>采集方法

    物聯(lián)網(wǎng)給人們帶來什么變化?

    物聯(lián)網(wǎng)用途廣泛遍及智能交通、環(huán)境保護(hù)、政府工作、公共安全、平安家居、智能消防、工業(yè)監(jiān)測(cè)、環(huán)境監(jiān)測(cè)、老人護(hù)理、個(gè)人健康、花卉栽培、水系監(jiān)測(cè)、食品溯源、敵情偵查和情報(bào)搜集等多個(gè)領(lǐng)域。
    的頭像 發(fā)表于 05-04 14:05 ?6344次閱讀

    Python爬蟲速成指南讓你快速的學(xué)會(huì)寫個(gè)最簡(jiǎn)單的爬蟲

    本文主要內(nèi)容:以最短的時(shí)間寫個(gè)最簡(jiǎn)單的爬蟲,可以抓取論壇的帖子標(biāo)題和帖子內(nèi)容。 本文受眾:沒寫過爬蟲的萌新。
    的頭像 發(fā)表于 06-10 09:57 ?7281次閱讀
    Python<b class='flag-5'>爬蟲</b>速成指南讓你快速的學(xué)會(huì)寫<b class='flag-5'>一</b><b class='flag-5'>個(gè)</b>最簡(jiǎn)單的<b class='flag-5'>爬蟲</b>

    物聯(lián)網(wǎng)的應(yīng)用在中國(guó)將聚焦五大領(lǐng)域

    物聯(lián)網(wǎng)有許多廣泛的用途,遍及智能交通、環(huán)境保護(hù)、政府工作、公共安全、平安家居、智能消防、工業(yè)監(jiān)測(cè)、老人護(hù)理、個(gè)人健康、花卉栽培、水系監(jiān)測(cè)、食品溯源、敵情偵查和情報(bào)搜集等多個(gè)領(lǐng)域。
    發(fā)表于 10-10 09:48 ?3157次閱讀

    爬蟲是如何實(shí)現(xiàn)數(shù)據(jù)的獲取爬蟲程序如何實(shí)現(xiàn)

    進(jìn)入大數(shù)據(jù)時(shí)代,爬蟲技術(shù)越來越重要,因?yàn)樗谦@取數(shù)據(jù)的個(gè)重要手段,是大數(shù)據(jù)和云計(jì)算的基礎(chǔ)。那么,爬蟲到底是如何實(shí)現(xiàn)數(shù)據(jù)的獲取的呢?今天和大家分享的就是
    發(fā)表于 01-02 16:30 ?10次下載
    <b class='flag-5'>爬蟲</b>是如何實(shí)現(xiàn)數(shù)據(jù)的獲取<b class='flag-5'>爬蟲</b>程序如何實(shí)現(xiàn)

    哪些物聯(lián)網(wǎng)應(yīng)用將會(huì)在中國(guó)爆發(fā)

    物聯(lián)網(wǎng)有許多廣泛的用途,遍及智能交通、環(huán)境保護(hù)、政府工作、公共安全、平安家居、智能消防、工業(yè)監(jiān)測(cè)、老人護(hù)理、個(gè)人健康、花卉栽培、水系監(jiān)測(cè)、食品溯源、敵情偵查和情報(bào)搜集等多個(gè)領(lǐng)域。
    發(fā)表于 03-25 09:15 ?538次閱讀

    cps物聯(lián)網(wǎng)技術(shù)的應(yīng)用案例

    物聯(lián)網(wǎng)用途廣泛,遍及智能交通、環(huán)境保護(hù)、政府工作、公共安全、平安家居、智能消防、工業(yè)監(jiān)測(cè)、環(huán)境監(jiān)測(cè)、路燈照明管控、景觀照明管控、樓宇照明管控、廣場(chǎng)照明管控、老人護(hù)理、個(gè)人健康、花卉栽培、水系監(jiān)測(cè)、食品溯源、敵情偵查和情報(bào)搜集等多個(gè)領(lǐng)域。
    的頭像 發(fā)表于 11-17 10:59 ?1.4w次閱讀

    Photon情報(bào)搜集爬蟲的主要功能與安裝使用說明

    你可以用它來干很多事,比如爬圖片、找漏洞、找子域名、爬數(shù)據(jù)等等。
    的頭像 發(fā)表于 06-23 16:35 ?1239次閱讀
    <b class='flag-5'>Photon</b><b class='flag-5'>情報(bào)搜集</b><b class='flag-5'>爬蟲</b>的主要功能與安裝使用說明

    基于Particle Photon的物聯(lián)網(wǎng)WiFi時(shí)鐘

    方案介紹 快速建立個(gè)wifi支持的時(shí)鐘,通過互聯(lián)網(wǎng)保持準(zhǔn)確的時(shí)間。 步驟 1. 焊接顯示器 對(duì)齊顯示器到PCB和焊接5引腳。 2. 面包板 把Particle
    發(fā)表于 12-06 11:59 ?0次下載

    Python 個(gè)公共情報(bào)搜集爬蟲

    Photon個(gè)由s0md3v開源的情報(bào)搜集爬蟲,其主要功能有: 1.爬取鏈接(內(nèi)鏈、外鏈)。 2.爬取帶參數(shù)的鏈接,如(pythondi
    的頭像 發(fā)表于 11-03 15:16 ?703次閱讀
    Python <b class='flag-5'>一</b><b class='flag-5'>個(gè)</b><b class='flag-5'>超</b><b class='flag-5'>快</b>的<b class='flag-5'>公共</b><b class='flag-5'>情報(bào)搜集</b><b class='flag-5'>爬蟲</b>

    電子發(fā)燒友

    中國(guó)電子工程師最喜歡的網(wǎng)站

    • 2931785位工程師會(huì)員交流學(xué)習(xí)
    • 獲取您個(gè)性化的科技前沿技術(shù)信息
    • 參加活動(dòng)獲取豐厚的禮品