0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

教您快速學(xué)習(xí)python程序設(shè)計中正則表達式的運用

NJ90_gh_bee81f8 ? 來源:互聯(lián)網(wǎng) ? 作者:佚名 ? 2017-11-21 08:10 ? 次閱讀

(一)正則表達式:

通用的字符串表達框架;

簡潔表達一組字符串的表達式;

針對字符串表達“簡潔”和“特征”思想的工具;

判斷某字符串的特征歸屬;

正則表達式在文本中的常見作用:

  1. 表達文本類型的特征(病毒);

  2. 同時查找或替換一組字符串;

  3. 匹配字符串的全部或部分;

正則表達式的使用:

編譯:將符合正則表達式語法的字符串轉(zhuǎn)換成正則表達式特征。

(二)正則表達式的語法

(三)正則常用的操作符

(四)正則表達式實例

(五)re庫的主要功能函數(shù)

正則表達式的表示類型

(1)raw string類型(原生字符串類型)

re庫采用raw string類型表示正則表達式,表示為r’text’。

例如:大陸地區(qū)的郵政編碼: r’[1-9]\d{5}’

國內(nèi)的電話號碼:r’\d{3}-\d{8}|\d{4}-\d{7}’

原生字符串類型是不包含轉(zhuǎn)義符的字符串。

(2)string類型,更加繁瑣

例如’[1-9]\\d{5}’

’\\d{3}-\\d{8}|\\d{4}-\\d{7}’

所以當(dāng)正則表達式包含轉(zhuǎn)義字符時,使用raw string。

1、re.search(pattern,string,flags=0)

在一個字符串中搜索匹配正則表達式的第一個位置,返回match對象。

pattern:正則表達式的字符串或原生字符串的表示;

string:帶匹配字符串;

flags:正則表達式使用時的控制標(biāo)記;

代碼

2、re.match(pattern,string,flags=0)從一個字符串的開始位置起匹配正則表達式,返回match對象

3、re.findall(pattern,string,flags=0)

搜索字符串,以列表類型返回全部能匹配的子串。

4、re.split(pattern,string,maxsplit=0,flags=0)

將一個字符串按照正則表達式匹配結(jié)果進行分割,返回列表類型。

maxsplit:最大分割數(shù),剩余部分作為最后一個元素輸出。

5、re.finditer(pattern,string,flags=0)

搜索字符串,返回一個匹配結(jié)果的迭代類型,每個迭代元素是match對象。

6、re.sub(pattern,repl,string,count=0,flags=0)

在一個字符串中替換所有匹配正則表達式的子串,返回替換后的字符串。

Pattern:正則表達式的字符串或原生字符串表示;

Repl:替換匹配字符串的字符串;

String:待匹配的字符串;

Count:匹配的最大替換數(shù);

(六)re庫的另一種用法

(七)match對象

1、match對象的屬性

2、match對象的方法

(八)re庫的貪婪匹配和最小匹配

Re庫默認采用貪婪匹配,即輸出匹配最長的字符串。

1、最小匹配操作符

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 字符串
    +關(guān)注

    關(guān)注

    1

    文章

    579

    瀏覽量

    20518
  • python
    +關(guān)注

    關(guān)注

    56

    文章

    4797

    瀏覽量

    84690
  • 正則表達式
    +關(guān)注

    關(guān)注

    0

    文章

    27

    瀏覽量

    3496

原文標(biāo)題:Python爬蟲學(xué)習(xí)筆記——正則表達式

文章出處:【微信號:gh_bee81f890fc1,微信公眾號:面包板社區(qū)】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏

    評論

    相關(guān)推薦

    什么是正則表達式?正則表達式如何工作?哪些語法規(guī)則適用正則表達式

    正則表達式又稱規(guī)則表達式(Regular Expression,在代碼中常簡寫為 regex、regexp 或 RE),是一種用于匹配、查找、替換文本的強大工具。它能夠以特定的模式匹配字符串,從而
    的頭像 發(fā)表于 11-03 14:41 ?3656次閱讀
    什么是<b class='flag-5'>正則表達式</b>?<b class='flag-5'>正則表達式</b>如何工作?哪些語法規(guī)則適用<b class='flag-5'>正則表達式</b>?

    shell正則表達式學(xué)習(xí)

    程序設(shè)計語言都支持利用正則表達式進行字符串操作。例如,在Perl中就內(nèi)建了一個功能強大的正則表達式引擎。正則表達式在檢索或替換上遠比之前用到的通配符要強大的多,用在批處理上絕對好用,比
    發(fā)表于 07-25 17:18

    正則表達式運用解析

    正則表達式運用
    發(fā)表于 09-11 08:59

    初識 Python 正則表達式

    正則表達式是一個特殊的字符序列,用于判斷一個字符串是否與我們所設(shè)定的字符序列是否匹配,也就是說檢查一個字符串是否與某種模式匹配。Python 自 1.5 版本起增加了re 模塊,它提供 Perl
    發(fā)表于 03-17 16:44

    深入淺出boost正則表達式

    什么是正則表達式正則表達式是一種用來描述一定數(shù)量文本的模式。Regex代表Regular Express. 如果您不知道什么是正則表達式,請看這篇文章:深入淺出之正則表達式
    發(fā)表于 09-08 18:09 ?9次下載

    精通正則表達式

    詳細的快速正則表達式的查詢電子書,簡單而豐富
    發(fā)表于 05-16 18:04 ?5次下載

    正則表達式學(xué)習(xí)心得

    正則表達式學(xué)習(xí)心得
    發(fā)表于 10-30 08:41 ?8次下載
    <b class='flag-5'>正則表達式</b><b class='flag-5'>學(xué)習(xí)</b>心得

    快速入門IPv6和正則表達式

    對于日常開發(fā)中只接觸IPv4,并沒有深入研究過正則表達式的開發(fā)者,面對IPv6和正則表達式,容易產(chǎn)生畏懼心理,覺得是兩座難以翻越的大山。本文通過一些表格整理對IPv6的表示方法,以及正則表達式的特殊符號進行了分類和說明,帶領(lǐng)大家
    的頭像 發(fā)表于 03-30 09:31 ?9014次閱讀
    <b class='flag-5'>快速</b>入門IPv6和<b class='flag-5'>正則表達式</b>

    Python正則表達式教程之標(biāo)準(zhǔn)庫的完整介紹及使用示例說明

    本文介紹了Python對于正則表達式的支持,包括正則表達式基礎(chǔ)以及Python正則表達式標(biāo)準(zhǔn)庫的完整介紹及使用示例。本文的內(nèi)容不包括如何編寫
    發(fā)表于 01-23 16:00 ?3次下載
    <b class='flag-5'>Python</b><b class='flag-5'>正則表達式</b>教程之標(biāo)準(zhǔn)庫的完整介紹及使用示例說明

    Python正則表達式學(xué)習(xí)指南

    本文介紹了Python對于正則表達式的支持,包括正則表達式基礎(chǔ)以及Python正則表達式標(biāo)準(zhǔn)庫的完整介紹及使用示例。本文的內(nèi)容不包括如何編寫
    發(fā)表于 09-15 08:00 ?0次下載
    <b class='flag-5'>Python</b><b class='flag-5'>正則表達式</b>的<b class='flag-5'>學(xué)習(xí)</b>指南

    Python正則表達式指南

    本文介紹了Python對于正則表達式的支持,包括正則表達式基礎(chǔ)以及Python正則表達式標(biāo)準(zhǔn)庫的完整介紹及使用示例。本文的內(nèi)容不包括如何編寫
    發(fā)表于 03-26 09:13 ?10次下載
    <b class='flag-5'>Python</b><b class='flag-5'>正則表達式</b>指南

    初識 Python 正則表達式

    正則表達式是一個特殊的字符序列,用于判斷一個字符串是否與我們所設(shè)定的字符序列是否匹配,也就是說檢查一個字符串是否與某種模式匹配。 Python 自 1.5 版本起增加了re 模塊,它提供 Perl
    的頭像 發(fā)表于 03-17 16:44 ?1424次閱讀

    python正則表達式中的常用函數(shù)

    編譯正則表達式模式,返回一個正則對象的模式。(可以把那些常用的正則表達式編譯成正則表達式對象,這樣可以提高一點效率。)
    的頭像 發(fā)表于 03-18 16:12 ?1801次閱讀

    shell腳本基礎(chǔ):正則表達式grep

    在Linux上有許多命令可以使用正則表達式,其中最常見的是grep命令和sed命令。正則表達式有多種類型,每種類型中可以使用的元字符類型不同。最常見的是基本正則表達式和擴展正則表達式。
    的頭像 發(fā)表于 05-29 09:29 ?1256次閱讀
    shell腳本基礎(chǔ):<b class='flag-5'>正則表達式</b>grep

    Python中的正則表達式

    字符串的特征,這樣我們就可以快速、高效地處理大量的文本數(shù)據(jù)。 基礎(chǔ)語法 在Python中,使用re模塊來操作正則表達式。re模塊提供了很多函數(shù),用于對字符串進行正則匹配和替換。以下是一
    的頭像 發(fā)表于 06-21 16:52 ?991次閱讀