0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

python語(yǔ)言之正則re使用方法

冬至配餃子 ? 來(lái)源:繆斯之子 ? 作者:肖新苗 ? 2022-08-23 10:35 ? 次閱讀

. \w \s \d a|b () [...] {} * +

1. 常用元字符

. 匹配除換行符以外的任意字符

\w 匹配字母或數(shù)字或下劃線

\s 匹配任意的空白符

\d 匹配數(shù)字

\n 匹配一個(gè)換行符

\t 匹配一個(gè)制表符

^ 匹配字符串的開(kāi)始

$ 匹配字符串的結(jié)尾

\W 匹配非字母或數(shù)字或下劃線

\D 匹配非數(shù)字

\S 匹配非空白符

a|b 匹配字符a或字符b

() 匹配括號(hào)內(nèi)的表達(dá)式,也表示一個(gè)組

[...] 匹配字符組中的字符

[^...] 匹配除了字符組中字符的所有字符


2. 量詞:控制前面的元字符出現(xiàn)的次數(shù)


* 重復(fù)零次或更多次

+ 重復(fù)一次或更多次

? 重復(fù)零次或一次

{n} 重復(fù)n次

{n,} 重復(fù)n次或更多次


3. 貪婪匹配和惰性匹配


.* 貪婪匹配

.*? 非貪婪匹配


'''

點(diǎn): 匹配所有不包括換行

+: 表示重復(fù)一次或者更多次,就是說(shuō)如果條件一直符合的話,就連續(xù)匹配

import re

def test_dot():
data1 = 'hello \n world'
pattern = re.compile(r'.+')
res_list = pattern.findall(data1)
assert ['hello ', ' world'] == res_list, 're dot error'

2.點(diǎn): 匹配所有包括換行

import re
def test_dot2():
# 有時(shí)候需要 . 能匹配所有字符,包括換行符, 就需要帶上參數(shù) re.S
data1 = ''

# (.+) 括號(hào)說(shuō)明: 正常會(huì)取整個(gè),加括號(hào)之后,就只取括號(hào)里面的了
ptn = re.compile(r'', re.S)
res_list = ptn.findall(data1)
assert ['hello \n world'] == res_list, 're dot 2 error'

3. \w: 匹配數(shù)字、字母 和 下劃線

import re
def test_w():
data1 = 'ab_@.121'
# + 表示重復(fù)一次或者更多次,就是說(shuō)如果條件一直符合的話,就連續(xù)輸出,比如:ab_
ptn = re.compile(r'\w+')
res_list = ptn.findall(data1)
assert ['ab_', '121'] == res_list, 're w error'

4.\s: 匹配任意的空白字符

import re
def test_s():
data1 = 'a b\tc\n d$#'
ptn = re.compile(r'\s+')
res_list = ptn.findall(data1)
assert [' ', '\t', '\n '] == res_list, 're s error'

5.\d: 匹配數(shù)字

import re
def test_d():
data1 = 'yidong 10086,liantong 10010'
ptn = re.compile(r'\d+')
res_list = ptn.findall(data1)
assert ['10086', '10010'] == res_list, 're d error'

6.^: 有兩個(gè)地方用到: 1.本例中的匹配字符串的開(kāi)始, 2. 在中括號(hào)中,取非

import re
def test_start():
data1 = 'ab1ab2'
ptn = re.compile(r'ab\d')
res_list = ptn.findall(data1)
assert ['ab1', 'ab2'] == res_list, 're ^ error'

# ^ 表示只匹配字符串的開(kāi)始
data1 = 'ab1ab2'
ptn = re.compile(r'^ab\d')
res_list = ptn.findall(data1)
assert ['ab1'] == res_list, 're ^ 2 error'

7.$: 匹配字符串的結(jié)束

import re
def test_end():
data1 = '1ab2ab'
ptn = re.compile(r'\dab$')
res_list = ptn.findall(data1)
assert ['2ab'] == res_list, 're $ error'

8. |: a|b 匹配字符串a(chǎn)或字符串b

import re
def test_and():
data1 = '12a_3$dc'
ptn = re.compile(r'\d+|a|d|c')
res_list = ptn.findall(data1)
assert ['12', 'a', '3', 'd', 'c'] == res_list, 're | error'

9. (): 表示一個(gè)組

import re
def test_bracket():
data1 = ''
ptn = re.compile(r'')
res_list = ptn.findall(data1)
assert ('1', 'xiaoxinmiao') == res_list[0], 're () error'

10. (): 可以通過(guò)?P定義組名

import re
def test_bracket2():
# 可以設(shè)置分組名
data1 = ''
ptn = re.compile(r'')
iter_obj = ptn.finditer(data1)
res_obj = iter_obj.__next__()
assert '1' == res_obj.group(
'id') and 'xiaoxinmiao' == res_obj.group('name'), 're () error'

11.(): 當(dāng)有多組時(shí)的例子, 當(dāng)然這種情況,直接用例子9更方便

import re
def test_bracket3():
# 可以設(shè)置分組名
data1 = ''
ptn = re.compile(
r'')
iter_obj = ptn.finditer(data1)
ids, names = [], []
for i in iter_obj:
ids.append(i.group('id'))
names.append(i.group('name'))
assert ['1', '2'] == ids and ['miao1', 'miao2'] == names, 're () error'

12.[]: 匹配字符串中的字符, 其中 - 表示區(qū)間,例如:1-9表示1,2,3,4,5,6,7,8,9

import re
def test_bracket_mid():
data1 = '12dss#$$fwe564_'
ptn = re.compile(r'[1-9a-z_$]+')
res_list = ptn.findall(data1)
assert ['12dss', '$$fwe564_'] == res_list, 're [] error'

13.[^]: 匹配除了字符串中的值

import re
def test_bracket_mid2():
data1 = '12dss#$$fwe564_'
# [^] 表示不匹配里面的任何數(shù)
ptn = re.compile(r'[^1-9a-z_$]+')
res_list = ptn.findall(data1)
assert ['#'] == res_list, 're [] error'

14. +, * , ? 的理解,但是并不常用, 最常用的還是這個(gè)組合 .*?


def test_liangci():
data1 = 'abccd'
# +: 前一個(gè)字符出現(xiàn)1次或者多次
re_list = re.findall(r'abc+', data1)
assert ['abcc'] == re_list, 're + error'

# *: 前一個(gè)字符出現(xiàn)0次或者多次
re_list = re.findall(r'abf*', data1)
assert ['ab'] == re_list, 're + error'

# ?: 前一個(gè)字符出現(xiàn)0次或者1次
re_list = re.findall(r'abc?', data1)
assert ['abc'] == re_list, 're + error'

16. .*?: 非貪婪模式, 直接看例子

import re
def test_star2():
# .* 貪婪
data1 = '我愛(ài)北京天安門(mén),天安門(mén)上太陽(yáng)升.'
res_list = re.findall(r'我愛(ài)(.*)天安門(mén)', data1)
assert ['北京天安門(mén),'] == res_list, 're .* error'
# .*? 非貪婪
res_list = re.findall(r'我愛(ài)(.*?)天安門(mén)', data1)
assert ['北京'] == res_list, 're .* error'

17. {}: {n}重復(fù)多次,{n,}重復(fù)多次或者更多次

import re
def test_bracket_big():
# 只有兩位數(shù)字才符合要求
data1 = 'a1b12c134d1234e'
res_list = re.findall(r'\d{2}', data1)
assert ['12', '13', '12', '34'] == res_list, r're {} error'
# 兩位,以及兩位以上的數(shù)字都符合要求
data1 = 'a1b12c134d1234e'
res_list = re.findall(r'\d{2,}', data1)
assert ['12', '134', '1234'] == res_list, r're {} error'

18. []: 實(shí)戰(zhàn),匹配中文

import re
def test_zh():
data1 ='我愛(ài)111北京%天安


審核編輯:劉清

聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 字符串
    +關(guān)注

    關(guān)注

    1

    文章

    585

    瀏覽量

    20573
  • python
    +關(guān)注

    關(guān)注

    56

    文章

    4806

    瀏覽量

    84934
  • ASSERT
    +關(guān)注

    關(guān)注

    0

    文章

    17

    瀏覽量

    7266
  • Split
    +關(guān)注

    關(guān)注

    0

    文章

    6

    瀏覽量

    5580
收藏 人收藏

    評(píng)論

    相關(guān)推薦

    AB伺服軟件使用方法

    AB伺服軟件使用方法
    發(fā)表于 12-24 14:45 ?0次下載

    對(duì)比Python與Java編程語(yǔ)言

    Python與Java都是目前非常流行的編程語(yǔ)言,它們各有其獨(dú)特的優(yōu)勢(shì)和適用場(chǎng)景。以下是對(duì)這兩種編程語(yǔ)言的對(duì)比: 一、語(yǔ)法和易用性 Python 語(yǔ)法簡(jiǎn)潔,代碼更易讀,非常適合初學(xué)者。
    的頭像 發(fā)表于 11-15 09:31 ?398次閱讀

    C語(yǔ)言關(guān)鍵字--typedef

    C語(yǔ)言關(guān)鍵字使用方法學(xué)習(xí)指南!
    的頭像 發(fā)表于 10-07 12:44 ?318次閱讀

    指定初始器的使用方法及優(yōu)點(diǎn)

    隨著C語(yǔ)言的發(fā)展,C99標(biāo)準(zhǔn)引入了一些新的特性,極大地方便了程序員的編碼工作。其中一個(gè)非常實(shí)用且強(qiáng)大的功能便是“指定初始器”(Designated Initializers)。在這篇文章中,我們將深入探討指定初始器的使用方法及其帶來(lái)的便利。
    的頭像 發(fā)表于 08-29 09:51 ?341次閱讀

    DC/DC模擬的基本使用方法和特性確認(rèn)方法

    本篇介紹了DC/DC模擬的基本使用方法及確認(rèn)基本特性的方法
    的頭像 發(fā)表于 08-20 17:08 ?770次閱讀
    DC/DC模擬的基本<b class='flag-5'>使用方法</b>和特性確認(rèn)<b class='flag-5'>方法</b>

    pytorch和python的關(guān)系是什么

    在當(dāng)今的人工智能領(lǐng)域,Python已經(jīng)成為了最受歡迎的編程語(yǔ)言之一。Python的易學(xué)易用、豐富的庫(kù)和框架以及強(qiáng)大的社區(qū)支持,使其成為了數(shù)據(jù)科學(xué)、機(jī)器學(xué)習(xí)和深度學(xué)習(xí)等領(lǐng)域的首選語(yǔ)言。而
    的頭像 發(fā)表于 08-01 15:27 ?2186次閱讀

    Python語(yǔ)言基礎(chǔ)2

    電子發(fā)燒友網(wǎng)站提供《Python語(yǔ)言基礎(chǔ)2.rar》資料免費(fèi)下載
    發(fā)表于 07-17 17:23 ?1次下載

    Python中的人工智能框架與實(shí)例

    在人工智能(AI)領(lǐng)域,Python因其簡(jiǎn)潔的語(yǔ)法、豐富的庫(kù)和強(qiáng)大的社區(qū)支持,成為了最受歡迎的編程語(yǔ)言之一。本文將詳細(xì)介紹Python中的人工智能框架,并通過(guò)具體實(shí)例展示如何使用這些框架來(lái)實(shí)現(xiàn)不同的人工智能應(yīng)用。
    的頭像 發(fā)表于 07-15 14:54 ?1793次閱讀

    使用Python進(jìn)行自然語(yǔ)言處理

    在探討使用Python進(jìn)行自然語(yǔ)言處理(NLP)的廣闊領(lǐng)域時(shí),我們首先需要理解NLP的基本概念、其重要性、Python在NLP中的優(yōu)勢(shì),以及如何通過(guò)Python實(shí)現(xiàn)一些基礎(chǔ)的NLP任務(wù)
    的頭像 發(fā)表于 07-04 14:40 ?481次閱讀

    淺談錫膏的儲(chǔ)存及使用方法

    錫膏(焊錫膏)是電子組裝過(guò)程中常用的材料,它的儲(chǔ)存和使用方法對(duì)保證焊接質(zhì)量和性能至關(guān)重要。以下是詳細(xì)的儲(chǔ)存及使用方法
    的頭像 發(fā)表于 06-27 10:02 ?1023次閱讀

    可編程電源使用方法

    可編程電源使用方法 可編程電源使用方法 摘要:本文詳細(xì)介紹了可編程電源的使用方法,包括其基本概念、主要功能、選擇原則、操作步驟、注意事項(xiàng)以及實(shí)際應(yīng)用案例,旨在幫助讀者全面了解可編程電源
    的頭像 發(fā)表于 06-10 15:29 ?1121次閱讀

    手柄控制代碼及使用方法

    手柄控制代碼及使用方法
    的頭像 發(fā)表于 05-15 10:19 ?2013次閱讀

    Raspberry Pi樹(shù)莓派使用Python實(shí)現(xiàn)MQTT通信設(shè)計(jì)

    這次的例子,主要講述如何基于PYTHON的 MQTT 客戶端的使用方法
    的頭像 發(fā)表于 03-14 11:45 ?897次閱讀
    Raspberry Pi樹(shù)莓派使用<b class='flag-5'>Python</b>實(shí)現(xiàn)MQTT通信設(shè)計(jì)

    四種編程語(yǔ)言之間的區(qū)別和聯(lián)系

    編程語(yǔ)言是一種人與計(jì)算機(jī)之間進(jìn)行交流的方式,不同的編程語(yǔ)言有著不同的特點(diǎn)和用途。本文將對(duì)四種常見(jiàn)的編程語(yǔ)言——Python、Java、C++和JavaScript進(jìn)行比較,分析它們的區(qū)
    的頭像 發(fā)表于 02-05 14:16 ?1674次閱讀

    c語(yǔ)言,c++,java,python區(qū)別

    C語(yǔ)言、C++、Java和Python是四種常見(jiàn)的編程語(yǔ)言,各有優(yōu)點(diǎn)和特點(diǎn)。 C語(yǔ)言: C語(yǔ)言是一種面向過(guò)程的編程
    的頭像 發(fā)表于 02-05 14:11 ?2542次閱讀