python 正则表达式-CFANZ编程社区

r'[\u4e00-\u9fa5]汉字

.匹配除换行符外的任意字符

\d匹配所有数字 ,与[0-9]相同[0123456789]

\D匹配非数字字符，[^0-9]

\w匹配数字，字母，下划线[0-9a-zA-Z_]

\W匹配非数字字线下划线[^0-9A-Za-z]

\s匹配任意空白符（空格换行换页符制表符回车,同[ \f\n\r\t]

\S匹配任意非空白符（空格换行换页符制表符回车,同[^ \f\n\r\t]

^行首匹配

$行尾匹配

\A 匹配字符串开始,只匹配整个字符串的开头.与^区别:即使与re.M配合也只能匹配当前行行首，不会匹配其他行的行首

\Z匹配字符串结束,只匹配整个字符串的结束.与$区别：即使与re.M配合也只能匹配当前行行尾，不会匹配其他行的行尾

>>> print(re.search(r"\AI","I'm a never"))

<re.Match object; span=(0, 1), match='I'>

>>> print(re.search(r"I\Z","I'm a never"))

None

>>> print(re.search(r"r\Z","I'm a never"))

<re.Match object; span=(10, 11), match='r'>

>>>

\b匹配一个单词的边界，就是单词和空格间的位置

\B匹配非单词的边界

>>> print(re.search(r'er\b',"never"))

<re.Match object; span=(3, 5), match='er'>

>>> print(re.search(r'er\B',"never"))

None

>>>

(abc)匹配abc这三个字符组合串

(abc)？匹配0个或1个abc

(abc)*匹配0个或任意多个abc

.*匹配0个或任意个字符（换行符除外）

（abc)+匹配至少一个abc

(abc){2,5}匹配2或3或4或5个abc

import re
aa="this di  df    er   dman man"
print(re.split(r" +",aa))上

上面的代码是用正则分割字符

结果：

===================== RESTART: D:/Python/Python37/re2.py =====================

['this', 'di', 'df', 'er', 'dman', 'man']

>>>

import re
aa=r'[0-9a-zA-Z_]'#匹配任意一个数字字母或下划线
print(re.search(aa,"dsfs345355"))
rr="i an dfef fgdei fdfeffd"
rra=re.finditer(r'fe',rr) #与findall类似，查找整个字符串，但不将结果一次性放到内存中，而返回一个迭代器
for i in rra:   #用循环返回结果
    print(i.group())
print(".........")
rra=re.finditer(r'df',rr)
while True:   #利用循环与next结合返回结果
    try:
        ia=next(rra)  #迭代器用next返回
        print(ia.group())
    except StopIteration as e:
        break上

上面的代码是finditer:查找到的每个结果，用其group()返回其具体结果值

findall 返回一个包含所有匹配到的字符的列表，列表类以元组的形式存在。

finditer 返回一个可迭代对象。
结果：

===================== RESTART: D:\Python\Python37\re1.py =====================

<re.Match object; span=(0, 1), match='d'>

.........

>>>

import re
aa=r'[0-9a-zA-Z_]'#匹配任意一个数字字母或下划线
print(re.search(aa,"dsfs345355"))
rr="i an dfef fgdei fdfeffd"
#sub subn:在目标字符串中以正则表达式的规则匹配字符串，再把其替换成指定的字符串，可以指定替换次数。如果不指定默认替换所有符合目标对象
#sub直接返回替换后的结果；subn：返回元组：替换后的结果，替换的次数
rrb=re.sub(r'df',"gg",rr)
rrbb=re.subn(r'df',"gg",rr)
print(rrb)
print(rrbb)
print("..............")
strb="sunck is a go0534-3456776od man!sunck is 020-45343422a nice man! sunk is good man 010-53247654"
stra="010-33434344"
m=re.match(r"(\d{3})-(\d{8})",stra)  #match从最左边匹配
print(m)
print(m.group(0))
print(m.group(1))
print(m.group(2))
print(">>>>>>>>>>>>")
ma=re.findall(r"(\d{3}-\d{8})",strb)
mab=re.findall(r"(\d{4}-\d{7})",strb)
maa=re.findall(r"((\d{3}-\d{8})|(\d{4}-\d{7}))",strb)
print(ma)
print(maa)
print(mab)

结果：

===================== RESTART: D:\Python\Python37\re1.py =====================

<re.Match object; span=(0, 1), match='d'>

i an ggef fgdei fggeffd

('i an ggef fgdei fggeffd', 2)

..............

<re.Match object; span=(0, 12), match='010-33434344'>

010-33434344

010

33434344

>>>>>>>>>>>>

['020-45343422', '010-53247654']

[('0534-3456776', '', '0534-3456776'), ('020-45343422', '020-45343422', ''), ('010-53247654', '010-53247654', '')]

['0534-3456776']

>>>

dd='''sdxxhello
xxfsdfxxworldxxasdf'''
d=re.findall('xx(.*?)xx',dd)
print(d)
d=re.findall('xx(.*?)xx',dd,re.S) #re.S表示跨行匹配，没有则不跨行
print(d)

结果：

['fsdf']

['hello\n', 'world']

>>>

re.match(r'.',"abvd") #匹配最左边开始的字符

re.search(r'.',"abdd") #匹配整个字符串中第一个符合条件的字符

re.findall(r'.',"abcd") #匹配整个字符串中所有符合条件的字符