这篇文章主要介绍了Python中re模块匹配方法怎么用的相关知识,内容详细易懂,操作简单快捷,具有一定借鉴价值,相信大家阅读完这篇Python中re模块匹配方法怎么用文章都会有所收获,下面我们一起来看看吧。
匹配开头结尾
| 字符 | 功能 | 
| ^ | 匹配字符串开头 | 
| $ | 匹配字符串结尾 | 
示例1:$
需求:匹配163.com的邮箱地址
email_list = [ " xiaoWang@163.com " , " xiaoWang@163.comh eihei" , ". com.xiaowang@qq.com " ]
for email in email_list:
    ret = re.match("[w]{4,20}@163.com$", email) .代表只是一个点 $代表以xxx结尾的字符串
    if ret:
        print("%s ---是符合规定的邮件地址” % email)
    else:
        print("%s ---不符合要求" % email)运行结果:
xiaoWang@163.com            # ---是符合规定的邮件地址
xiaoWang@163.comheihei      # ---不符合要求   # 如果没有$,这个字符串会匹配出来
.com.xiaowang@qq.com        # ---不符合要求
匹配分组
| 字符 | 功能 | 
| | | 匹配左右任意一个表达式 | 
| (ab) | 将括号中字符作为一个分组 | 
| um | 引用分组num匹配到的字符串 | 
| (?P<name>) | 分组起别名 | 
| (?P=name) | 引用别名为name分组匹配到的字符串 | 
示例1:|
需求:匹配出0-100之间的数字
#coding=utf-8
import re
 
ret = re.match("[1-9]?d","8”) # ?匹配前面的字符出现1次或者0次 类似78也可以匹配
print(ret.group())  
# 结果:8# 可能匹配不成功时?
 import re
 
ret = re.match("[1-9]?d$","08")
if ret:
    print(ret.group())
else:
    print("不在0-100之间”)           
# 结果:不在0-100之间# 添加|
import re
ret = re.match("[1-9]?d$|100","78")
print(ret.group())                           
# 结果: 78
 
ret = re.match("[1-9]?d$|100","100")
print(ret.group())                         
# 结果: 100示例2:( )
需求:匹配出163、126、qq邮箱
#coding=utf-8
import re
ret = re.match("w{4,20}@163.com", "test@163.com”)  
print(ret.group())                               
# 结果: test@163.com
ret = re.match("w{4,20}@(163|126|qq).com", "test@gmail.com")
if ret:
    print(ret.group())
else:
    print("不是163、126、qq邮箱")                  
# 结果: 不是163、126、qq邮箱需求:不是以4、7结尾的手机号码(11位)
import re
tels = ["13100001234", "18912344321", "10086", "18800007777"]
 
for tel in tels:
    ret = re.match("1d{9}[0-3,5-6,8-9]", tel)
    if ret:
        print(ret.group())
    else:
        print("%s 不是想要的手机号" % tel)结果如下:
13100001234 不是想要的手机号
18912344321
10086 不是想要的手机号
18800007777 不是想要的手机号
示例三:分组匹配
需求:提取区号和电话号码
import re
ret = re.match("([^-]*)-(d+)", "010-12345678") 
print(ret.group())
print(ret.group(1))
print(ret.group(2))结果如下:
010-12345678
010
12345678
^在[ ]里面代表非的含义:
例如:
- [^-]* *代表前所有字符0个或者多个,非-的字符串 
- [^abc] 代表非a、且非b 、且非c的字符