boxmoe_header_banner_img

Hello! 欢迎来到悠悠畅享网!

文章导读

Python中re模块功能解析 正则表达式re模块在Python中的常用方法


avatar
悠悠站长 2025年6月11日 4

python 中的 re 模块提供核心正则表达式处理功能,常用方法包括:1. re.match() 从字符串开头匹配;2. re.search() 扫描整个字符串找到第一个匹配;3. re.findall() 返回所有匹配结果组成的列表;4. re.sub() 替换匹配内容并支持分组引用;5. re.split() 根据匹配分割字符串。其中 match 只在开头匹配失败则返回 none,search 则在整个字符串查找首个匹配,findall 能提取多个匹配项,sub 支持高级替换技巧如日期格式转换,这些函数结合正则语法能高效解决字符串处理问题。

Python 中的 re 模块是处理正则表达式的核心工具,能帮我们高效地匹配、查找和替换文本内容。如果你经常需要处理字符串数据,掌握 re 模块的基本用法非常有必要。


一、常用方法有哪些?几个核心函数要记住

re 模块提供了多个处理正则表达式的函数,最常用的有以下几个:

  • re.match():从字符串起始位置开始匹配,不匹配就返回 None。
  • re.search():扫描整个字符串,找到第一个匹配的位置。
  • re.findall():返回所有匹配结果,组成一个列表。
  • re.sub():用于替换匹配到的字符串。
  • re.split():根据匹配内容分割字符串。

这些函数基本能满足日常文本处理的需求。比如你想要提取一段日志中的 IP 地址,或者验证用户输入是否符合邮箱格式,都可以用这些方法来完成。


二、match 和 search 的区别,别搞混了

这两个方法容易混淆,但它们的行为差别挺大的:

立即学习Python免费学习笔记(深入)”;

  • re.match(r’pattern’, string) 只会在字符串开头尝试匹配,一旦开头不符合,就直接失败。
  • re.search(r’pattern’, string) 会遍历整个字符串,只要中间有一处匹配就成功。

举个例子:

import re  text = "abc123xyz"  print(re.match(r'd+', text))   # 返回 None,因为开头不是数字 print(re.search(r'd+', text))  # 匹配到 '123'

所以当你不确定目标字符串的位置时,建议优先使用 search()。


三、findall 能快速提取多个匹配项

如果你需要一次性提取所有符合条件的内容,findall 是个好选择。它返回的是一个列表,没有匹配就返回空列表。

例如,想从一段文本中提取所有的邮箱地址:

text = "联系我: user1@example.com, admin@site.org 或 support@test.co" emails = re.findall(r'[a-zA-Z0-9._%+-]+@[a-zA-Z0-9.-]+.[a-zA-Z]{2,}', text) print(emails)  # 输出 ['user1@example.com', 'admin@site.org', 'support@test.co']

这个正则表达式虽然看起来有点复杂,但结构清晰,适用于大多数邮箱格式匹配。


四、sub 替换文本很方便,注意分组引用技巧

re.sub() 不仅可以做简单的替换,还能结合分组进行高级操作。比如你想把日期格式从 YYYY-MM-DD 改成 DD/MM/YYYY:

text = "今天的日期是 2025-04-05" new_text = re.sub(r'(d{4})-(d{2})-(d{2})', r'3/2/1', text) print(new_text)  # 输出 "今天的日期是 05/04/2025"

这里用到了分组(括号)和反向引用 1, 2, 3,这种技巧在处理结构化文本时特别有用。


基本上就这些。掌握了这几个常用函数,再配合正则表达式的语法,就能解决大部分字符串处理问题了。用得多了你会发现,看似复杂的逻辑其实也就那几个套路。



评论(已关闭)

评论已关闭