boxmoe_header_banner_img

Hello! 欢迎来到悠悠畅享网!

文章导读

Golang regexp正则表达式 编译与匹配模式


avatar
作者 2025年8月27日 10

go语言中regexp包用于正则匹配,需先编译:Compile返回错误,MustCompile直接panic;常用方法有MatchString、FindAllString、ReplaceAllString等,支持分组捕获与RE2语法,推荐使用反引号避免转义,在循环外编译以提升性能。

Golang regexp正则表达式 编译与匹配模式

go语言中,regexp 包提供了对正则表达式的支持,用于字符串的匹配、查找、替换等操作。使用前需要通过 regexp.Compileregexp.MustCompile 编译正则表达式,然后调用相应方法进行匹配。

正则表达式的编译

Go中的正则表达式必须先编译再使用,以提高重复使用时的性能。

两种编译方式:

  • regexp.Compile(pattern string) (*Regexp, Error):标准方式,返回编译后的正则对象或错误。适合运行时动态构建的正则。
  • regexp.MustCompile(pattern string) *Regexp:必须确保正则表达式正确,否则会 panic。适合常量正则,在初始化时使用。

示例:

立即学习go语言免费学习笔记(深入)”;

re, err := regexp.Compile(`d+`) if err != nil {     log.Fatal(err) }  // 或使用 MustCompile(推荐用于已知正确的表达式) re := regexp.MustCompile(`d+`) 

常用匹配方法

编译后的 *Regexp 提供多种方法进行匹配操作:

  • MatchString(s string) bool:判断字符串是否匹配。
  • FindString(s string) string:返回第一个匹配的字符串。
  • FindStringSubmatch(s string) []string:返回第一个匹配及其子组。
  • FindAllString(s string, n int) []string:返回最多 n 个匹配,n=-1 表示全部。
  • ReplaceAllString(s, repl string) string:替换所有匹配项。

示例:

立即学习go语言免费学习笔记(深入)”;

re := regexp.MustCompile(`bw+@w+.w+b`) text := "联系我 at john@example.com 或 admin@site.org"  // 判断是否匹配 if re.MatchString(text) {     fmt.Println("包含邮箱") }  // 提取所有邮箱 emails := re.FindAllString(text, -1) fmt.Println(emails) // [john@example.com admin@site.org]  // 替换 newText := re.ReplaceAllString(text, "[EMAIL]") fmt.Println(newText) // 联系我 at [EMAIL] 或 [EMAIL] 

子匹配与分组

使用括号 () 定义捕获组,通过 FindSubmatch 系列方法获取分组内容。

re := regexp.MustCompile(`(d{4})-(d{2})-(d{2})`) text := "日期:2023-12-25" parts := re.FindStringSubmatch(text)  if len(parts) > 0 {     fmt.Println("完整匹配:", parts[0]) // 2023-12-25     fmt.Println("年:", parts[1])       // 2023     fmt.Println("月:", parts[2])       // 12     fmt.Println("日:", parts[3])       // 25 } 

匹配模式与转义

Go的正则语法基于RE2引擎,不支持某些复杂的特性(如后向引用),但足够高效安全。

  • 特殊字符如 .+*?()[]{}|^$ 需要使用 转义。
  • 使用反引号 定义原始字符串,避免双重转义。
  • 支持常用字符类:d(数字)、s(空白)、w(单词字符)。

示例:匹配URL中的协议和域名

re := regexp.MustCompile(`^(https?)://([a-zA-Z0-9.-]+)`) url := "https://golang.org" match := re.FindStringSubmatch(url)  if len(match) >= 3 {     fmt.Println("协议:", match[1]) // https     fmt.Println("主机:", match[2]) // golang.org } 

基本上就这些。掌握编译方式和核心方法,就能高效处理大多数文本匹配需求。注意避免在循环内重复编译,应将正则变量定义在外部以提升性能。



评论(已关闭)

评论已关闭