go语言中regexp包用于正则匹配,需先编译:Compile返回错误,MustCompile直接panic;常用方法有MatchString、FindAllString、ReplaceAllString等,支持分组捕获与RE2语法,推荐使用反引号避免转义,在循环外编译以提升性能。
在go语言中,regexp 包提供了对正则表达式的支持,用于字符串的匹配、查找、替换等操作。使用前需要通过 regexp.Compile 或 regexp.MustCompile 编译正则表达式,然后调用相应方法进行匹配。
正则表达式的编译
Go中的正则表达式必须先编译再使用,以提高重复使用时的性能。
两种编译方式:
- regexp.Compile(pattern string) (*Regexp, Error):标准方式,返回编译后的正则对象或错误。适合运行时动态构建的正则。
- regexp.MustCompile(pattern string) *Regexp:必须确保正则表达式正确,否则会 panic。适合常量正则,在初始化时使用。
示例:
立即学习“go语言免费学习笔记(深入)”;
re, err := regexp.Compile(`d+`) if err != nil { log.Fatal(err) } // 或使用 MustCompile(推荐用于已知正确的表达式) re := regexp.MustCompile(`d+`)
常用匹配方法
编译后的 *Regexp 提供多种方法进行匹配操作:
- MatchString(s string) bool:判断字符串是否匹配。
- FindString(s string) string:返回第一个匹配的字符串。
- FindStringSubmatch(s string) []string:返回第一个匹配及其子组。
- FindAllString(s string, n int) []string:返回最多 n 个匹配,n=-1 表示全部。
- ReplaceAllString(s, repl string) string:替换所有匹配项。
示例:
立即学习“go语言免费学习笔记(深入)”;
re := regexp.MustCompile(`bw+@w+.w+b`) text := "联系我 at john@example.com 或 admin@site.org" // 判断是否匹配 if re.MatchString(text) { fmt.Println("包含邮箱") } // 提取所有邮箱 emails := re.FindAllString(text, -1) fmt.Println(emails) // [john@example.com admin@site.org] // 替换 newText := re.ReplaceAllString(text, "[EMAIL]") fmt.Println(newText) // 联系我 at [EMAIL] 或 [EMAIL]
子匹配与分组
使用括号 () 定义捕获组,通过 FindSubmatch 系列方法获取分组内容。
re := regexp.MustCompile(`(d{4})-(d{2})-(d{2})`) text := "日期:2023-12-25" parts := re.FindStringSubmatch(text) if len(parts) > 0 { fmt.Println("完整匹配:", parts[0]) // 2023-12-25 fmt.Println("年:", parts[1]) // 2023 fmt.Println("月:", parts[2]) // 12 fmt.Println("日:", parts[3]) // 25 }
匹配模式与转义
Go的正则语法基于RE2引擎,不支持某些复杂的特性(如后向引用),但足够高效安全。
- 特殊字符如 .+*?()[]{}|^$ 需要使用 转义。
- 使用反引号 “ 定义原始字符串,避免双重转义。
- 支持常用字符类:d(数字)、s(空白)、w(单词字符)。
示例:匹配URL中的协议和域名
re := regexp.MustCompile(`^(https?)://([a-zA-Z0-9.-]+)`) url := "https://golang.org" match := re.FindStringSubmatch(url) if len(match) >= 3 { fmt.Println("协议:", match[1]) // https fmt.Println("主机:", match[2]) // golang.org }
基本上就这些。掌握编译方式和核心方法,就能高效处理大多数文本匹配需求。注意避免在循环内重复编译,应将正则变量定义在外部以提升性能。
评论(已关闭)
评论已关闭