go语言中regexp包支持正则表达式操作,需导入”regexp”包;使用regexp.Compile编译模式,或regexp.MustCompile用于固定模式;MatchString判断是否匹配,FindString返回首个匹配,FindAllString返回所有匹配;通过括号定义捕获组,FindStringSubmatch提取分组内容;ReplaceAllString支持替换并引用分组,如$1;建议预编译提升性能。
在go语言中,regexp包提供了对正则表达式的基本支持,包括模式匹配、查找、替换等常用操作。使用时需要导入 “regexp” 包。下面介绍常见的匹配与替换方法及其用法。
编译正则表达式
Go中的正则操作通常从编译开始。使用 regexp.Compile 可以解析一个字符串模式并返回 *regexp.Regexp 对象或错误。
示例:
r, err := regexp.Compile(`d+`) if err != nil { log.Fatal(err) }
也可以使用 regexp.MustCompile,它在编译失败时会直接 panic,适合用于已知正确的固定模式。
立即学习“go语言免费学习笔记(深入)”;
基本匹配操作
编译后的正则对象提供多种方法进行文本匹配。
- MatchString(s string):判断字符串是否匹配模式,返回 bool。
- FindString(s string):返回第一个匹配的子串。
- FindAllString(s string, n int):返回最多 n 个匹配结果,n=-1 表示全部。
示例:
r := regexp.MustCompile(`d+`) fmt.Println(r.MatchString("abc123")) // true fmt.Println(r.FindString("abc123def456")) // "123" fmt.Println(r.FindAllString("abc123def456", -1)) // ["123" "456"]
带分组的提取
使用括号 () 定义捕获组,通过 FindStringSubmatch 获取匹配及子组内容。
例如,提取日期中的年月日:
r := regexp.MustCompile(`(d{4})-(d{2})-(d{2})`) matches := r.FindStringSubmatch("今天是2024-04-05") if len(matches) > 0 { fmt.Println(matches[1]) // "2024" fmt.Println(matches[2]) // "04" fmt.Println(matches[3]) // "05" }
字符串替换
正则替换是常见需求,ReplaceAllString 方法可用于替换所有匹配项。
- ReplaceAllString(s, repl):将 s 中所有匹配部分替换为 repl。
- repl 可包含 $1、$2 等引用捕获组。
示例:将 yyYY-MM-DD 格式转为 DD/MM/YYYY
r := regexp.MustCompile(`(d{4})-(d{2})-(d{2})`) result := r.ReplaceAllString("日期:2024-04-05", "$3/$2/$1") fmt.Println(result) // "日期:05/04/2024"
如果需要更复杂的替换逻辑,可使用 ReplaceAllStringFunc,传入一个函数处理每个匹配项。
基本上就这些。掌握 Compile、Find、Match 和 Replace 这几类方法,就能应对大多数文本处理场景。注意预编译正则可提升性能,避免重复解析。不复杂但容易忽略的是转义和分组引用格式。
评论(已关闭)
评论已关闭