赞
踩
通过go的regexp包来提取匹配的指定字符串:
注意:匹配的正则需要用括号分组,才能提取出来,如 (.*?)
其中 (.*?) 表示已知字符串前后内容,找中间匹配到的字符串。如:
“好喝的蜜桃乌龙茶,哈哈哈”,根据前半部分“好喝的”和后半部分“,哈哈哈”,提取出中间部分“蜜桃乌龙茶”特例:
如果想匹配英文括号时,需要特别处理,取消转义~如示例:findDestStr()若与正则表达式匹配的字符串不存在,FindStringSubmatch() 会返回空的 []string 数组
- package main
-
- import (
- "fmt"
- "regexp"
- )
-
- // 特例:找出中英文"()()"括号中间的字符,例如:华南地区(广州) -> 广州
- func findDestStr(src string) string {
- compileRegex := regexp.MustCompile("((.*?))") // 中文括号,例如:华南地区(广州) -> 广州
- matchArr := compileRegex.FindStringSubmatch(src)
-
- if len(matchArr) == 0 {
- compileRegex := regexp.MustCompile("\\((.*?)\\)") // 兼容英文括号并取消括号的转义,例如:华南地区 (广州) -> 广州。
- matchArr = compileRegex.FindStringSubmatch(src)
- }
- // fmt.Println("提取字符串内容:", matchArr[len(matchArr)-1])
-
- if len(matchArr) > 0 {
- return matchArr[len(matchArr)-1]
- }
- return ""
- }
-
- func main() {
- str := "好喝的蜜桃乌龙茶,哈哈哈"
- compileRegex := regexp.MustCompile("好喝的(.*?),哈哈哈") // 正则表达式的分组,以括号()表示,每一对括号就是我们匹配到的一个文本,可以把他们提取出来。
- matchArr := compileRegex.FindStringSubmatch(str) // FindStringSubmatch 方法是提取出匹配的字符串,然后通过[]string返回。我们可以看到,第1个匹配到的是这个字符串本身,从第2个开始,才是我们想要的字符串。
- if len(matchArr) > 0 {
- fmt.Println("提取字符串内容:", matchArr[len(matchArr)-1]) // 输出:蜜桃乌龙茶
- }
-
- return
- }

Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。