需求
在项目中遇到需要动态修改一组字符。
源字符:[AA1]+[B1]+[A330]+[BZ1]
期望结果:[AA1]+[B2]+[A3]+[BZ4]
说明:AA是任意大些字母(A-Z)组合且多个,1为任意数字(0-9)组合且多个。
正则表达式语法参考地址:菜鸟教程
正则表达式
\[[A-Z]+\d+\].?
正则表达式说明:
- "\[":匹配[,"\"为转义字符
- "[A-Z]":匹配大写字符A-Z
- "+":匹配前面的子表达式一次或多次。要匹配 + 字符,请使用 +。
- "\d":匹配一个数字字符。等价于 [0-9]。
- ".":匹配除换行符 \n 之外的任何单字符。要匹配 . ,请使用 .。
- "?":匹配前面的子表达式零次或一次,或指明一个非贪婪限定符。要匹配 ? 字符,请使用 ?。
通过正则表达式测试工具,测试证明这个正则表达式是正确无误的。接下来就开始在项目中应用。
const string strSource = @"[AA1]+[B1]+[A330]+[BZ1]";
var regex = new System.Text.RegularExpressions.Regex(@"\[[A-Z]+\d+\].?");
var matchs = regex.Matches(strSource);
foreach (Match match in matchs)
{
Console.WriteLine(match.Value);
}
Console.ReadKey();
我们要得结果是匹配出来了,但是我们如何修改字母后面的数字呢?值的深思。
故事回顾
其实前面的正则表达式也是问过了的好哥们小C才等到的结果,因为之前一直觉得正则表达式比较难以理解,这次也一定要搞明白。在询问小C之前我自己尝试过自己写正则表达式,来看看我开始写的正则表达式
上面的结果很显然不是我想要得结果,只匹配到一处。说说我开始的思路,我开始想的是通过开始(^)和结束(
\[[A-Z]+(\d+)\].?
看了之后发现不明白"()"是什么意思,首先还是看了正则表达是的语法。
然而并不能理解其意思,接着就继续问小C,从他那儿得知"()"是把数据输出到组内,一个括号代表一组。似乎明白了,于是我就将原来的正则表达式修改成了
(\[)([A-Z]+)(\d+)(\])(.?)
这样讲结果分成了5组,这样处理数据就很简单了,只需要将每组字符连接起来就是想要的结果。下面就直接看结果吧。
const string strSource = @"[AA1]+[B1]+[A330]+[BZ1]";
var regex = new System.Text.RegularExpressions.Regex(@"(\[)([A-Z]+)(\d+)(\])(.?)");
var matchs = regex.Matches(strSource);
var i = 0;
var result = string.Empty;
foreach (Match match in matchs)
{
i++;
var s0 = match.Groups[0].Value;
var s1 = match.Groups[1].Value;
var s2 = match.Groups[2].Value;
var s3 = match.Groups[4].Value;
var s4 = match.Groups[5].Value;
result += $"{s1}{s2}{i}{s3}{s4}";
}
Console.WriteLine(result);
Console.ReadKey();