2018-07-26 【c#】正则表达式

例子记录

1.string[] dataArray = Regex.Split(lineContent.Trim(), "\\s+", RegexOptions.IgnoreCase);
去掉一行的首尾空格,按照中间1个或多个空格进行拆分,忽略大小写

对字符串操作的一种逻辑公式:匹配/过滤/替代 字符串
对字符串的控制非常简洁快速
感觉,很好用,处理字符串的时候 比如说字符串按照一定格式分割,拼接之类

目标:能够对照手册写出想要的正则表达式

1.基本语法
abc ccccd12 3.

直接匹配:ccc abc [ccc]cd12 3.

\d :单个数字 abc ccccd[1][2] [3].
\D :单个字符(包含特殊字符)[a][b][c][ ][c][c][c][c][d]12[ ][ ][ ][ ]3[.]
\w :单个字符(不包含特殊字符)[a][b][c][c][c][c][c][d]123[.]
\W:特殊字符 abc[ ]ccccd12[ ][ ][ ][ ]3[.]
. :任何字符 [a][b][c][ ][c][c][c][c][d][1][2][ ][ ][ ][ ][3][.]
. :那个. abcccccd123[.]
[a.ed]:字符集 [a]bccccc[d]123[.]


c{1,3}:一个到三个 ab[ccc][cc]d123.
c* :零个或多个 []a[]b[ccccc][]d[]1[]2[]3[].[]
c+:一个或多个 ab[ccccc]d123.
c?:零个或一个 []a[]b[c][c][c][c][c][]d[]1[]2[]3[].[]


\s :匹配空格 abc[ ]ccccd12[ ][ ][ ][ ]3.
\S :匹配非空格 [a][b][c] [c][c][c][c][d][1][2][3][.]
^ :从头开始
组合:^abc.3 从头开始,abc,然后.任何字符,零个或多个,以3结尾
[abc ccccd12 3].
(.) :[(<1>abc ccccd12 3. )][(<1>)]
.
:[abc ccccd12 3. ][]
ccd|cc :abc [cc][ccd]12 3.
(ccd|cc) :abc [(<1>cc)][(<1>ccd)]12 3.


This is wenxuejia testing testing testing!
\b :字符边界 \1 :匹配成功group中的第一个
组合:
\b(\w+)\W(\1)\W\W(\1)\b
This is wenxuejia [(<1>testing) (<2>testing) (<3>testing)]!


替换:
替换的内容永远都是原文本的内容,通过正则表达式匹配出来文本,来通过组名或者组号来进行对原文本的替换,替换的位置是用正则表达式匹配出来的内容。

LINK:https://www.cnblogs.com/dwlsxj/p/RegexReplace.html

image.png

2.Regex类使用
(该类下面有很多静态方法,可以缓存已有的正则表达式的运算,下次计算的时候速度快很多;(未进行验证))

2.1验证是否匹配

RegexIsMatch.png
    static void Main(string[] args)
    {
        //1.判断字符串是否符合匹配正则表达式
        string[] values = { "111-22-3333", "111-2-3333" };
        string pattern = @"^\d{3}-\d{2}-\d{4}$";   //@:不让它转义 

        foreach (var value in values)
        {
            if(Regex.IsMatch(value,pattern))
            {
                Console.WriteLine("{0} is valid", value);
            }
            else
            {
                Console.WriteLine("{0} is not valid", value);
            }
        }
        Console.ReadLine();
    }

2.2获得匹配结果


RegexMatch.png
    private static void RegexMatch()
    {
        var input = "This is wenxuejia testing testing  testing!";
        var pattern = @"\b(\w+)\W(\1)\W\W(\1)\b";
        Match match = Regex.Match(input, pattern);

        while(match.Success)
        {
            Console.WriteLine("Duplication {0} found",
                match.Groups[1].Value);

            Console.WriteLine("match.ToString: {0} ", match.ToString());
            match = match.NextMatch();
        }
    }

2.3替换


RegexReplace.png
    private static void RegexReplace()
    {
        string pattern = @"\b\d+\.\d{2}\b";

        //$$:包裹替换字符串的单个"$文本" 这不是一句人话,解释一下:$$显示出来就是$ 其他的,一个字符就是一个字符比如说@就是@,2就是2
        //$&:把后面的拼接起来

        string replacement = "¥$&";
        string input = "Total cost: 103.64";
        Console.WriteLine(Regex.Replace(input, pattern, replacement));

    }

2.4字符串分割

RegexSplit.png
    private static void RegexSplit()
    {
        string input = "1. Egg 2. Bread  3. Milk     4. Coffee";
        string pattern = @"\b\d{1,2}\.\s";
        foreach(string item in Regex.Split(input,pattern))
        {
            if(!String.IsNullOrEmpty(item))
            {
                Console.WriteLine(item);
            }
        }
    }

3.c#的Match类和Group类
Match用于找到 匹配字符串 在字符串中出现的位置

RegexMatch.png
    private static void Match()
    {
        MatchCollection matches;

        Regex r = new Regex("abc");
        matches = r.Matches("123abc4abcd");

        foreach(Match match in matches)
        {
            Console.WriteLine("{0} found at position {1}",
                match.Value, match.Index);

            Console.WriteLine("{0}", match.Result("------ $& ------"));
        }

    }

Group可以方便获取第几个括号中的字符串

RegexGroup.png
    private static void Groups()
    {
        string input = "Born: July 28, 1989";
        //每一个括号都代表一个组,完整的是group0,第一个括号是group1
        string pattern = @"\b(\w+)\s(\d{1,2}),\s(\d{4})\b"; 

        Match match = Regex.Match(input, pattern);
        if(match.Success)
        {
            for(int i = 0;i < match.Groups.Count;i ++)
            {
                Console.WriteLine("Group {0}: {1}",
                    i, match.Groups[i].Value);
            }
        }
    }
最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 211,743评论 6 492
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 90,296评论 3 385
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 157,285评论 0 348
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 56,485评论 1 283
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 65,581评论 6 386
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 49,821评论 1 290
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 38,960评论 3 408
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 37,719评论 0 266
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 44,186评论 1 303
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 36,516评论 2 327
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 38,650评论 1 340
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 34,329评论 4 330
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 39,936评论 3 313
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 30,757评论 0 21
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 31,991评论 1 266
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 46,370评论 2 360
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 43,527评论 2 349

推荐阅读更多精彩内容

  • 专业考题类型管理运行工作负责人一般作业考题内容选项A选项B选项C选项D选项E选项F正确答案 变电单选GYSZ本规程...
    小白兔去钓鱼阅读 8,981评论 0 13
  • 几个正则表达式编辑器 Debuggex :https://www.debuggex.com/ PyRegex:ht...
    没技术的BUG开发攻城狮阅读 4,585评论 0 23
  • 推荐几个正则表达式编辑器 Debuggex :https://www.debuggex.com/ PyRegex:...
    木易林1阅读 11,480评论 9 151
  • 在C语言中,五种基本数据类型存储空间长度的排列顺序是: A)char B)char=int<=float C)ch...
    夏天再来阅读 3,333评论 0 2
  • 正则表达式到底是什么东西?字符是计算机软件处理文字时最基本的单位,可能是字母,数字,标点符号,空格,换行符,汉字等...
    狮子挽歌阅读 2,141评论 0 9