正则表达式字符匹配

我们应该知道,正则表达式是匹配模式,要么匹配字符,要么匹配位置。

一、两种模糊匹配

如果正则只有精确匹配是没多大意义的,比如/hello/,也只能匹配字符串中的"hello"这个子串。

1、横向模糊匹配

横向模糊指的是,一个正则可匹配的字符串的长度不是固定的,可以是多种情况的。
例如使用两次{m, n}, 最少匹配m次,最多匹配n次。

比如/ab{2,5}c/表示匹配这样一个字符串:第一个字符是“a”,接下来是2到5个字符“b”,最后是字符“c”。例子如下:

var reg = /ab{2,5}c/g;
var str = "abc abbc abbbc abbbbc abbbbbc abbbbbbc";
console.log(str.match(reg))
// => ["abbc", "abbbc", "abbbbc", "abbbbbc"]

注意:学过正则的朋友都知道正则表达式后面的g是全局匹配的标识符,就是找到字符串中所有符合正则表达式的匹配模式,g是单词global的首字母。

2、纵向模糊匹配

纵向模糊指的是,一个正则匹配的字符串,具体到某一位字符时,它可以不是某个确定的字符,可以有多种可能。

比如/a[123]b/可以匹配如下三种字符串:"a1b"、"a2b"、"a3b"。例子如下:

var reg = /a[123]c/g;
var str = "a0c a1c a2c a3c a4c";
console.log(str.match(reg))
// => ["a1c", "a2c", "a3c"]

二、字符组

虽然说是字符组,但是表示其中一个字符,例如[abc]表示”a“, ”b“, ”c“其中之一。

1、范围表示法

如果字符比较多的情况下就可以用范围表示法,例如要匹配a-z这26个英文字母其中任意字符,正则就可以用/[a-z]来表示。需要注意的是如果还要匹配 "-" 这个字符串,需要/[-a-z]/,例子如下:

var reg = /[a-z]/g;
var str = "avsf12-df";
console.log(str.match(reg))
// => ["a", "v", "s", "f", "d", "f"]

var reg = /[-a-z]/g;
var str = "avsf12-df";
console.log(str.match(reg))
// => ["a", "v", "s", "f", "-", "d", "f"]
2、排除字符组

纵向模糊匹配,还有一种情形就是,某位字符可以是任何东西,但不能是"a", "b", "c", "d"中的字符,这是用正则/[abcd]/表示,(脱字符),表示取反的意思。例子如下:

var reg = /[^abcd]/g;
var str = "safgecdb";
console.log(str.match(reg))
// => ["s", "f", "g", "e"]
3、常见的简写形式

\d 就是[0-9]。表示以为数字。
\D 就是[^0-9]。表示除数字外的任意字符。
\w 就是[0-9a-zA-Z_]。表示数字、大小写字母和下划线。
\W 是[^0-9a-zA-Z_]。非单词字符。
\s 是[ \t\v\n\r\f]。表示空白符,包括空格、水平制表符、垂直制表符、换行符、回车符、换页符。
\S 是[^ \t\v\n\r\f]。 非空白符。
. 就是[^\n\r\u2028\u2029]。通配符,表示几乎任意字符。换行符、回车符、行分隔符和段分隔符除外。

三、量词

1、简写形式

{m,} 至少出现m次。
{m} 等价于{m, m}, 出现m次。
? 等价于{0,1}, 出现或不出现。
+ 等价于{1,},表示出现至少一次。
* 等价于{0,},可以不出现,也可以出现很多次,任意次。

2、贪婪匹配和惰性匹配

例子如下:

var reg = /\d{2,5}/g;
var str = "123 1234 12345 123456";
console.log(str.match(reg))
// => ["123", "1234", "12345", "12345"]

上面例子表示匹配2到5个数字, 可以是2位,3位,4位,5位数字,只要在这个范围之内,尽可能多的匹配,但有的时候并不需要这种匹配方式,我们可以在量词后面加" ?"来解除这种模式。
例子如下:

var reg = /\d{2,5}?/g;
var str = "123 1234 12345 123456";
console.log(str.match(reg))
// => ["12", "12", "34", "12", "34", "12", "34", "56"]

四、多选分支

一个模式可以实现横向和纵向模糊匹配。而多选分支可以支持多个子模式任选其一。

例如(a | b | c)这种方式匹配的是"a" 或 "b" 或 "c"的其中一种子模式。| 是管道符的意思。
例子如下:

var reg = /good|nice/g;
var str = "good idea, nice try";
console.log(str.match(reg))
// => ["good", "nice"]

需要注意的是如果我们用正则/good|goodbye/去匹配"goodbye",结果如下:

var reg = /good|goodbye/g;
var str = "goodbye";
console.log(str.match(reg))
// =>  ["good"]

需要爆正则改成/goodbye|good/这种方式,如下:

var reg = /goodbye|good/g;
var str = "goodbye";
console.log(str.match(reg))
// =>  ["goodbye"]

可以看出管道符匹配这种模式也是惰性的,如果前面符合条件,就不再匹配后面的。

五、案例分析

1、匹配16进制颜色值

表示一个16进制字符,可以用字符组[0-9a-fA-F]。
其中字符可以出现3或6次,需要是用量词和分支结构。

例子如下:

var reg = /#([0-9a-fA-F]{6}|[0-9a-fA-F]{3})/g;
var str = "#ffbbad #Fc01DF #FFF #ffE";
console.log( str.match(reg) ); 
// => ["#ffbbad", "#Fc01DF", "#FFF", "#ffE"]
2、匹配id

要求从"<div id="container" class="main"></div>"取出"id="container"
开始我们可能想到

var reg = /id=".*"/
var str = '<div id="container" class="main"></div>';
console.log(str.match(reg)[0]); 
// => id="container" class="main"

上面的例子我们没有解除正则的贪婪模式,解除掉贪婪模式的正则如下:

var reg = /id=".*?"/
var str = '<div id="container" class="main"></div>';
console.log(str.match(reg)[0]);
// => id="container"

我们得到了我们想要的,不过效率比较低,正则中有“回溯”这个概念,利用它的原理我们可以优化上面的正则如下:

var reg = /id="[^"]*"/
var str = '<div id="container" class="main"></div>';
console.log(str.match(reg)[0]);
// => id="container"
最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 211,265评论 6 490
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 90,078评论 2 385
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 156,852评论 0 347
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 56,408评论 1 283
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 65,445评论 5 384
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 49,772评论 1 290
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 38,921评论 3 406
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 37,688评论 0 266
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 44,130评论 1 303
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 36,467评论 2 325
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 38,617评论 1 340
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 34,276评论 4 329
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 39,882评论 3 312
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 30,740评论 0 21
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 31,967评论 1 265
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 46,315评论 2 360
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 43,486评论 2 348

推荐阅读更多精彩内容