正则表达式是对字符串操作的一种逻辑公式,就是用事先定义好的一些特定字符、及这些特定字符的组合,组成一个“规则字符串”,这个“规则字符串”用来表达对字符串的一种过滤逻辑。
我们可以使用regexper图形工具理解表达式的含义。
元字符
元字符是正则表达式中有特殊含义的非字母字符,包括:.*+?^.\|(){}[]
修正符
模式修正符就是几个字母,我们在每个正则表达式中可以一次使用一个,也可以连续使用多个,每一个具一定的意义。
模式修正符是对整个正则表达式调优使用,也可以说是对正则表达式功能的扩展。
常用的模式修正符有i、g、m等。
字符 | 含义 | 默认值 |
---|---|---|
i | 忽略大小写 | false |
g | 全局匹配 | false |
m | 多行匹配 | false |
字符类
所谓类是指符合某些特性的对象,一个泛指,而不是特指某个字符。
我们可以使用元字符[]
来构建一个简单的类,如表达式[abc]。
使用元字符^
创建反向类/负向类
,意思是不属于某类的内容,如表达式[^abc]
表示不是字符a或b或c的内容
范围类
我们可以使用[a-z]
来连接两个字符,表示从a到z的任意字符。
预定义类
字符 | 等价类 | 含义 |
---|---|---|
. | [^\r\n] | 除回车符和换行符之外所有字符 |
\d | [0-9] | 数字字符 |
\D | [^0-9] | 非数字字符 |
\s | [\t\n\x0B\f\r] | 空白符 |
\S | [^\t\n\x0B\f\r] | 非空白符 |
\w | [a-zA-Z_0-9] | 单词字符(字符数字下划线) |
\W | [^a-zA-Z_0-9] | 非单词字符 |
边界
// JavaScript语法
'This is a dog'.replace(/\b\is\b/g, 'IS'); // 输出 This IS a dog
常用的边界匹配字符
字符 | 含义 |
---|---|
^ | 以xx开始 |
$ | 以xx结束 |
\b | 单词边界 |
\B | 非单词边界 |
量词
// \d{8}表示数字匹配8次
'123456789'.replace(/\d{8}/g, 'X'); // 输出X9
字符 | 含义 |
---|---|
? | 出现零次或一次(最多一次) |
+ | 出现一次或多次(至少一次) |
* | 出现零次或多次(任意次数) |
{n} | 出现n次 |
{n, m} | 出现n到m次 |
{n,} | 至少出现n次 |
贪婪模式
// 默认会尽可能多的满足匹配条件(贪婪模式)
'12345678'.replace(/\d{3,6}/g, 'X'); // 输出 X78
// 加?会尽可能少的满足匹配条件(非贪婪模式)
'12345678'.replace(/\d{3,6}?/g, 'X'); // 输出 XX78
分组
若想匹配一个字母加一个数字连续出现3次的情况
,使用[a-z]\d{3}
是不行的。
需要用()进行分组,用于如([a-z]\d){3}
表示a1b2c3这种情况。
或
或
表达式,符号是|
'ByronsperByrCasper'.replace(/Byr(on|Ca)sper/g, 'X'); // 输出 XX
反向引用
$需要配合分组()
使用
'2017-08-02'.replace(/(\d{4})-(\d{2})-(\d{2})/g, '$2/$3/$1'); // 输出 08/02/2017
不需要捕获的某些分组,只需要在分组内加上?:
即可。
前瞻
正则表达式从文本头部向尾部开始解析,文本尾部方向,称为'前'
前瞻:就是在正则表达式匹配到规则的时候,向前检查是否符合断言,后顾/后瞻方向相反。
符合和不符合特定断言称为正向匹配
和负向匹配
。
名称 | 正则 | 含义 |
---|---|---|
正向前瞻 | exp(?=assert) | 匹配后面满足表达式exp的位置 |
负向前瞻 | exp(?!assert) | 匹配后面不满足表达式exp的位置 |
正向后顾 | exp(?<=assert) | 匹配前面满足表达式exp的位置(JS不支持) |
负向后顾 | exp(?<!assert) | 匹配前面不满足表达式exp的位置(JS不支持) |
'a2*3'.replace(/\w(?=\d)/g, 'X'); // 输出 X2*3
对象属性
- global: 是否全文搜索,默认false
- ignoreCase : 大小写敏感,默认false
- multiline: 多行搜索,默认false
- lastIndex : 下一个匹配项的开始位置,开始为0
- source : 正则表达式的文本字符串
var reg = /\d{3,6}/g
console.log(reg.global) // 输出true