前言
js匹配是js中比较重要的一个概念,我们在工作中经常用到,但是往往都是记得不是很清楚,或者有些遗忘,这次记录总结一下,让自己加深一下印象,同时也会小伙伴们提供查阅资料的地方
正则表达式语法
1:字面量形式
let reg = /\bis\b/;
let string = 'it is a cat';
console.log(string.replace(reg, 'vvv'));
2:构造函数实例化
let reg = new RegExp('\\bis\\b', 'g'); // 反斜线需要转义,所以是两个\\ (转义问题在研究)
let string = 'it is a cat';
console.log(string.replace(reg, 'vvv'));
正则表达式常见语法
1:修饰符
// 全局搜索
let reg = /\bis\b/g;
let string = 'it is a cat, he is a boy';
console.log(string.replace(reg, 'vvv'));
// 忽略大小写
let reg = /\bis\b/gi;
let string = 'it is a cat, he IS a boy';
console.log(string.replace(reg, 'vvv'));
// 换行匹配
// 换行匹配意思就是让每一行做为开头或者结尾来匹配,所以必须要用^,$来一起用
let string = `aaan
tttt`;
let reg = /an/;
string .match(reg);
2:元字符
2.1:表示非打印字符
正则 | 描述 |
---|---|
\n | 匹配一个换行符 |
\r | 匹配一个回车符 |
\t | 匹配一个制表符 |
\v | 匹配一个垂直制表符 |
\f | 匹配一个换页符 |
\b | 匹配一个单词边界 |
\B | 匹配一个非单词边界 |
2.2:表示集合和范围
正则 | 描述 |
---|---|
. | 匹配任意一个非换行符 |
| | 表示或者的意思 |
[] | 同样表示或者的意思[abc],匹配a, b ,c中任意一个 |
\d | 匹配任意一个数字即[0-9] |
\D | 匹配任意一个非数字字符即[^0-9] |
\s | 匹配任意一个空白字符即[\f\t\r\v\n] |
\S | 匹配任意一个非空白字符即[^\f\t\r\n\v] |
\w | 匹配任意一个数字,字母,下划线即[0-9a-zA-Z_] |
\W | 匹配任意一个非数字,字母,下划线即[^0-9a-zA-Z_] |
2.3:表示量词
正则 | 描述 |
---|---|
* | 表示匹配0次,1次,或者多次 |
+ | 表示匹配一次或者多次 |
? | 表示匹配0次或者1次 |
{n} | 表示匹配n次 |
{n,} | 表示匹配n次,或者n次以上 |
{n, m} | 表示匹配最少n次最多m次 |
2.4:表示边界控制和模式单元
正则 | 描述 |
---|---|
^ | 表示以什么什么开头 |
$ | 表示以什么什么结尾 |
[^] | 括号里面^表示非,[^0-9]表示匹配不是0-9的字符 |
() | 模式匹配单元,把()内的整体当作一个字符 |
正则匹配模式
正则匹配模式分为两种,一种是贪婪模式,另一种是非贪婪模式
贪婪模式:在遇到歧义时候尽可能的多的匹配符合的结果
非贪婪匹配:在遇到歧义时候匹配到一次符合的结果就不匹配了
js默认是贪婪匹配模式,贪婪模式变成非贪婪模式只需要在贪婪量词({n, }, {n, m}, + , ?, *)后面加一个?就行了
附加:正则匹配中?的几种用法
let reg = /\d??/;
let string = '123456';
console.log(string.replace(reg, 'haha'));
正则匹配前瞻后顾的概念
正则匹配的前瞻就是给正则匹配的选项定义一个断言,或者说是一个条件比如:我要匹配一个字母,但是我的需求是字母后面必须是跟着一个数字的情况,那么这种场景是怎么实现了,就是用到前瞻的概念,那么我想要他的前面也要是一个数字怎么办了,这就是后顾。
前瞻后顾的描述
正则 | 描述 |
---|---|
(?=pattern) | 正向肯定查找(前瞻),后面必须跟着什么 |
(?!pattern) | 正向否定查找(前瞻),后面不能跟着什么 |
(?:pattern) | 非捕获分组,即该分组不写入$1,$2,....中 |
(?<=pattern) | 反向肯定条件查找(后顾),不捕获 |
(?<!pattern) | 反向否定条件查找(后顾) |
(?<name>) | 给分组起一个名字 |
let string = 'a1dvb';
let reg = /\w(?=\d)/;
console.log(string.replace(reg, '---'));
特点
以上的三个匹配形式都是不被捕获的,其中前两个是不匹配的,他只是用来当作条件来用,第三个是要被匹配的
// 分组被匹配并且捕获
let string = 'a1b3c4';
let reg = /(\w)(\d).+/; //去掉加号就不同
string = string.replace(reg, '$1$2');
console.log(string); //a1
// 分组被匹配但是不被捕获
let string = 'a1b3c4';
let reg = /(?:\w)(\d).+/; // 去掉加号就不同
string = string.replace(reg, '$1$2');
console.log(string); // 1$2
// 分组不被匹配也不被捕获,仅作为条件
let string = 'a1b3c49tt';
let reg = /(\d)(?=\d).+/; // 去掉加号就不同
string = string.replace(reg, '$1$2');
console.log(string); // 4$2
匹配原则----个人总结
1:任何元字符在没有写量词的情况下,只匹配一次
2:写了量词,默认是贪婪匹配
3:正则匹配一旦全部找到就不会在继续去匹配,除非你设置了全局g
4:正则匹配按照匹配规如果中间中断没有匹配到,并且字符串没有匹配完,会继续按照匹配规则重新匹配
5:(pattern)如果匹配到了很多结果,只捕获最后一次匹配到的结果
6:任何量词都只作用于前面的元字符
正则匹配相关的四个函数
正则对象的五个属性
1:source 2:global 3:ingoreCase 4:multiline 5:lastIndex
属性 | 描述 |
---|---|
global | 是一个只读一个布尔值,用来描述是否带有全局的修饰符 |
ingoreCase | 是一个只读一个布尔值,用来描述是否带有忽略大小写的修饰符 |
multiline | 是一个只读一个布尔值,用来描述是否带有换行的修饰符 |
source | 就是匹配规则的文本本身 |
lastIndex | 是一个可以读写的整数,如果是全局搜索,这个属性的值是匹配到的字符的下一个字符的索引所对应的值, 直到没有匹配为止,才会变成0,如果不是全局始终为0 |
let reg = /\d/gmi;
console.log(reg.source); // \d
console.log(reg.global); // true
console.log(reg.ignoreCase); // true
console.log(reg.multiline); // true
console.log(reg.lastIndex); 0
函数1:test
字符串满足正则匹配规则就会返回true,但是如果正则匹配里面含有全局的话,那么多运行几遍会报错,因为正则每次匹配开始都是看lastIndex的,全局情况下lastIndex每次执行都会被改变
let reg = /\d/g;
let string = '1234';
console.log(reg.test(string));
// 全局情况
et reg = /\d/g;
let string = '12';
console.log(reg.test(string)); // true
console.log(reg.test(string)); // true
console.log(reg.test(string)); // false
函数2:exec
如果没有找到任何匹配就返回null,如果找到了则返回一个数组,exec方法返回的数组的第 0 个元素是与正则表达式相匹配的文本
第 1 个元素是 正则匹配到 的第 1 个子表达式相匹配的文本(如果有的话)
第 2 个元素是正则匹配到 的第 2 个子表达式相匹配的文本(如果有的话)
...
以此类推。
其中还有三个参数
index:表示匹配到的文本的第一个字符所在的索引位置
input: 表示被匹配的文本
groups:表示有名的分组
在全局下也是一样因为exec永远只返回第一个匹配。
let reg = /(\w)(\d)(\d)/;
let string = 'a11a233';
reg.exec(string); // ["a11", "a", "1", "1", index: 0, input: "a11a233", groups: undefined]
let reg = /(?<json>\w)(?<tiantian>\d)(?<jianwu>\d)/;
let string = 'a11a233';
reg.exec(string);
函数3:match
如果没有找到任何匹配就返回null,如果找到了则返回一个数组,match方法返回的数组的第 0 个元素是与正则表达式相匹配的文本
第 1 个元素是 正则匹配到 的第 1 个子表达式相匹配的文本(如果有的话)
第 2 个元素是正则匹配到 的第 2 个子表达式相匹配的文本(如果有的话)
...
以此类推。
其中还有三个参数
index:表示匹配到的文本的第一个字符所在的索引位置
input: 表示被匹配的文本
groups:表示有名的分组
在非全局的情况下,这个方法和exec一模一样,但是在全局的情况下,差别很大,在全局的情况下,只会返回匹配到的结果,并且lastIndex始终为0, 如果没匹配到就返回null
let reg = /(\w)(\d)(\d)/g;
let string = 'a11a233';
string.match(reg); // ["a11", "a23"]
函数4:replace
该方法用来替换字符串,第一个参数是正则表达式,第二个参数可以是字符串也可以是函数
let string = '1a2a';
let reg = /\d+/;
string.replace(reg, '--'); // "--a2a"
// 捕获分组形式
let string = '1a2a';
let reg = /(\d).+/;
string.replace(reg, '$1'); // 1
// 函数形式
let string = 'a11ab22b';
let reg = /(\w)(\d)(\d)/;
string.replace(reg, (match, firstP, secondP, thirdP, index, string) => {
console.log(match);
console.log(firstP);
console.log(secondP);
console.log(thirdP);
console.log(index);
console.log(string);
return 22
})
// a11 a 1 2 0 a11ab22b
其中对函数来说的话,第一个是匹配到的文本
后面几个参数是对应分组的匹配文本(如果有的话)
倒数第二个是,匹配到的文本的第一个字符的索引
倒数第一个是,被匹配的文本