js正则匹配总结

前言

js匹配是js中比较重要的一个概念，我们在工作中经常用到，但是往往都是记得不是很清楚，或者有些遗忘，这次记录总结一下，让自己加深一下印象，同时也会小伙伴们提供查阅资料的地方

正则表达式语法

1：字面量形式

let reg = /\bis\b/; 
let string = 'it is a cat';
console.log(string.replace(reg, 'vvv'));

2:构造函数实例化

let reg = new RegExp('\\bis\\b', 'g'); // 反斜线需要转义，所以是两个\\ （转义问题在研究）
let string = 'it is a cat';
console.log(string.replace(reg, 'vvv'));

正则表达式常见语法

1：修饰符

// 全局搜索
let reg = /\bis\b/g; 
let string = 'it is a cat, he is a boy';
console.log(string.replace(reg, 'vvv'));

// 忽略大小写
let reg = /\bis\b/gi; 
let string = 'it is a cat, he IS a boy';
console.log(string.replace(reg, 'vvv'));

// 换行匹配
// 换行匹配意思就是让每一行做为开头或者结尾来匹配，所以必须要用^,$来一起用
let string = `aaan
tttt`;
let reg = /an/;
string .match(reg);

2：元字符

2.1：表示非打印字符

正则	描述
\n	匹配一个换行符
\r	匹配一个回车符
\t	匹配一个制表符
\v	匹配一个垂直制表符
\f	匹配一个换页符
\b	匹配一个单词边界
\B	匹配一个非单词边界

2.2：表示集合和范围

正则	描述
.	匹配任意一个非换行符
｜	表示或者的意思
[]	同样表示或者的意思[abc],匹配a, b ,c中任意一个
\d	匹配任意一个数字即[0-9]
\D	匹配任意一个非数字字符即[^0-9]
\s	匹配任意一个空白字符即[\f\t\r\v\n]
\S	匹配任意一个非空白字符即[^\f\t\r\n\v]
\w	匹配任意一个数字，字母，下划线即[0-9a-zA-Z_]
\W	匹配任意一个非数字，字母，下划线即[^0-9a-zA-Z_]

2.3：表示量词

正则	描述
*	表示匹配0次，1次，或者多次
+	表示匹配一次或者多次
?	表示匹配0次或者1次
{n}	表示匹配n次
{n,}	表示匹配n次，或者n次以上
{n, m}	表示匹配最少n次最多m次

2.4：表示边界控制和模式单元

正则	描述
^	表示以什么什么开头
$	表示以什么什么结尾
[^]	括号里面^表示非，[^0-9]表示匹配不是0-9的字符
()	模式匹配单元，把()内的整体当作一个字符

正则匹配模式

正则匹配模式分为两种，一种是贪婪模式，另一种是非贪婪模式
贪婪模式：在遇到歧义时候尽可能的多的匹配符合的结果
非贪婪匹配：在遇到歧义时候匹配到一次符合的结果就不匹配了
js默认是贪婪匹配模式,贪婪模式变成非贪婪模式只需要在贪婪量词（{n, }, {n, m}, + , ?, *）后面加一个?就行了
附加：正则匹配中?的几种用法

let reg = /\d??/;
let string = '123456';
console.log(string.replace(reg, 'haha'));

正则匹配前瞻后顾的概念

正则匹配的前瞻就是给正则匹配的选项定义一个断言，或者说是一个条件比如：我要匹配一个字母，但是我的需求是字母后面必须是跟着一个数字的情况，那么这种场景是怎么实现了，就是用到前瞻的概念，那么我想要他的前面也要是一个数字怎么办了，这就是后顾。
前瞻后顾的描述

正则	描述
(?=pattern)	正向肯定查找(前瞻),后面必须跟着什么
(?!pattern)	正向否定查找(前瞻)，后面不能跟着什么
(?:pattern)	非捕获分组,即该分组不写入$1,$2,....中
(?<=pattern)	反向肯定条件查找(后顾)，不捕获
(?<!pattern)	反向否定条件查找（后顾）
(?<name>)	给分组起一个名字

正则匹配新特性

let string = 'a1dvb';
let reg = /\w(?=\d)/;
console.log(string.replace(reg, '---'));

特点

以上的三个匹配形式都是不被捕获的，其中前两个是不匹配的，他只是用来当作条件来用，第三个是要被匹配的

//  分组被匹配并且捕获
let string = 'a1b3c4';
let reg = /(\w)(\d).+/;  //去掉加号就不同
string = string.replace(reg, '$1$2');
console.log(string);  //a1

// 分组被匹配但是不被捕获
let string = 'a1b3c4';
let reg = /(?:\w)(\d).+/;  // 去掉加号就不同
string = string.replace(reg, '$1$2');
console.log(string);  // 1$2

// 分组不被匹配也不被捕获，仅作为条件
let string = 'a1b3c49tt';
let reg = /(\d)(?=\d).+/;  // 去掉加号就不同
string = string.replace(reg, '$1$2');
console.log(string);  // 4$2

匹配原则----个人总结

1：任何元字符在没有写量词的情况下，只匹配一次
2：写了量词，默认是贪婪匹配
3：正则匹配一旦全部找到就不会在继续去匹配，除非你设置了全局g
4：正则匹配按照匹配规如果中间中断没有匹配到，并且字符串没有匹配完，会继续按照匹配规则重新匹配
5：（pattern）如果匹配到了很多结果，只捕获最后一次匹配到的结果
6：任何量词都只作用于前面的元字符

正则匹配相关的四个函数

正则对象的五个属性

1:source 2:global 3:ingoreCase 4:multiline 5:lastIndex

属性	描述
global	是一个只读一个布尔值，用来描述是否带有全局的修饰符
ingoreCase	是一个只读一个布尔值，用来描述是否带有忽略大小写的修饰符
multiline	是一个只读一个布尔值，用来描述是否带有换行的修饰符
source	就是匹配规则的文本本身
lastIndex	是一个可以读写的整数，如果是全局搜索，这个属性的值是匹配到的字符的下一个字符的索引所对应的值，直到没有匹配为止，才会变成0，如果不是全局始终为0

let reg = /\d/gmi;
console.log(reg.source);  // \d
console.log(reg.global); // true
console.log(reg.ignoreCase);  // true
console.log(reg.multiline);  // true
console.log(reg.lastIndex); 0

函数1：test

字符串满足正则匹配规则就会返回true,但是如果正则匹配里面含有全局的话，那么多运行几遍会报错，因为正则每次匹配开始都是看lastIndex的，全局情况下lastIndex每次执行都会被改变

let reg = /\d/g;
let string = '1234';
console.log(reg.test(string));

// 全局情况
et reg = /\d/g;
let string = '12';
console.log(reg.test(string));  // true
console.log(reg.test(string)); // true
console.log(reg.test(string)); // false

函数2：exec

如果没有找到任何匹配就返回null,如果找到了则返回一个数组，exec方法返回的数组的第 0 个元素是与正则表达式相匹配的文本

第 1 个元素是正则匹配到的第 1 个子表达式相匹配的文本（如果有的话）

第 2 个元素是正则匹配到的第 2 个子表达式相匹配的文本（如果有的话）

...

以此类推。
其中还有三个参数
index:表示匹配到的文本的第一个字符所在的索引位置
input: 表示被匹配的文本
groups:表示有名的分组
在全局下也是一样因为exec永远只返回第一个匹配。

let reg = /(\w)(\d)(\d)/;
let string = 'a11a233';
reg.exec(string); //  ["a11", "a", "1", "1", index: 0, input: "a11a233", groups: undefined]

let reg = /(?<json>\w)(?<tiantian>\d)(?<jianwu>\d)/;
let string = 'a11a233';
reg.exec(string);

函数3：match

如果没有找到任何匹配就返回null,如果找到了则返回一个数组，match方法返回的数组的第 0 个元素是与正则表达式相匹配的文本