什么是 RegExp?
RegExp 是正则表达式的缩写。
当您检索某个文本时,可以使用一种模式来描述要检索的内容。RegExp 就是这种模式。
简单的模式可以是一个单独的字符。
更复杂的模式包括了更多的字符,并可用于解析、格式检查、替换等等。
您可以规定字符串中的检索位置,以及要检索的字符类型,等等。
定义 RegExp
const pattern = new RegExp('str');
RegExp 对象的方法
- test()
- exec()
- compile()
test() 方法检索字符串中的指定值。返回值是 true 或 false。
const pattern = new RegExp('str');
console.log(pattern.test('input string')); // true
exec() 方法检索字符串中的指定值。返回值是被找到的值。如果没有发现匹配,则返回 null。
const pattern = new RegExp('str');
console.log(pattern.test('input string')); // [ 'str', index: 6, input: 'input string', groups: undefined ]
compile() 方法用于改变 RegExp(既可以改变检索模式,也可以添加或删除第二个参数)。
const pattern = new RegExp('e');
console.log(pattern.test('The best things in life are free'));
pattern.compile('d');
console.log(pattern.test('The best things in life are free'));
支持正则表达式的 String 对象的方法
- search()
- match()
- replace()
- split()
search()方法检索与正则表达式相匹配的子字符串。search() 方法不执行全局匹配,它将忽略标志 g。它同时忽略 regexp 的 lastIndex 属性,并且总是从字符串的开始进行检索,这意味着它总是返回 stringObject 的第一个匹配的位置。
// stringObject.search(regexp) 语法 (匹配不上时返回 -1)
const stringObj = 'Hello world';
const result = stringObj.search(/l{3}/);
console.log(result); // -1
match() 方法可在字符串内检索指定的值,或找到一个或多个正则表达式的匹配。该方法类似 indexOf() 和 lastIndexOf(),但是它返回指定的值,而不是字符串的位置。
// stringObject.match(regexp) 语法 (匹配不上时返回 null)
const stringObj = 'Hello world';
const result = stringObj.match(/l{2}/);
console.log(result); // [ 'll', index: 2, input: 'Hello world', groups: undefined ]
replace() 方法用于在字符串中用一些字符替换另一些字符,或替换一个与正则表达式匹配的子串。
字符串 stringObject 的 replace() 方法执行的是查找并替换的操作。它将在 stringObject 中查找与 regexp 相匹配的子字符串,然后用 replacement 来替换这些子串。如果 regexp 具有全局标志 g,那么 replace() 方法将替换所有匹配的子串。否则,它只替换第一个匹配子串。
// stringObject.replace(regexp/substr,replacement) 语法 (匹配不上时返回原字符串)
const stringObj = 'Hello world';
const result = stringObj.replace(/l{2}/,'ii');
console.log(result); // Heiio world
split() 方法用于把一个字符串分割成字符串数组。
返回一个字符串数组。该数组是通过在 separator 指定的边界处将字符串 stringObject 分割成子串创建的。返回的数组中的字串不包括 separator 自身。
但是,如果 separator 是包含子表达式的正则表达式,那么返回的数组中包括与这些子表达式匹配的字串(但不包括与整个正则表达式匹配的文本)。
// stringObject.split(separator,howmany) 语法 (匹配不上时返回 [stringObject])
const stringObj = 'Hello world';
const result = stringObj.split(/l{2}/);
console.log(result) // [ 'He', 'o world' ]
RegExp 参数
- 直接量语法
/pattern/attributes
- 创建 RegExp 对象的语法
new RegExp(pattern, attributes);
参数 pattern 是一个字符串,指定了正则表达式的模式或其他正则表达式。
参数 attributes 是一个可选的字符串,包含属性 "g"、"i" 和 "m",分别用于指定全局匹配、区分大小写的匹配和多行匹配。ECMAScript 标准化之前,不支持 m 属性。如果 pattern 是正则表达式,而不是字符串,则必须省略该参数。
注意
const reg = /str/;
const newReg = reg.compile(reg, 'i'); // 报错
console.log(newReg.test('string'))
// 正确示例
const reg = /str/;
const newReg = new RegExp(reg, 'i');
console.log(newReg.test('string'));
附表
- 修饰符
修饰符 | 描述 |
---|---|
i | 执行对大小写不敏感的匹配。 |
g | 执行全局匹配 |
m | 执行多行匹配 |
- 方括号
表达式 | 描述 |
---|---|
[abc] | 查找方括号之间的任何字符 |
[^abc] | 查找任何不在方括号之间的任何字符 |
[0-9] | 查找任何从0至9的数字 |
[a-z] | 查找任何从小写a至小写z的字符 |
[A-Z] | 查找任何从大写A至大写Z的字符 |
[A-z] | 查找任何从大写A至小写z的字符 |
[adgk] | 查找给定集合内的任何字符 |
[^adgk] | 查找给定集合外的任何字符 |
(red|blue|green) | 查找任何指定的选项 |
- 元字符
元字符 | 描述 |
---|---|
. | 查找单个字符,除了换行和行结束符。 |
\w | 查找单词字符。 |
\W | 查找非单词字符。 |
\d | 查找数字字符。 |
\D | 查找非数字字符。 |
\s | 查找空白字符。 |
\S | 查找非空白字符。 |
\b | 匹配单词边界。 |
\B | 匹配非单词边界。 |
\0 | 查找 NUL 字符。 |
\n | 查找换行符。 |
\f | 查找换页符。 |
\r | 查找回车符。 |
\t | 查找制表符。 |
\v | 查找垂直制表符。 |
\xxx | 查找以八进制数 xxx 规定的字符。 |
\xdd | 查找以十六进制数 dd 规定的字符。 |
\uxxxx | 查找以十六进制数 xxxx 规定的 Unicode 字符。 |
- 量词
元字符 | 描述 |
---|---|
n+ | 匹配任何包含至少一个 n 的字符串。 |
n* | 匹配任何包含零个或多个 n 的字符串。 |
n? | 匹配任何包含零个或一个 n 的字符串。 |
n{X} | 匹配包含 X 个 n 的序列的字符串。 |
n{X,Y} | 匹配包含 X 至 Y 个 n 的序列的字符串。 |
n{X,} | 匹配包含至少 X 个 n 的序列的字符串。 |
n$ | 匹配任何结尾为 n 的字符串。 |
^n | 匹配任何开头为 n 的字符串。 |
?=n | 匹配任何其后紧接指定字符串 n 的字符串。 |
?!n | 匹配任何其后没有紧接指定字符串 n 的字符串。 |