现在的正则表达式百度一下一大把,但针对于特殊的常见,百度完之后还需要改一下,所以掌握一下最基本的正则知识还是必要的
简单概念:
正则表达式:Regular Expression;
描述了一种字符串匹配的模式(只能操作字符串)
其本质:用来记录文本规则的代码 (为字符串定义规则,为输入内容定义规则)
由一串(外星文)组成:由一些普通字符和元字符组成,
普通字符就是字母和数字
元字符具有特殊意义(具有特殊用途)的字符
特点:
1.灵活性:逻辑性和功能性非常强 (所以写完之后自己看不出来写了啥)
2.可以迅速的用既简单的方式达到字符串的复杂控制
一、如何创建正则表达式
1.通过构造函数定义
var 变量名 = new RegExp(表达式, 修饰符);
2. 字面量创建方式
var 变量=/表达式/修饰符;
表达式:正则的匹配规则
- 如果使用到元字符具有字面意思必须转义
- 字面量中转义: 需通过 ‘\’字符转义
- 构造函数中转义: 需通过 ‘\’双层转义
修饰符: 用以标明正则表达式的行为(模式)
- g: (global) -> 全局匹配模式, 应用于所有字符串,而非在发现第一个匹配项时立即
停止- i: (case-insensitive)-> 不区分大小写,即在确定匹配项时忽略模式与字符串的大小写
- m: (multiline) -> 即在到达一行文本末尾时还会继续查找下一行中是否存在与模
式匹配的项
二、有哪些元字符?
. (点) : 除了换行和回车之外的任何字符, 相当于 [^\n\r]
var reg = /./;
// var reg = /[^\n\r]/;
var str = '\n'; // 换行符
var str2 = '\r'; // 回车符
console.log(reg.test(str), reg.test(str2)); // false, false
reg.test(str); 正则上的方法,用于检测字符串是否匹配
[]: 表示某个区间的范围,匹配区间的范围中的任意一个字符
[^]: 匹配中括号中的非某一个字符:(就是你的字符串中不能出现[]里面的任何一个字符)
\d : 匹配数字字符 相当于 [0-9]
\D: 非数字字符 相当于 [^0-9]
var str = '1';
var reg = /\d/;
var reg1 = /\D/;
console.log(reg.test(str)); // true
console.log(reg1.test(str)); // false
\s 空白字符 相当于 [\t\n\x0B\f\r] (零)
\S 非空白字符 相当于 [^\t\n\x0B\f\r]
\x0B : 垂直tab
\f: 换页
var reg = /\s/;
// var reg = /[\n\r\t\f\x0B]/;
var reg1 = /\S/;
// var reg1 = /[^\n\r\t\f\x0B]/;
var str = ' \n \r \x0B ';
console.log(reg.test(str)); // true
console.log(reg1.test(str)); // false
\w 单词字符 [a-zA-Z_0-9]
\W 非单词字符 [^a-zA-Z_0-9]
- 表示范围 某- 某之间
var reg = /\w/;
// var reg = /[a-zA-Z_0-9]/;
var reg1 = /\W/;
// var reg1 = / [^a-zA-Z_0-9]/;
var str = 'a0_'
console.log(reg.test(str)); // true
console.log(reg1.test(str)); // false
\b 单词边界 : 单词左右两边的字符缝隙
/B 匹配非单词边界,即左右两边都是 "/w" 范围或者左右两边都不是 "/w" 范围时的字符缝隙
var reg = /\b/g;
var str = 'beicheng education';
console.log(str.replace(reg, '-')); // -beicheng- -education-
string.replace(匹配模式(旧内容), 替换(新)内容);
| 或
var reg = /a|b/;
var str = 'a';
var str1 = 'b';
var str2 = 'c';
console.log(reg.test(str)); // true
console.log(reg.test(str1)); // true
console.log(reg.test(str2)); // false
^ 起始 : 匹配行或字符串的起始位置; (注:^在[]中表示非)
$ 结尾 : 会匹配行或字符串的结尾位置
^$ 在一起,表示必须是这个开头结尾
var startA = /^a/;
var endB = /b$/;
var reg = /^a\wb$/;
var str = 'a_b';
console.log(startA.test(str)); // true
console.log(endB.test(str)); // true
console.log(reg.test(str)); // true
() 小括号
(1). 在被修饰匹配次数的时候,括号中的表达式可以作为整体被修饰
(2). 取匹配结果的时候,括号中的表达式匹配到的内容可以被单独得到
var reg = /(ab)|(ac)/;
var str = 'ab';
var str1 = 'ac';
var str2 = 'ad';
var str3 = 'a';
console.log(reg.test(str)); // true
console.log(reg.test(str1)); // true
console.log(reg.test(str2)); // false
console.log(reg.test(str3)); // false
正则匹配汉字的公式 :[\u4e00-\u9fa5]
var reg = /[\u4e00-\u9fa5]/;
var str = '贝程';
console.log(reg.test(str));
console.log(\u9fa5); // 龥 is not defined
三、量词
数量: 可出现多少次数
+: 1到无限次
*: 0 到无限次
?: 0次或者1次
{n, m}: 最少n次, 最多m次
{n, }: 最少n次,最多不限
{, m}: 最少不限,最多m次
{n}: 正好n次
四、方法
正则的方法
- reg.test(str)
功能: 用来检测字符串是否匹配正则
返回值是boolean值
- reg.exec(str)
功能:用来检测字符串是否与正则匹配
返回匹配返回一个数组 不匹配返回null
说明:数组里的第一个元素存放的是正则所匹配到的内容 但切记该方法不支持全文匹配 )却支持分组
并且受 g 的影响。若指定了 g,则下次调用 exec 时,会从上个匹配的 lastIndex 开始查找
var str = '123113134513253321343123,456,789,7b2';
var reg = /\d+/;
console.log(reg.exec(str));
var str = '123113134513253321343123,456,789,7b2';
var reg = /\d+/g; // 不支持全局匹配
console.log(reg.exec(str));
var str = '123,456,789,7b2';
var reg = /\d+/g;
console.log(reg.exec(str));
console.log(reg.exec(str));
字符串的方法
- str.match(reg)
只接收一个参数:正则表达式
如果没有修饰符 g,那么 match() 方法就只能在 str中执行一次匹配。
如果没有找到任何匹配的文本, match() 将返回 null。
否则,它将返回一个数组,其中存放了与它找到的匹配文本有关的信息
index: 出现在str中的下标, inputs为 str
var str = 'ab a bc b c bc ';
var reg = /bc/;
console.log(str.match(reg));
var str = 'ab a bc b c bc ';
// 多个g
var reg = /bc/g;
console.log(str.match(reg));
- str.search(reg)
只接收一个参数:正则表达式
返回字符串中第一个匹配项的索引,如果没有找到则返回-1
var str = 'ab a bc b c bc ';
var reg = /bc/; // 不支持g
console.log(str.search(reg)); // 5
- str.replace(str|reg, newStr|function)
第一个参数是字符串,那么只会替换第一个匹配的子字符串
第一个参数是正则表达式,并且指定全局g标志 --- 则匹配所有子字符串
第二个参数,可以是字符串也可以是函数 --- 需要替换的新字符串
注:在newStr 中的 ,格式为$n,代表匹配中被记住的第n的匹配字符串(注意小括号可以记忆匹配)
var str = '?a=1&b=2&c=3';
var reg = /([^?&=]+)=([^?&=])*/; // 每一个小括号为一个小组 (加上g, 则多匹配几次)
console.log(str.replace(reg, '$1')); // ?a&b=2&c=3 // 替换的内容为 匹配小组的第一个小组值
console.log(str.replace(reg, '$2')); // ?1&b=2&c=3 // 替换的内容为 匹配小组的第二个小组值
var str = '?a=1&b=2&c=3';
var reg = /([^?&=]+)=([^?&=])*/; // 每一个小括号为一个小组 (加上g, 则多匹配几次)
str.replace(reg, function (res, $1, $2) {
console.log(res, $1, $2); // a=1 a 1
});
正则的特点
懒惰性:每一次执行匹配只捕获第一个匹配的内容
贪婪性:正则的每一次捕获都是按照匹配最长的结果捕获的
请使用正则表达式实现以下功能
- 实现字符串的trim函数,去除字符串两边的空格
var str = ' 1 2 3 ';
var reg = /(^\s*)|(\s*$)/g;
console.log(str.replace(reg, ''));
- 提取浏览器url中的参数名和参数值,生成一个key/value的对象
var str = '?a=1&b=2&c=3';
var reg = /([^?=&]*)=([^?=&]*)/g;
function URLParams(str) {
var searchObj = {};
str.replace(reg, function (res, $1, $2) {
console.log($1, $2); // a 1 // b 2 // c 3
searchObj[$1] = $2;
});
return searchObj;
}
console.log(URLParams(str)); // {a: "1", b: "2", c: "3"}
- 给一个连字符串例如:get-element-by-id转化成驼峰形式
var str = 'get-element-by-id';
var reg = /(-)([a-z])/g;
console.log(str.match(reg)); // ["-e", "-b", "-i"]
var newStr = str.replace(reg, function (res, $1, $2) {
return $2.toUpperCase();
});
console.log(newStr); // getElementById
- 实现innerText的方法
var str = '<div>嘻嘻<b>嘿嘿<small>哈哈</small></b></div>'
var reg = /<[^<>]+>/g;
var newStr = str.replace(reg, '');
console.log(newStr); // 嘻嘻嘿嘿哈哈