大家好,我是IT修真院郑州分院第6期的学员王栋,一枚正直、纯洁、善良的前端程序员今天给大家分享一下,修真院官网js任务5深度思考中的知识点——如何使用正则表达式
如何使用正则表达式
1.背景介绍
正则表达式到底是什么东西?
正则表达式,又称规则表达式。(英语:Regular Expression,在代码中常简写为regex、regexp或RE),
计算机科学的一个概念。正则表通常被用来检索、替换那些符合某个模式(规则)的文本。
正则表达式是对字符串操作的一种逻辑公式,就是用事先定义好的一些特定字符、及这些特定字符的组合组成一个“规则字符串”,
这个“规则字符串”用来表达对字符串的一种过滤逻辑。
简单说就是按照某种规则去匹配符合条件的字符串。
2.知识剖析
2.1 元字符,拥有特殊含义的字符
常用的元字符
说明
. 匹配除换行符以外的任意字符
\w 匹配字母或数字或下划线或汉字
\s 匹配任意的空白符
\d 匹配数字
\b 匹配单词的开始或结束
^ 匹配字符串的开始
$ 匹配字符串的结束
我们举个例子来看看这些元字符是什么意思
元字符^(和数字6在同一个键位上的符号)和$都匹配一个位置,这和\b有点类似。^匹配你要用来查找的字符串的开头,$匹配结尾。
这两个代码在验证输入的内容时非常有用,比如一个网站如果要求你填写的QQ号必须为5位到12位数字时,可以使用:^\d{5,12}$???
错的,正确的应该是这样的[1-9][0-9]{4,}。
因为使用了^和$,所以输入的整个字符串都要用来和\d{5,14}来匹配,也就是说整个输入必须是5到14个数字,但是首字母不能为0
^\d[1][0-9]{4,14}$ 因此如果输入的QQ号能匹配这个正则表达式的话,那就符合要求了。
2.2 字符转义
如果你想查找元字符本身的话,比如你查找.,或者*,就出现了问题:你没办法指定它们,因为它们会被解释成别的意思。
这时你就得使用\来取消这些字符的特殊意义。因此,你应该使用\.和\*。当然,要查找\本身,你也得用\\.
例如:jnshu\.com匹配jnshu.com
C:\\Windows匹配C:\Windows
2.3 重复
常用的限定符
说明
* 重复零次或更多次
+ 重复一次或更多次
? 重复零次或一次
{n} 重复n次
{n,} 重复n次或更多次
{n,m} 重复n到m次
例如:
Windows\d+匹配Windows后面跟1个或更多数字
^\w+匹配一行的第一个单词(或整个字符串的第一个单词,具体匹配哪个意思得看选项设置
2.4 反义
有时需要查找不属于某个能简单定义的字符类的字符。比如想查找除了数字以外,其它任意字符都行的情况,这时需要用到反义:
常用的反义代码
说明
\W 匹配任意不是字母,数字,下划线,汉字的字符
\S 匹配任意不是空白符的字符
\D 匹配任意非数字的字符
\B 匹配不是单词开头或结束的位置
[^x] 匹配除了x以外的任意字符
[^aeiou] 匹配除了aeiou这几个字母以外的任意字符
例子:\S+匹配不包含空白符的字符串。
<a[^b]+>匹配用尖括号括起来的以a开头的字符串。
2.5 贪婪与懒惰
懒惰限定符
说明
*? 重复任意次,但尽可能少重复
+? 重复1次或更多次,但尽可能少重复
?? 重复0次或1次,但尽可能少重复
{n,m}? 重复n到m次,但尽可能少重复
{n,}? 重复n次以上,但尽可能少重复
当正则表达式中包含能接受重复的限定符时,通常的行为是(在使整个表达式能得到匹配的前提下)匹配尽可能多的字符。以这个表达式为例:a.*b,
它将会匹配最长的以a开始,以b结束的字符串。如果用它来搜索aabab的话,它会匹配整个字符串aabab。这被称为贪婪匹配。
有时,我们更需要懒惰匹配,也就是匹配尽可能少的字符。前面给出的限定符都可以被转化为懒惰匹配模式,只要在它后面加上一个问号?。
这样.*?就意味着匹配任意数量的重复,但是在能使整个匹配成功的前提下使用最少的重复。现在看看懒惰版的例子吧:
a.*?b匹配最短的,以a开始,以b结束的字符串。如果把它应用于aabab的话,它会匹配aab(第一到第三个字符)和ab(第四到第五个字符)。
3.常见问题
什么情况下会用到正则表达式?
4.解决方案
验证各种表单内容是否符合条件,查找一些需要的内容之类的都可以
5.编码实战
'he is a boy ,This is a boy'.replace(reg,'IS')
"he IS a boy ,This is a boy"
var reg=/\bis\b/g
'he is a boy ,This is a boy'.replace(reg,'IS')
var str="Is this all there is?";
var patt1=/is/gi;
console.log(str.match(patt1));
var patt1=new RegExp("e");
console.log(patt1.test("The best things in life are free"));
6.扩展思考
我们在使用正则表达式的时候需要注意的问题
简单地说,我们一般需要验证的时候直接在网上找模板就行了,但是网上很多人写的表达式是有缺陷的,使用的时候要能看懂是什么意思,验证逻辑上对不对
7.参考文献
参考一:正则表达式30分钟入门教程
参考二:js常用正则表达式
参考三:在线正则表达式测试
参考四:葡萄藤wiki
8.更多讨论
正则表达式还有其他那些与法呢?
PPT
A1:王栋:缺点
1.正则表达式只适合匹配文本字面,不适合匹配文本意义。
2.容易引起性能问题
3.正则的替换功能较差
优点:
只要熟练应用正则表达式,而且匹配的目标是纯文本,那么相比于写分析器来说,正则可以更快速的完成工作。还有在捕获字符串的能力,正则也可以很好的完成工作,比如截取url的域名或者其他的内容等等
在给对象参数的情况下,如果参数的形式是数组的时候,比如apply示例里面传递了参数arguments,这个参数是数组类型,并且在调用Person的时候参数的列表是对应一致的(也就是Person和Student的参数列表前两位是一致的) 就可以采用 apply , 如果我的Person的参数列表是这样的(age,name),而Student的参数列表是(name,age,grade),这样就可以用call来实现了,也就是直接指定参数列表对应值的位置(Person.call(this,age,name,grade));
Q2:王姣妍:手机号码验证的正则表达式怎么写?
A2: /(^$)|^(((\+86)|(86))?1[34578]\d{9})$/
Q3:吴泽华:正则表达式最常用的应用场景?
A3:我们使用正则表达式的场景可能就是表单验证了,验证格式!!
Q4:要贝贝:好用的邮箱的正则表达式验证的写法再讲一下?
A4:王栋:/^[1-9a-zA-Z_]\w*@[a-zA-Z0-9]+(\.[a-zA-Z]{2,})+$/;