正则表达式之入门

正则表达式是什么?

正则表达式是用于匹配字符串中字符组合的模式。简单来说,用一种描述性语言去规定字符串的一种规则,如果符合,就匹配了,否则就是不匹配。

定义总是很枯燥不直观,我们来举个例子吧。假如你想从"hi my friend"里找出hi单词,我们定义正则表达式:/hi/,比如你想匹配三位数字 123,235等,你可以定义表达式/\d\d\d/,这里的\d我们称为元字符,它含义是匹配一个数字字符,那这里是3个\d所以就可以匹配3个数字,是不是很简单啊。

  • \d{3}表示匹配3个数字,例如'010';

  • \d{3,8}表示3-8个数字,例如'1234567'。

  • '00\d'可以匹配'007',但无法匹配'00A';

这里的{}也是元字符,后面会介绍。

正则表达式基本语法

既然是一种描述性语言,那么就有自己特殊的语法,所以需要大致记忆一下。当然使用的多了,自然就熟悉了。

元字符

具有特殊意义的正则表达式,这样可以更好描述需要匹配的字符串。

上面介绍过\d匹配一个数字字符,还有\w匹配一个单字字符(字母、数字或者下划线),\s匹配任意的空白符.

Markdown

.(小数点)匹配除换行符之外的任何单个字符。
例如.b,就会匹配“bcd abc”中的ab,而不会匹配bc

\b\w{6}\b 匹配6个字符的单词,{6}重复6次

^$都表示匹配一个位置,^表示字符串开头位置,$表示字符串结尾,例如我们匹配QQ号^\d{5,12}$,{5,12}重复5到12次,因为前后匹配位置,所以必须输入5到12位数字才能匹配。

限定符

表示前面正则字符重复的次数

Markdown

例如:

bc*匹配 “bc”或“bcccccccccccccc”

a+/匹配了在 "candy" 中的 'a',和在 "caaaaaaandy" 中所有的 'a'

e?le? 匹配 "angel" 中的 'el',和 "angle" 中的 'le' 以及"oslo' 中的'l'。

定位符

定位符用来描述字符串或单词的边界

Markdown

例如你要寻找字符串中hi,但是如果没有设置单词边界,就有可能匹配出him,history,high,但是使用\bhi\b就只会匹配hi单词。

而/B其实是\b的取反,oo\B可以匹配“foot”里的oo

字符转义

如果你想查找本身具有特殊意义的元字符,如果直接使用就会产生问题,这时你就得使用\来取消这些字符的特殊意义。

因此,你应该使用\.\*。当然,要查找\本身,你也得用\\.

字符类

有的时候我只是想找元音字母a,e,i,o,u,其他字母不需要怎么办?很明显\w不适合的。

那我们应该自定义自己需要的字符集[a,e,i,o,u], 其实\d等于[0-9],而\w等于[a-z0-9A-Z_]

分枝条件

x|y
你可以理解为逻辑运算里“或”

例如:
green|red匹配“green apple”中的‘green’和“red apple”中的‘red’

分组

我们可以重复单个字符多次,但是怎么可以重复多个字符多次呢??你可以用小括号()来指定子表达式(也叫做分组),然后你就可以指定这个子表达式的重复次数了

模式 (foo) (bar) \1 \2 中的 '(foo)' 和 '(bar)' 匹配并记住字符串 "foo bar foo bar" 中前两个单词,每个小括号表示一个分组,1和2是组号而\1表示第一个分组匹配。

例如:\b(\w+)\b\s+\1\b可以用来匹配重复的单词,像go go, 或者kitty kitty

贪婪与懒惰

正则表达式默认是尽可能匹配多的字符,以这个表达式为例:a.*b,这样,它将会匹配最长的以a开始,以b结束的字符串。如果用它来搜索aabab的话,它会匹配整个字符串aabab。这被称为贪婪匹配

但是很明显有时候我们需要尽可能匹配少的字符,那我们可以加限定符?,
a.*?b,这样如果用它来搜索aabab的话,它会匹配整个字符串aabab

Markdown

标志

正则表达式有四个可选参数进行全局和不分大小写搜索。这些参数既可以单独使用也可以一起使用在任何顺序和包含正则表达式的部分中。

Markdown

使用正则表达式

创建一个正则表达式

  • 正则表达式字面量
/*
   /pattern/flags
*/

const regex = /ab+c/;

const regex = /^[a-zA-Z]+[0-9]*\W?_$/gi;
  • 调用RegExp对象的构造函数
/*
    new RegExp(pattern [, flags])
*/

let regex = new RegExp("ab+c");

let regex = new RegExp(/^[a-zA-Z]+[0-9]*\W?_$, "gi");

let regex = new RegExp("^[a-zA-Z]+[0-9]*\W?_$", "gi");

使用正则表达式的方法

正则表达式可以被用于RegExp的exec和test方法以及 String的match、replace、search和split方法。

Markdown
Markdown

个人水平有限,如有错误,还望指正,感激不尽!!!


参考链接

正则表达式

正则表达式30分钟入门教程

正则表达式 - 教程

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 214,658评论 6 496
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 91,482评论 3 389
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 160,213评论 0 350
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 57,395评论 1 288
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 66,487评论 6 386
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 50,523评论 1 293
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 39,525评论 3 414
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 38,300评论 0 270
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 44,753评论 1 307
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 37,048评论 2 330
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 39,223评论 1 343
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 34,905评论 5 338
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 40,541评论 3 322
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 31,168评论 0 21
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,417评论 1 268
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 47,094评论 2 365
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 44,088评论 2 352

推荐阅读更多精彩内容