常用正则表达式

正则表达式这个东西,看过很多很多,用过的呢,几乎没有用过,就像现在的工作一般,只有真正去做以前没有做过的,去深入了解以前不了解的,才会发现其实这些都很简单;
正则这个东西,几乎在任何地方都可以用,shell里面、SQL语句里面、xx脚本里面
最近在做一些脚本语句识别的东西,其实关键的地方都是在用正则在做匹配的
以python为例:

import re
pattern = re"^(https?:\/\/)?([\da-z\.-]+)\.([a-z\.]{2,6})([\/\w \.-]*)*\/?$"
match_result = re.findall(pattern, String)

String为想要去用正则匹配的字符串,match_result会得到匹配的结果,匹配的结果会是一个tuple,里面的元素分别为根据表达式依次匹配到的()内的匹配条件,但是只有整个字符串符合整个正则表达式的匹配后,才会获取到匹配结果
已上面的表达式为例,可以从左到右拆分为几个部分:

  • "^(https?://)?([\da-z.-]+).([a-z.]{2,6})([/\w .-])/?$": ^表示从字符串起始位置开始匹配
  • "^(https?://)?([\da-z.-]+).([a-z.]{2,6})([/\w .-])/?$": ()表示正则表达式捕获的结果会放入一个分组中,https?代表将会匹配http或者https,//表示匹配https后面紧跟的//字符,因为/在正则里面有特殊含义,所以这里需要使用/来对/进行转义,让/代表/本身,括号后面的?代表匹配这个表达式零次或者多次,因为有的url不会带上协议名称
  • "^(https?://)?([\da-z.-]+).([a-z.]{2,6})([/\w .-])/?$" :第二个括号里面的[\da-z.-]+, \d代表匹配所有数字,也可以用0-9来表示所有数字a-z代表所有小写字母,.代表url里面的.,因为.在正则里面也是有特殊含义,所以也需要用\来进行转义,-代表url中可能出现的短横杠,然后用[]+把他们括起来表示可以匹配这些字符多次,然后再[]+后面紧跟着一个.,就表示实际上这一段匹配的是类似 xxx.xxx. 的一段url,但是捕获的结果是xxx.xxx,因为最后一个.不在括号里面
  • "^(https?://)?([\da-z.-]+).([a-z.]{2,6})([/\w .-])/?$" :之前已经匹配了类似https://xxx.xxx.的字符串,那么就剩最后面的域名了域名应该是com. cn. org. 这种类型的,会有固定的长度,所以这里用了一个长度限定{2,6}限定长度为2到6位
  • "^(https?://)?([\da-z.-]+).([a-z.]{2,6})([/\w .-])/?$" :最后的一段([/\w .-])/?$就是匹配可能在.com域名后面的目录名,\w代表所有字母,$代表匹配字符结尾,与最前面的^相呼应,匹配整个输入的字符串
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 219,110评论 6 508
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 93,443评论 3 395
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 165,474评论 0 356
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 58,881评论 1 295
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 67,902评论 6 392
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 51,698评论 1 305
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 40,418评论 3 419
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 39,332评论 0 276
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 45,796评论 1 316
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 37,968评论 3 337
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 40,110评论 1 351
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 35,792评论 5 346
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 41,455评论 3 331
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 32,003评论 0 22
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 33,130评论 1 272
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 48,348评论 3 373
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 45,047评论 2 355

推荐阅读更多精彩内容

  • 匹配中文:[\u4e00-\u9fa5] 英文字母:[a-zA-Z] 数字:[0-9] 匹配空格:[ ]匹配连续空...
    joker_fu阅读 4,216评论 0 0
  • 写在开头 在编码过程中,正则表达式一直是经常会出现但又困扰我们的知识点,笔者就是每次遇到正则表达式就相当头痛,往往...
    机智的马里奥阅读 1,544评论 5 46
  • 为什么要做这件事 做事情总得有些理由才能持久的执行下去,因为最近学习html5语言,常规使用的很多信息需要表单来进...
    TsingQue阅读 2,134评论 0 8
  • 常用正则表达式 “^\d+$” //非负整数(正整数 + 0) “^[0-9]*[1-9][0-9]*$” //正...
    485b1aca799e阅读 433评论 0 1
  • 常用正则表达式大全!(例如:匹配中文、匹配html)目录导航一、常见正则表达式二、正则表达式应用一、常见正则表达式...
    我不叫奇奇阅读 230评论 0 2