正则表达式

正则表达式

1.什么是正则表达式
正则表达式是处理字符串的工具,通过不同的正则符号来描述字符串的规则

2.正则表达式:r'真正语法'

3.正则符号(正则表达式的语法)

1)普通字符:除了在正则中有特殊的功能和意义的符号以外都是普通字符
    a.普通字符代表字符本身
    .  -  匹配任意字符(一个.只能匹配一个字符)
    \w  -  匹配一个 数字、字母或者_(在ASCII中使用)
    \d  -  匹配任意一个数字字符   
    \s  -  匹配任意一个空白字符(回车,换行,空格,制表符(\t))
    \D  -  匹配出数字外的任意字符
    \S  -  匹配一个非空白字符
    \大写字母  -  大写字符匹配与 \小写 的相反

    [字符集]  -  匹配字符集出现的任意一个字符(一个中括号只能匹配任意一个字符)
        [1-9]  -  匹配1-9中的任意字符(字符编码值递增)
        [a-zA-Z]  -  匹配任意一个字母
        [\u4e00-\u9fa5]  -  匹配任意一个中文
    [^字符集]  -  匹配不在字符集中的任意字符  
2)检测字符
    \b  -  检查是否是单词边界()
        单词边界:能够将两个单词隔开并且不会产生任何歧义的符号如:空白字符,标点符号,包括开头和结尾
        匹配规则:先去掉\b对字符串进行匹配,如果匹配成功再检查\b所在的位置是否在单词边界
    ^  -  检查^所在的位置是否是字符串开头
        注意^在中括号外面
    $  -  检查$所在的位置是否是字符串的结尾
3)控制次数的符号
    *  -  匹配0次或者多次
        1b2a*   -  1b2后面a出现0次或者多次        
        1b2\d*   -  1b2后面出现0个或者多个数字字符
    +  -  匹配1次或多次
    ? -  匹配0次或1次
    {N} -  匹配N次
        a{3} - 匹配3个a
        \d{3} - 匹配三个数字
    {M,N}  -  匹配M到N次(至少M次,最多N次)
    {M,}  -  至少匹配M次
    {,N}  -  最多N次
    贪婪和非贪婪:
        在匹配次数不确定的时候,或出现贪婪和非贪婪两种情况;默认情况下都是贪婪的。
        什么是贪婪:在能够匹配成功的前提下,匹配次数尽可能多
        什么是非贪婪:在能够匹配成功的前提下,匹配次数尽可能少(在匹配次数后加问号)
4)分支
    正则1 | 正则2  -  先让正则1去匹配如果匹配成功就成功,匹配失败就让正则2区匹配

5)分组
    a.分组截取:方便后买面分段或者分情况去不同匹配结果
    b.分组重复:在正则中用\X来重复前面第X个分组的内容
    注意:\X前面必须有这个分组
    () - 将括号内的内容作为一个整体
        r'(\d{2}|[A-Z]{2})abc'      -     匹配一个字符后面是abc,前面是2个数字或2个字母
        r'([a-z]\d){3}'

6)转义
    a.加\
        在正则中有特殊功能和特殊意义的符号前加\,让这个符号的特殊功能和特殊意义消失
    b.加[]
        在[]中有特殊意思的符号:^放在开头;-放在两个符号之间;而.+?*$这些单独的符号在[]中就是符号本身
# 匹配一个字符串长度为8,前三个字符是abc,后三个字符是123,中间是两个任意字符
re_str = r'abc..123'
result = fullmatch(re_str, 'abcer123')
print(result)

# 匹配一个长度为4的字符串
re_str = r'\wabc'

# 匹配一个长度是5的字符串,前两个是任意数字,后面三个是任意字符
re_str = r'\d\d...'

# 匹配一个长度为4的字符,第一个字符是1或者3或者7
re_str = r'[137]...'

re_str = r'(\d{3})[a-z]{3}'
print(findall(re_str, '123sdsdf胜多负少的方式12sd1234sdsfd'))

re_str = r'(\d{3})[a-z]{3}\1'
print(fullmatch(re_str, '345hgf345'))

re模块

re模块是Python提供的,专门针对正则表达式相关的函数
1.字符串匹配
  1)fullmatch(正则表达式,字符串) -> 让正则表达式和字符串完全匹配

  2)match(正则表达式,字符串) -> 匹配字符串开头

  以上两个方法的结果:失败就是None,匹配成功就会返回匹配对象
  匹配对象:
    a.获取匹配到的字符串
      匹配对象.group() - 获取整个正则表达式匹配到的字符串
    b.获取匹配到的字符串在原字符中的位置信息
      匹配对象.span() -> 返回匹配结果在原字符串的下标范围[]
      匹配对象.span(N) -> 返回第N个分组匹配到的结果在原字符串的下标范围[]
    c.获取原字符串
      匹配对象.string

  3)search(正则表达式,字符串) - 在字符串中查到第一满足正则表达式的字串,如果找到了结果是匹配对象,否则是None

  4)findall(正则表达式,字符串) - 获取字符串中所有满足正则表达式的字串;返回值是一个列表
    注意:如果正则表达式中有分组,列表中的匹配结果只会有分组匹配的内容

  5)finditer(正则表达式,字符串) - 获取字符串中所有满足正则表达式的字串:返回值是一个迭代器,元素是匹配对象

  6)split(正则表达式,字符串) - 在字符串中满足正则表达式的字串做为切割点对字符进行切割;返回一个字符串列表

  7)sub(正则表达式,字符串1,字符串2) - 将字符串2中所有满足正则表达式的字串替换成字符串1

©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 212,884评论 6 492
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 90,755评论 3 385
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 158,369评论 0 348
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 56,799评论 1 285
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 65,910评论 6 386
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 50,096评论 1 291
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 39,159评论 3 411
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 37,917评论 0 268
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 44,360评论 1 303
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 36,673评论 2 327
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 38,814评论 1 341
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 34,509评论 4 334
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 40,156评论 3 317
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 30,882评论 0 21
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,123评论 1 267
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 46,641评论 2 362
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 43,728评论 2 351

推荐阅读更多精彩内容

  • Python中的正则表达式(re) import rere.match #从开始位置开始匹配,如果开头没有则无re...
    BigJeffWang阅读 7,065评论 0 99
  • #首先,python中的正则表达式大致分为以下几部分: 元字符 模式 函数 re 内置对象用法 分组用法 环视用法...
    mapuboy阅读 1,605评论 0 51
  • 资源来自菜鸟教程:http://www.runoob.com/regexp/regexp-syntax.html ...
    贼厉害阅读 10,370评论 0 6
  • 01-基本符号 1.什么是正则 正则表达式就是一个字符匹配的工具;是由正则符号和普通字符组成,来匹配不同规律的字符...
    71a5d7e107e5阅读 308评论 0 0
  • 搞懂Python 正则表达式用法 Python 正则表达式 正则表达式是一个特殊的字符序列,它能帮助你方便的检查一...
    厦热阅读 1,572评论 0 2