正则表达式不再难懂，正则表达式难懂

文章由LinuxBoy分享于2019-04-04 06:04:13热评（345）

正则表达式不再难懂，正则表达式难懂

正则表达式

转载至《正则表达式思维导图，不再难懂》（推荐手机阅读）

导图内容解析

工具
- RegexBuddy
语法结构
字符
- [ab5@]
  匹配"a"或"b"或"5"或"@"
- [^abc]
  匹配a、b、c之外的任意字符
- [f-k]
  匹配“f"到"k"之间的字符
- [^A-F0-3]
  匹配“A"-"F","0"-"3"之外的任意一个字符
- \d
  任意一个数字，0~9
- \w
  任意一个字母、数字、汉字或下划线，A~Z、a~z、0~9、_和任意一个汉字
- \s
  任意空白符，包括空格、制表符、换行符
- .
  小数点可以匹配任意一个字符，换行除外（如果要匹配包括"\n"在内的所有字符，一般用[\s\S]）
- 普通字符：字母、数字、汉字、下划线，匹配与之相同的一个字符
- 简单转义字符：\n（换行）,\t（制表）,\\（\本身）和 \^...（\^等有特殊作用的符号如要匹配自己的话要用转义）
- 标准字符集合
  注意区分大小写，大写是相反的意思，匹配相反是不匹配
- 自定义字符集合
  [ ]方括号匹配方式，能够匹配方括号中的任意一个字符,^表示取反
量词(Quantifier)
修饰前面的一个表达式，如果要修饰多个表达式，就用( )把表达式包起来
- 贪婪模式（默认）
  匹配符合的最长的字符串
- 非贪婪模式（在量词后面加 ? 例：{m,n}? )
  匹配符合的最短的字符串
- {n}
  表达式重复n次
- {m,n}
  表达式至少重复m次，最多重复n次
- {m,}
  表达式至少重复m次
- ？
  匹配表达式0或1次，相当于{0,1}
- +
  表达式至少出现一次，相当于{1,}
- *
  表达式不出现或出现任意次，相当于{0,}
字符边界
零宽：匹配的不是字符而是位置，符合某种条件的位置
- ^
  与字符串开始的地方匹配
- $
  与字符串结束的地方匹配
- \b
  匹配一个单词的边界，当前位置前面的字符和后面的字符不全是\w
预搜索（零宽断言、环视）
零宽：匹配的不是字符而是位置，符合某种条件的位置
- (?=exp)
  断言自身出现的位置的后面能匹配表达式exp
- (?!exp)
  断言自身出现的位置的后面不能匹配表达式exp
- (?<=exp)
  断言自身出现的位置的前面能匹配表达式exp
- (?<!exp)
  断言自身出现的位置的前面不能匹配表达式exp
匹配模式
对文本的处理方式
- 每行都是一个字符串
- 在多行模式下，如果需要仅匹配字符串开始和结束位置，可以使用\A和\Z
- 整个文本看作一个字符串，只有一个开头一个结尾
- 使小数点"."可以匹配包含换行符(\n)在内的任意字符
- 匹配时忽略大小写
- 默认是区分大小写的
- IGNORECASE 忽略大小写模式
- SINGLELINE 单行模式
- MULTILINE 多行模式
选择符和分组
分支结构、捕获组合非捕获组
- （1）、在被修饰匹配次数的时候，括号中的表达式可以作为整体被修饰
- （2）、取匹配结果的时候，括号中的表达式匹配到的内容可以被单独得到
- （3）、每一对括号会分配一个编号，使用（）的捕获根据左括号的顺序从1开始自动编号。捕获编号为零的第一个捕获是整个正则表达式模式匹配的文本
- 反向引用：通过反向引用，可以对分组已捕获的字符串进行引用。
- | 分支结构
  左右表达式之间“或”关系，匹配左边或右边
- ( ) 捕获组
- (?:Expression) 非捕获组
  一些表达式中，不得不使用（），但又不需要保存（）中子表达式匹配的内容，这时可以用非捕获组来抵消（）带来的副作用。

推荐文章：

正则表达式不再难懂，正则表达式难懂

正则表达式不再难懂，正则表达式难懂

正则表达式

导图内容解析

语法结构

量词(Quantifier)
修饰前面的一个表达式，如果要修饰多个表达式，就用( )把表达式包起来

字符边界
零宽：匹配的不是字符而是位置，符合某种条件的位置

匹配模式
对文本的处理方式

最新正则表达式教程教程

Linux头条

正则表达式不再难懂，正则表达式难懂

正则表达式不再难懂，正则表达式难懂

正则表达式

导图内容解析

语法结构

量词(Quantifier) 修饰前面的一个表达式，如果要修饰多个表达式，就用( )把表达式包起来

字符边界 零宽：匹配的不是字符而是位置，符合某种条件的位置

匹配模式 对文本的处理方式

相关内容

最新正则表达式教程教程

Linux头条

量词(Quantifier)
修饰前面的一个表达式，如果要修饰多个表达式，就用( )把表达式包起来

字符边界
零宽：匹配的不是字符而是位置，符合某种条件的位置

匹配模式
对文本的处理方式