Linux grep 正则详解


正则表达式是一个工具,可以提高工作效率的工具。无论学习什么东西,都要明白它是用来干什么的,怎么去很好的运用它,这些才是我们应该作为学者首先该考虑的东西。既然是表达式,就是有命令、参数、选项、连接符等组合而成的,它们可以根据我们的需要,组合成有效的形式,进行文本的特定搜索和切割,得到我们想要的结果。说的简单些,正则表达式就是由一大堆的元字符组合起来,过滤文本的,我们把这些元字符组合起来,就是模式。

正则表达式,大家在开发中经常会用到的,现在很多开发语言都有正则表达式的应用,比如javascript java .net php等。我们什么时候用正则表达式呢?不是所有的字符操作都用正则就好了,当我们遇到复杂文本数据的解析时候,用正则是比较好的选择。

优点:正则表达式在处理复杂字符操作的时候,可以提高工作效率,也在一定程度 节省了你的代码量。

缺点:我们再使用正则表达式的时候,复杂的正则表达式会加大代码的复杂度,让人很难理解,所以我们有的时候需要在正则表达式内部添加注释

正则表达式可以分为:

1.基本正则表达式:grep

2.扩展正则表达式:egrep

3.不搜索正则表达式:fgrep

基本正则表达式,在日常学习和工作中用的最多的。

表格1 grep的常用选项

选项 说明
-v 对结果取反
-i 忽略字母大小写
-o 仅显示匹配到的字符串
-E 支持扩展正则表达式
-A n 匹配到的行向后多显示n行
-B n 匹配到的行向上多现实n行
-C n 匹配到的行上下各显n行

表格2 元字符

. 匹配任意单个字符
* 匹配其前面的字符任意次
.* 任意长度的任意字符
[] 指定范围内的任意单个字符
[^] 取反
^ 锁定行首
$ 锁定行尾
^$ 锁定空白行
\< 锚定词首
\> 锚定词尾
\(value\) 分组
\n 引用

表格3 常用通配符

[:digit:] 所有数字
[:lower:] 所有小写字母
[:upper:] 所有大写字母
[:space:] 所有空白字符
[:alpha:] 所有字母
[:punct:] 所有标点符号

  • 1
  • 2
  • 下一页

相关内容