linux shell 脚本攻略学习20--awk命令入门详解


awk生于1977年,创始人有三个,分别为 Alfred AhoPeter Weinberger, 和 Brian Kernighan,名称源于三个创始人的姓的首字母。

作用:处理文本文件。

awk的特色是可以对行和列进行操作,输入man awk可以查看awk手册,下面将主要以例子来学习awk语言。

语法:

mawk [-W option] [-F value] [-v var=value] [--]  [-W option] [-F value] [-v var=value] [-f program-] [--] [ ...]

参数-实例:

1、初识awk

截取top命令部分内容,拷贝到test.txt里:

amosli@amosli-pc:~/learn/$  root           200m  49m  11m S         : amosli         534m  21m  12m S         : gnome- mongodb        623m  15m  S         : amosli        1005m 125m  17m S         : root                       S         : kworker/:        
  amosli            R         : amosli         686m   S         : hud- amosli         419m  10m  S         : telepathy- root                       S         : kworker/:        
     root             S         : root                       S         : root                       S         : ksoftirqd/        
     root      RT                 S         : migration/        
     root      RT                 S         : watchdog/         
     root      RT                 S         : migration/

下面打印第2列的内容,注意pattern里是单引号.

amosli@amosli-pc:~/learn/$   test.txt 
root
amosli
mongodb
amosli
root
amosli
amosli
amosli
root
root
root
root
root
root
root

$0表示打印出来全部,$n,n>0时表示打印第n列。

2、拆解awk语句块

先看例子:

amosli@amosli-pc:~/learn/$   test.txt 

ok,是不是用点不太懂?看不太懂没关系,下面拆解开来,一个awk脚本通常分为3部分:BEGIN 语句块END语句块和能够使用模式匹配的通用语句块。这三个部分是可选的,它们中的任何一个部分都可以不出现在脚本中。脚本通常包含在单引号或者双引号里。其通用模式结构如下所示:

  

下面是实际常用的语法格式:

   filename  

awk的工作原理:

(1)、执行BEGIN { commands }语句块中的语句。

(2)、从文件或stdin中读取一行,然后执行pattern { commands }。重复这个过程,直到文件全部被读取完毕。

(3)、当读至输入流(input stream)末尾时,执行END { commands } 语句块。

BEGIN语句块在awk开始从输入流中读取行之前被执行。这是一个可选的语句块。

END语句块在awk从输入流中读取完所有的行之后即被执行。这个同样是可选的。

最重要的部分就是pattern语句块中的通用命令。这个同样是可选的。如果不提供该语句块,则默认执行的是{ print },即打印每一个读取到的行。awk对于读取到的每一行,都会执行这个语句块.例:

amosli@amosli-pc:~/learn/$  -e  |  

这里首先执行的是BEGIN { print "now start" },然后开始执行默认打印line1\nline2 ,最后读完所有的行之后开始执行END语句块{ print "this is end "} 

同样可以将BEGIN和END都去掉,只使用默认的打印方式:

amosli@amosli-pc:~/learn/$  -e  |  

这种方式和例1的方式则是相同的。学完这两个例子,基本上就明白了awk到底咋用的了,其格式应该是什么样,即已经入门了。

3、关于print

这里的print和C语言中的基本上差别不大,但C语言我早已经忘的差不多了。还是来看看awk里的print是怎么使用的吧?

有两点需要注意:

1、当print的参数是以逗号进行分隔时,参数打印时则以空格作为定界符。

2、在awk 的print语句中,双引号是被当做拼接操作符的(concatenation operator) ,所以模式匹配最外层尽量使用单引号.

关于1,举例说明:

amosli@amosli-pc:~/learn/$  |  

这里print var1,var2用的是逗号进行分隔的,所以打印时是以空格作为定界符的。那如果不以逗号进行分隔呢?

amosli@amosli-pc:~/learn/$  |  

打印的时候v1v2贴到一块去了。如果再用其它符号进行分隔,打印会出错(我试了| : \ /)。

关于2,举例说明:

amosli@amosli-pc:~/learn/$  |  "+" var2 } +v2

这里使用了"+",双引号果然起到了连接的作用。

 

4、特殊变量

NR:表示记录数量(number of  records),表示当前行号,和cat命令中-n 意思一样。

NF:表示字段数量(number of fields),表示当前行的字段数量

$0,$1,$2,$n.... 前面已经说过,$0表示输出所有文本内容,$n表示第n行数据。

举例说明NR和NF:

下面是NF 

amosli@amosli-pc:~/learn/$  test.txt |  














每一行都有12个字段,"1067 root      20   0  200m  49m  11m S    2  1.3   4:43.91 Xorg",这里字段的定义不是字母数量,而是由空格隔开产生的一列为一个字段,

也可以理解为列数;

下面是NR:

amosli@amosli-pc:~/learn/$  test.txt |  














一共有15行。

5、将外部变量值传递给awk,-v参数

amosli@amosli-pc:~/learn/$ var=-pc:~/learn/$  |  -v vr=$var 

首先,定义一个var变量,赋值99;然后,将var变量的值在外部再赋给vr;最后打印出vr。

其实就是借值传值。但是当要传递很多参数时就蛋疼了,太麻烦了。下面介绍一个相对简便的方法进行外部传值。

amosli@amosli-pc:~/learn/$  |    y1=$v1 y2= 

这里没有使用-v参数,只是将y1=$v1传值放到后面去了,其实就是将y1=$v1 y2=$v2 当成file了 类似 awk '{print }' file。

6、使用awk进行过滤

1)只显示前四行,行数小于5,和head test.txt -n 4 效果一样。

amosli@amosli-pc:~/learn/$    test.txt 
  root           200m  49m  11m S         : amosli         534m  21m  12m S         : gnome- mongodb        623m  15m  S         : amosli        1005m 125m  17m S         : chrome 

2)只显示3-5行内容.

amosli@amosli-pc:~/learn/$    test.txt 
  mongodb        623m  15m  S         : amosli        1005m 125m  17m S         : root                       S         : kworker/:   

3)只显示包含amos的行

amosli@amosli-pc:~/learn/$   test.txt 
  amosli         534m  21m  12m S         : gnome- amosli        1005m 125m  17m S         : amosli            R         : amosli         686m   S         : hud- amosli         419m  10m  S         : telepathy-indic 

7、awk的内建函数

toupper(string),将字符串转为大写

amosli@amosli-pc:~/learn/$  
length,长度
amosli@amosli-pc:~/learn/$   test.txt 













sqrt()取平方根

amosli@amosli-pc:~/learn/$  

awk的功能非常强大,知识点也非常多,网上资料也非常多,这里主要学习的是linux shell脚本攻略第1版内容,awk的内容还需要更进一步的学习!

 

 

参考资料:1、awk学习笔记

     2、awk英文文档

     3、awk简明教程

 

 

 

 

 

 

 

 

 

 

 

 

相关内容