awk学习笔记(4) －显示行号-阿里云开发者社区

相关文章推荐

空虚的领带 · 尤文图斯vs里尔球员评分：热格罗瓦7.8分， ...· 6 月前 ·

寂寞的眼镜 · 輔仁大學哲學系 - 輔仁大學哲學系· 8 月前 ·

沉稳的脆皮肠 · 十四届全国人大二次会议第二次全体会议--中国 ...· 10 月前 ·

销魂的烈马 · 403 Forbidden - HTTP ...· 1 年前 ·

英姿勃勃的椰子 · CLIENT SETNAME — ...· 1 年前 ·

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

awk '{print NR,$0}' arr.dat

在awk中有很多的内置的变量，NR就是其中之一，表示的是当前的行号。上面的语句就可以解释成：逐行输出，并在其前输出行号。看一下输出结果：

1 1034 7:26

2 1025 7:27

3 1101 7:32

4 1006 7:45

5 1012 7:46

6 1028 7:49

7 1051 7:51

8 1029 7:57

9 1042 7:59

10 1008 8:01

11 1052 8:05

12 1005 8:12

13 1005 8:13

14 1005 8:13

15 1005 8:13

行号后面会有一个字白字符与第二列进行分隔。这个空白字符是awk默认的，当然也可以进行修改。

上面的输出格式很不好看呀，随着行号数字位数的增多，格式开始变形。第一个问题来了，怎么让行号右对齐？

awk '{printf("%5d %s\n", NR, $0)}' arr.dat

我们终于用到了printf函数，这跟C语言的好像没什么不同。%5d表示输出一个5位的整数，如果不足5位，以空白填充，%s表示输出一个字符串。上面的程序的意思就是逐行输出文件内容，并在每行的第一列前追加行号，行号不足5位时以空白填充，一行结束后，以\n换行。

注意，在%5d和%s之间有一个空字符，如果没有的话，行号就会与第1列挨着，很不好看呀。我们看一下输出结果：

1 1034 7:26

2 1025 7:27

3 1101 7:32

4 1006 7:45

5 1012 7:46

6 1028 7:49

7 1051 7:51

8 1029 7:57

9 1042 7:59

10 1008 8:01

11 1052 8:05

12 1005 8:12

13 1005 8:13

14 1005 8:13

15 1005 8:13

当然，我们也可以将这个空字符换成别的，比如\t:

awk '{printf("%5d\t%s\n", NR, $0)}' arr.dat

输出就成了：

1 1034 7:26

2 1025 7:27

3 1101 7:32

4 1006 7:45

5 1012 7:46

6 1028 7:49

7 1051 7:51

8 1029 7:57

9 1042 7:59

10 1008 8:01

11 1052 8:05

12 1005 8:12

13 1005 8:13

14 1005 8:13

15 1005 8:13

在这个问题的基础上，我们可以有另外一个收获。看一下下面的程序:

awk 'END {print NR}' arr.dat

输出结果如下：

没错，这就是文件的行数，当然，这种统计方法不是linux下最快的，最快的是下面的语句：

wc -l arr.dat

输出结果：

15 arr.dat

但也是一种思路。

第二个问题：如果有两个print会怎么样呢？比如：

awk '{print $1} {print $2}' arr.dat

输出结果：

可以看到第二列放到了第一列之后换行显示。如果在print中将$1和$2之间加一个\n是不是也能起到同样的效果呢？

awk '{print $1,"\n",$2}' arr.dat

看一下输出结果：

会发现，第二列前的空白字符也被输出了，两者还是有所区别。