shell中删除文件中重复行的方法

更新时间：2014年03月13日 15:02:45 作者：

这篇文章主要介绍了shell中删除文件中重复行的方法,需要的朋友可以参考下

Linux下文本处理工具很丰富很强大，例如这样一个文件：

cat log 
www.jb51.net 192.168.1.1
www.jb51.net 192.168.1.1
www.jb51.net 192.168.1.2
ffffffffffffffffff
ffffffffffffffffff
eeeeeeeeeeeeeeeeeeee
fffffffffffffffffff
eeeeeeeeeeeeeeeeeeee
eeeeeeeeeeeeeeeeeeee
gggggggggggggggggggg

可用以下方法去除重复行：

1.使用uniq/sort删除重复行
注意：单纯uniq是不行的。

复制代码代码如下:

shell> sort -k2n file | uniq > a.out

这里我做了个简单的测试，当file中的重复行不再一起的时候，uniq没法删除所有的重复行。经过排序后，所有相同的行都在相邻，因此unqi可以正常删除重复行。

2.使用用sort+awk命令
注意：单纯awk同样不行，原因同上。

复制代码代码如下:

shell> sort -k2n file | awk '{if ($0!=line) print;line=$0}'

也可以使用 awk '!i[$1]++' log;

3.用sort+sed命令，同样需要sort命令先排序。

复制代码代码如下:

shell> sort -k2n file | sed '$!N; /^$.*$\n\1$/!P; D'

您可能感兴趣的文章:

linux shell在while中用read从键盘输入的实现
下面小编就为大家带来一篇linux shell在while中用read从键盘输入的实现。小编觉得挺不错的，现在就分享给大家，也给大家做个参考。一起跟随小编过来看看吧
2017-01-01
Linux启动jar包的shell脚本
这篇文章主要介绍了Linux启动jar包的shell脚本,非常不错，具有参考借鉴价值,需要的朋友可以参考下
2018-05-05
shell编程基础知识小结
这篇文章主要介绍了shell编程基础知识，包括文件类型、正则表达式、字符类、引号类型、变量设置、条件测试、命令执行顺序、脚本调试方面的介绍
2013-02-02
shell中使用echo打印彩色字体和彩色背景的方法
这篇文章主要介绍了shell中使用echo打印彩色字体和彩色背景的方法,本文方法比较好玩,需要的朋友可以参考下
2014-12-12
hive-shell批量命令执行脚本的实现方法
今天小编就为大家分享一篇hive-shell批量命令执行脚本的实现方法，具有很好的参考价值，希望对大家有所帮助。一起跟随小编过来看看吧
2018-06-06
一个ping检测告警函数代码
一个ping脚本，服务器通用告警函数。在没有 nagios 的情况下，这个暂且可以用来作为服务器告警使用
2013-02-02
Shell脚本case语句简明教程
这篇文章主要介绍了Shell脚本case语句简明教程,非常容易看懂的一篇文章,需要的朋友可以参考下
2014-07-07
如何写出安全的、基本功能完善的Bash脚本
这篇文章主要介绍了如何写出安全的、基本功能完善的Bash脚本，帮助大家更好的理解和使用bash shell，感兴趣的朋友可以了解下
2020-12-12
shell递归输出文件名和目录名的方法
今天小编就为大家分享一篇shell递归输出文件名和目录名的方法，具有很好的参考价值，希望对大家有所帮助。一起跟随小编过来看看吧
2018-06-06
查看linux中某个端口(port)是否被占用的方法
下面小编就为大家带来一篇查看linux中某个端口(port)是否被占用的方法。小编觉得挺不错的，现在就分享给大家，也给大家做个参考。一起跟随小编过来看看吧
2017-05-05