Linux 删除文本中的重复行的方法

发布时间：2016-11-21 21:37:58 作者：佚名

这篇文章主要介绍了Linux 删除文本中的重复行的方法,需要的朋友可以参考下

在进行文本处理的时候，我们经常遇到要删除重复行的情况。那怎么解决呢？
下面就是三种常见方法？

第一，用sort+uniq，注意，单纯uniq是不行的。

shell> sort -k2n file | uniq

这里我做了个简单的测试，当file中的重复行不再一起的时候，uniq将服务删除所有的重复行。经过排序后，所有相同的行都在相邻，因此unqi可以正常删除重复行。

第二，用sort+awk命令，注意，单纯awk同样不行，原因同上。

shell> sort -k2n file | awk '{if ($0!=line) print;line=$0}'

当然，自己把管道后面的代码重新设计一下，可能不需要sort命令先排序拉。

第三，用sort+sed命令，同样需要sort命令先排序。

shell> sort -k2n file | sed '$!N; /^.∗\n\1$/!P; D'

最后附一个必须先用sort排序的文本的例子，当然，这个需要用sort排序的原因是很简单，就是后面算法设计的时候的“局部性”，相同的行可能分散出现在不同的区域，一旦有新的相同行出现，那么前面的已经出现的记录就被覆盖了，看了这个例子就好理解拉。
　　
ffffffffffffffffff
ffffffffffffffffff
eeeeeeeeeeeeeeeeeeee
fffffffffffffffffff
eeeeeeeeeeeeeeeeeeee
eeeeeeeeeeeeeeeeeeee
gggggggggggggggggggg

其实，这是我随便打进去的几行字，没想到就是必须用sort的很好例子，大家可以自己试试看。

Tag：重复行文本

Linux上使用Snap包管理命令这份使用指南要收藏
然 Ubuntu 提供了优秀的图形化软件管理工具，我们绝大多数时间并不需要使用命令行来管理 Snap 软件包，但命令行拥有更强的功能和灵活性，学会如何使用可以帮你更好地掌控系
2024-10-18
Flatpak和Snapcraft怎么选? Linux软件包管理系统优缺点对比
Linux 软件的打包和分发方式在过去几年中也取得了长足地进展，本文将探讨 Flatpak 和 Snapcraft 之间的关键差异，它们各自的优/缺点，以期望帮助用户找到更适合自己的一款
2024-10-18
linux服务器重启命令哪个好用? Linux服务器重启命令汇总
在 Linux 系统中，最严谨的重启命令是 shutdown -r now，该命令直接将系统重启，而不进行任何清理或准备工作，确保系统彻底重启，但也有很多其他命令，详细如下文介绍
2024-10-17
教你如何在Linux中使用apt命令? Linux APT命令实战教程
apt是一个软件包管理工具,apt命令相当强大,要是在Ubuntu和Debian系统中使用，可以用来对软件进行安装等操作，需要超级管理员（root）权限进行操作
2024-09-29
apt 和 apt-get有什么区别? Linux包管理解密
为什么 Debian 系 Linux 发行版同时拥有apt和apt-get这两个雷同的命令？他们之间有什么区别？详细请看下文介绍
2024-09-29
已存在10多年! Linux圈曝出灾难级漏洞附缓解方案
Linux圈曝出严重远程代码执行RCE漏洞，已存在10多年，几乎影响所有GNU/Linux发行版，目前尚未有修复补丁，不过可以缓解，解决方案如下
2024-09-27
linux怎么删除分区? Linux系统删除分区的教程
在Linux系统中，分区管理是非常重要的一项工作，在使用Linux系统的过程中，有时候我们需要删除某个分区来释放存储空间或重新规划硬盘空间，那么，如何在Linux系统上删除分
2024-09-14
深度操作系统deepin 25开发计划公布: 2025 年 01 月发布
deepin 25 计划发布时间为 2025 年01 月，此版本的主要目标是修复 deepin 23 中的遗留问题，提升系统稳定性
2024-09-14
Linux下使用fdisk命令进行磁盘分区(图文详解)
FDISK是一个用于硬盘分区的工具，特别是在较早的操作系统版本中，如Windows 98和早期的Linux系统中，FDISK是进行硬盘分区的主要工具，这里就为大家分享一下linux系统中使用
2024-08-29
黑神话悟空怎么下载安装? 深度操作系统deepin23黑神话悟空安装教程
deepin23系统想要体验《黑神话：悟空》游戏，该怎么下载安装呢？下面我们就来看看详细的图文教程
2024-08-22

Linux 删除文本中的重复行的方法

相关文章

最新评论

文章分类

大家感兴趣的内容

最近更新的内容