linux运维实战案例之Argument list too long错误与解决方法
1、错误现象
这是一台Mysql数据库服务器,在系统中运行了很多定时任务,今天通过crontab命令又添加了一个计划任务,退出时发生了如下报错:
#crontab -e
编辑完成后,保存退出,就出现下面如下图所示错误:
2、解决思路
根据上面报错的提示信息,基本判定是磁盘空间满了,那么首先从检查服务器的磁盘空间开始,根据报错提示应首先检查/tmp磁盘空间,然后应该是根分区的磁盘空间,最好是系统其它分区的磁盘空间。
3、问题排查
通过df命令查看了这个服务器上所有磁盘分区的情况,/tmp分区空间还有很多,根分区也还有很大剩余空间,都不存在问题,最后发现是/var磁盘分区空间使用已经100%了,到这里已经定位了问题,是/var磁盘空间爆满导致的,因为crontab会在保存时写文件信息到/var目录下,由于这个磁盘没有空间了,报错也是理所当然了。
4、解决问题
接着通过“du -sh”命令检查/var目录下所有文件或目录的大小,发现/var/spool/clientmqueue目录占用了/var整个分区大小的90%,那么/var/spool/clientmqueue目录下的文件都是怎么产生的呢,是否能删除?下面简单介绍下/var/spool/clientmqueue目录的文件是怎么生成的。
可以打开/var/spool/clientmqueue目录下的一些文件看看,都是一些邮件信息,邮件内容大多是关于Cron Daemon的,其实/var/spool/clientmqueue就是一个邮件暂存的目录,linux服务器在默认情况下会发一些邮件,比如当cron执行的程序有输出内容时,就会发送邮件信息到执行cron进程的用户,系统在发送邮件时,首先会把邮件拷贝到/var/spool/clientmqueue目录下,然后等待MTA程序(mail transfer agent)来处理,而MTA主要的功能是把这个目录中的邮件转移到/var/spool/mqueue目录下,然后再通过sendmail服务发送到真正的目的地。于是检查了这个服务器的sendmail服务,发现没有开启,这样/var/spool/clientmqueue目录非常大的原因就找到了:没有发送邮件的客户端服务,所有邮件就都堆积在这个目录下了。
在确认完这些内容都没用后,切换到/var/spool/clientmqueue目录下,执行rm命令删除所有的文件时,出现了错误:
[root@localhost clientmqueue]# rm * /bin/rm: argument list too long
此时出现了本文开头我们谈到的问题。
当Linux下试图传递太多参数给一个系统命令时,就会出现”Argument list too long”错误。这个是Linux系统一直以来都有的限制。查看这个限制可以通过命令“getconf ARG_MAX”来实现,如下图所示:
这是Centos6版本的一个最大值,而在Centos5.x中,这个值相对较小,如下图所示:
所以这个问题更多时候是发生在linux低版本中。
知道了产生问题的原因,解决方法就很多了,这里提供四种解决此问题的方法,分别介绍如下:
(1)手动把命令行参数分成较小的部分
例如:
rm [a-n]* -rf rm [o-z]* -rf
这种方法里最简单的,但是相对较弱智,因为必须要知道怎么平均分割文件,同时对于文件数目极多的情况,需要输入很多遍命令。
(2)使用find命令删除
基本原理是通过find命令筛选文件列表,把符合要求的文件传递给一系列命令。这种方法是最简洁的,也就最有效的。
例如:
find /var/spool/clientmqueue -type f -print -exec rm -f {} \;
但是这种方法也有缺点:就是需要遍历所有文件,因而在文件数量极多时比较耗时。
(3) 通过shell脚本
这种方法是通过编写一个shell脚本,然后通过循序语句实现,与find方法类似。
例如,可以编写如下脚本:
#!/bin/bash # 设定需要删除的文件夹 RM_DIR='/var/spool/clientmqueue' cd $RM_DIR for I in `ls` do rm -f $I done
(4)重新编译Linux内核
这种方法需要手动增加内核中分配给命令行参数的页数,打开kernel source下面的include/linux/binfmts.h文件,找到如下行:
# define MAX_ARG_PAGES 32
将”32“改为更大的值,例如64或128,然后重新编译内核。
此种方法永久有效,可以彻底解决问题,但是比较复杂,推荐给高级用户使用,没有Linux经验的用户不建议用这种方法。
相关文章
- 今天小编要为大家带来的是Linux主流架构运维工作简单剖析讲解;希望对大家会有帮助。有需要的朋友一起去看看吧2017-03-30
- 整理一套入门的运维常用命令,希望喜欢Linux的朋友们更快的熟悉并掌握Linux运维,这里没有太多理论,有的只是干货,这里我会把网上看到的、自己平时用到的、和感兴趣的都整2017-01-22
- 一些朋友还不知道生产场景如何对linux系统进行分区?今天小编为大家带来的是运维老鸟谈生产场景对linux系统进行分区的方法;有需要的朋友可以过来看看2016-12-14
- 这篇文章主要介绍了Linux下的自动化运维工具ansible,这个软件一般被用于集群批量部署,需要的朋友可以参考下2015-10-12
- 这篇文章主要介绍了Linux运维工程师入门必备的10个技术点,本文是运维工程师的心得总结,还有一些对学习Linux系统的建议,需要的朋友可以参考下2015-06-15
- 这篇文章主要介绍了整理的一些Linux运维工程师面试题,本文整理了Linux操作系统知识、Linux命令及文件操作、Linux磁盘及软件管理操作、Linux服务配置及管理4大类面试题,需要2015-05-18
- 这篇文章主要为大家介绍了linux中运维自动化之Cobbler系统安装使用,Cobbler是一个快速网络安装linux的服务,而且在经过调整也可以支持网络安装windows。使用 Cobbler,您2014-10-09
LINUX运维实战案例之文件已删除但空间不释放问题的分析与解决办法
这篇文章主要为大家介绍了由于Linux没有回收站功能,我们的线上服务器所有要删除的文件都会首先移动到系统/tmp目录下,然后定期清除/tmp目录下的数据,但是出现文件已删除2014-09-28- 这篇文章主要为大家介绍了LINUX系统的文件系统的权限修改与安全设置,系统运维人员有时候可能会遇到通过root用户都不能修改或者删除某个文件的情况,产生这种情况的大部分2014-09-28
- 这篇文章主要介绍了谈谈Linux运维人员是否需要掌握一门编程语言,小编觉得还是挺不错的,具有一定借鉴价值,需要的朋友可以参考下,下面就来和我一起看看吧,希望大家在阅2018-01-24
最新评论