在Linux里,在/etc/security/limits.conf里有一个参数是nofile,作用是控制某用户的文件打开数量。可以使用ulimit -n的命令查看具体的限制,一但当前文件打开数达到nofile上限就无法再打开文件,从而使某些应用运行异常,如用户无法通过SSH登录系统。
通过我们可以使用lsof命令查看文件打开的具体情况,如用户、进程的信息。使用
lsof -p PID
可以查看某一个进程的文件打开数量
lsof -u UID
可以查看某一个用户的文件打开数量
但是发现好像没有一个参数可以知道所有进程的文件打开数量
所以我就写了个小脚本来统计一下所有进程的文件打开数量,从而可以得知到底是哪个进程出现问题,再作进一步的处理,脚本的具体内容如下
#!/bin/bash # psof.sh # Author: # # ####### # # ####### # # # ## # # # # # # # # # ### ##### # # # # # # # # # # # # # # # ## # # # ####### # # # # DATE: 2016-10-09 # DESCRIPTION: 计算每个进程的Openfiles tmpfile=/dev/shm/psof.txt echo "" > $tmpfile for pid in $(ps -eo pid | grep -v PID) do echo $pid":"$(lsof -p $pid|wc -l) >> $tmpfile ; done echo "PID : Openfiles" sort -nrk 2 -t: $tmpfile 同样,可以稍作修改用于统计所有用户的文件打开数量抛砖引玉,以供参考
