实用技巧 防止系统进程意外被杀的方法


Linux的内存管理有一套机制:当系统内存溢出的时候,它会选择一个或几个适当的进程杀掉以维持系统的稳定运行。不过机器毕竟是机器,虽然它竭尽全力去选择那些真正是罪魁祸首的进程,由于这时选择哪几个进程的来杀掉的决定很难完全准确,有时难免会出错,或者是不公平,到头来系统还是因为误杀而变得残缺不全,甚至不能正常运行。这个时候可能就需要:人为地干预、引导系统做出正确的选择。

这种行为的控制是通过调整进程相应目录下的/proc/[PID]/oom_adj来实现的,其中oom_adj的取值返回是-17~15,当进程的oom_adj是-17时,系统将不会杀死它,-16到15使得进程的/proc/[PID]/oom_score值呈指数K * 2 ^ n)形式递增,也就是说他们被杀的可能性呈指数形式递增。另外,开天辟地的第一个进程进程号为1)init也不在被杀之列,无论它的oom_adj值为多少。原来只有系统资源管理权限CAP_SYS_RESOURCE)的进程才能做oom_adj值的调整,现在如果是把进程的被杀可能性提高则不需要什么特殊权限,我们也确实不应剥夺它自杀或者是它的拥有者有意把它推上悬崖的权利。

禁止进程被杀的具体操作为:

root@gentux xiaosuo # pgrep dbus-daemon
4595
6664
root@gentux xiaosuo # cat /proc/4595/oom_score
559
root@gentux xiaosuo # echo -17 > /proc/4595/oom_adj
root@gentux xiaosuo # cat /proc/4595/oom_score
0
注意:这个技巧是比较危险的,除非你能100%肯定你禁止被杀的进程没有问题,不然不要尝试做愚蠢的设定,否则后果自负。

相关文章】

  • 监控和保护Linux系统下进程安全
  • 基于linux的集群系统第5季 关键技术分析之 进程的放置和迁移
  • 从菜鸟到高手必读:全面了解系统进程

相关内容