阿里云服务器CPU和网络异常抖动问题排查
admin 2019-12-16 16:00:15 600人已围观
最近几天发现有一台阿里云服务器老是在晚上出现告警,一般都是CPU高于阀值,所以就检查一下日志排查一下问题,在排查过程中发现一些有意思的情况,比如CPU和网络使用是有规律的抖动:
看到这种图像第一感觉应该是有定时任务在执行,先用top命令看了一下没有发现特殊情况,crontab文件也没有记录,再使用tail -f /var/log/cron查看定时器执行日志的内容:
Jan 2 13:20:01 izt4n1nz CROND[4921]: (root) CMD (/usr/lib64/sa/sa1 1 1)
Jan 2 13:30:01 izt4n1nz CROND[7179]: (root) CMD (/usr/lib64/sa/sa1 1 1)
Jan 2 13:40:01 izt4n1nz CROND[9434]: (root) CMD (/usr/lib64/sa/sa1 1 1)
Jan 2 13:50:01 izt4n1nz CROND[11633]: (root) CMD (/usr/lib64/sa/sa1 1 1)
Jan 2 14:00:01 izt4n1nz CROND[13912]: (root) CMD (/usr/lib64/sa/sa1 1 1)
Jan 2 14:01:01 izt4n1nz CROND[14145]: (root) CMD (run-parts /etc/cron.hourly)
Jan 2 14:01:01 izt4n1nz run-parts(/etc/cron.hourly)[14145]: starting 0anacron
Jan 2 14:01:01 izt4n1nz run-parts(/etc/cron.hourly)[14155]: finished 0anacron
Jan 2 14:01:48 izt4n1nz crontab[14326]: (root) LIST (root)
Jan 2 14:04:01 izt4n1nz crond[646]: (*system*) RELOAD (/etc/crontab)
Jan 2 14:10:01 izt4n1nz CROND[16199]: (root) CMD (/usr/lib64/sa/sa1 1 1)
特地核实了一下:其中(root) CMD (/usr/lib64/sa/sa1 1 1) Linux Sysstat定时执行记录,Linux Sysstat是linux系统免费提供用于收集主机性能的一个软件包。
其中的(root) LIST (root)还不知道他的意思.
其中的0anacron的作用是更新crontab job的执行时间,这个必须要留着。它在名称的前面加上0,以保证这个程序会在其他程序前执行。并且这个被run-parts自动调用。
接住找,发现数据库占用CPU也有点高,通过show processlist找到耗时最长的SQL,kill掉时间很长的,观察一下CPU是否有变化:
从多次执行kill后发现CPU监控图还是有点变化的,但是问题是后面又会反弹。所以mysql优化这里还是有一定的空间可以执行,下篇记录mysql优化的过程。
分享到:
编辑发布时间:2019-12-16 16:00:15