在登录系统后最初60秒内通常会进行的操作,要运行的命令是:
1、uptime
uptime命令可以快速查看系统平均负载,负载高的话通常是因为网络或硬盘I/O导致的,另外一个重要的指标是1、5、15分钟内的负载情况,如果高负载同时出现在1和15钟指标上,可能意外着已经错过了问题发生的现场。
2、dmesg | tail
这条命令会打印出系统日志的最后10条,系统故障往往会有系统日志,所以系统日志是不能放过的点。
3、vmstat 1
vmstat命令可以查看cpu时间是花在系统态还是用户态,这将会指引我们下一步的排查思路。
4、mpstat -p ALL 1
mpstat命令会将每个cpu分解到各个状态下的时间打印出来,例如CPU1的用户态占比高达100%,通常是单个线程遇到瓶颈的特征。
5、pidstat 1
pidstat命令按每个进程展示CPU的使用情况
6、iostat -xz 1
iostat命令展示了存储设备的各个指标,如果怀疑是硬盘性能瓶颈,那就试下这个命令吧。
7、free -m
嗯,内存指标,机会玩过Linux的人都会用了吧。
8、sar -n DEV 1
sar命令打印网络设备指标,通过接口吞吐率rxkB/s和txkB/s来检查是否有指标达到了上限。
9、sar -n TCP,ETCP 1
sar命令还可以查看TCP指标和TCP错误信息
10、top
最后我们用top命令结束,对相关结果进行二次确认。
运气好的话这60秒分析过程会帮助你找到一些性能问题的线索。
来源:https://mp.weixin.qq.com/s/x4ZXinkPqRXuPgPMd2WiJg