很久的文章了,学习~ |
easthome001 发表于 2017-3-4 08:52 很感谢楼上的回答,我去试试,希望有用 |
首先确定是内部原因还是外部原因。 集群是否暴露在外网。如果外面,首先排除是否为攻击。 比如请求量,端口wait的数量。 如果是内部原因: 看看是否长期这个状态。如果长期这个状态,可以查看下到底是哪个进程的问题。 比如io飙高的时候,到底是哪个进程的原因。 推荐参考这个 排查Linux下进程的IO活动状况的两个案例及方法介绍 可直接查看第二个案例,找到到底是哪个进程的原因 |