2024高峰期服务器机器故障导致的问题
(2024-04-08 20:53:50)分类: LINUX(12/26) |
症状: 各个服务器负载不是很大,nginx直接报no alive upstream错,有时候1-2分钟又自动恢复
通过 nginx -s reload立马又好了,一天出现好多次,很是崩溃
报错的时候,通过web服务器 ping redis服务器 发现局域网的时间多的有40-50ms
找机房说服务器正常,没发现异常,
后来机房说有个WEB服务器的宿主机压力较大,换了一个宿主机,观察了半天正常了
修改nginx配置无用,已经改回去了
机房判断还是nfs问题,修改挂载记录 /etc/rc.d/rc.local
mount -t nfs -o nfsvers=3,nolock 192.168.1.134:/home/pdf/3 /home/pdf/3
增加了 -t nfs -o nfsvers=3,nolock
输入mount 能看到挂载nfs版本(vers=4),版本4有问题,只能用版本3
通过 nginx -s reload立马又好了,一天出现好多次,很是崩溃
报错的时候,通过web服务器 ping redis服务器 发现局域网的时间多的有40-50ms
找机房说服务器正常,没发现异常,
后来机房说有个WEB服务器的宿主机压力较大,换了一个宿主机,观察了半天正常了
机房判断还是nfs问题,修改挂载记录 /etc/rc.d/rc.local
mount -t nfs -o nfsvers=3,nolock 192.168.1.134:/home/pdf/3 /home/pdf/3
增加了 -t nfs -o nfsvers=3,nolock
输入mount 能看到挂载nfs版本(vers=4),版本4有问题,只能用版本3
发现不是上面问题
调试: 把执行程序的公用执行文件init.php最上面记录个时间,init.php截止地方计算执行时间,如果超过1秒,记录到表里面,再根据每行执行时间,判断出了是偶尔连接数据库很慢导致的
偶尔很慢因为并发很高,会导致nginx直接崩溃,后面发现是50.65服务器的MYSQL数据库偶尔连接不上导致的
调试: 把执行程序的公用执行文件init.php最上面记录个时间,init.php截止地方计算执行时间,如果超过1秒,记录到表里面,再根据每行执行时间,判断出了是偶尔连接数据库很慢导致的
偶尔很慢因为并发很高,会导致nginx直接崩溃,后面发现是50.65服务器的MYSQL数据库偶尔连接不上导致的