一次生产环境502 Gateway Time-out经历


把阿里云服务器ECS和数据库RDS转移到专有网络,挑了今天早上这个节点,然后宕机了,报了一连串错误,逐个处理。
先是配置服务器的安全组和白名单
然后ping和telnet确定了网络状态和端口状态
然后nginx的负载均衡转发的内网ip替换vim的配置信息

:%s/fromstr/tostr/g

接着,报了502错误一脸懵逼,九点钟前开始搞,说早上十点搞完,然后9点出头就剩下这个502错误了,一直在操作,搞一个小时。
一般来说502错误都是网关连接数问题居多,阴差阳错使用重启php-fpm解决了问题(重启reboot后fpm没有跑起来)。

# /etc/init.d/php-fpm restart

重启php-fpm后,引发新的问题:

nginx: [error] open() "/usr/local/nginx/nginx.pid" failed (2: No such file or directory)

啥时候nginx.pid又为空或者消失了,茫然啊茫然,然后编译c重新载入:

# /usr/local/nginx/sbin/nginx -c /usr/local/nginx/conf/nginx.conf

生产环境的nginx: [error] open() "/usr/local/nginx/nginx.pid" failed (2: No such file or directory)是:

# /usr/local/nginx/sbin/nginx -c /usr/local/nginx/nginx.conf

问题解决,还好还好。

最后,发现https的SSL证书错误,更加一脸懵逼,然后重启就没问题了。

拓展monkey的重载:# /usr/sbin/nginx -c /etc/nginx/nginx.conf(其实根据whereis nginx就可以找到咯)


原文链接:https://blog.yongit.com/note/164783.html