一、應用故障
HTTP 502 故障
502 Bad Gateway
故障檢測:
首先定位到前端故障服務器節點,在前端服務器(Telnet)上訪問后端服務端口響應時間。如發現響應時間超時>10s。說明后端應用程序出現故障。需要到后端服務器查看,并查明情況。
PS:HTTP 502 Bad Gateway 故障一般分為以下2種情況:
網絡問題:前端無法連接后端服務,網絡100%丟包
后端服務問題:后端服務進程宕掉。如nginx,php進程掛掉。
HTTP 503
503 Service Temporarily Unavailable
故障檢測:
首先定位到前端故障服務器節點,在前端服務器上ping后端服務器查看網絡延遲丟包情況,后端服務端口響應時間。如發現延遲>100ms,丟包>5%。說明前端到后端網絡出現問題。
PS:HTTP 503 Service Temporarily Unavailable 故障一般是前端訪問后端網絡延遲導致。首選排查是不是后端流量過載導致。如果不是,就是前端到后端網絡問題。
HTTP 504
504 Gateway Time-out
故障檢測:
查看后端服務器Nginx php mysql資源占用情況,并查看相關錯誤日志。
PS:此類故障幾率比較小HTTP 504 Gateway Time-out 故障一般是因的后端服務器響應超時。如PHP程序執行時間太長,數據庫查詢超時。與程序溝通是否需要增加PHP 執行超時時間。
二、攻擊故障
DDOS攻擊
故障檢測:
查看監控網卡流量,網絡延遲/丟包,數據包個數/s
#iptraf -d eth0 查看網絡流量和數據包/s,發現進來的流量和數據包個數非常大,出去的流量和數據包非常小。如下圖:
PS:DDOS攻擊故障,一般是進來的流量比較大,出去的流量小。網絡數據包接收包個數比較大,發送數據包比較小,網絡延遲高,并且有丟包現象。
CC攻擊故障
故障檢測: 查看監控網卡流量,Nginx 連接狀態,CPU 負載
PS:CC攻擊故障,一般是出去的流量比較大,進來的流量小。Nginx連接數猛增。
原文:https://www.chinasa.net/archives/300.html
原創文章,作者:wubin,如若轉載,請注明出處:http://www.www58058.com/17387