一個暫時的好方法
比如mysql故障,結合後端應用檢視,看對應跑的是什麼應用,這很重要。關注業務上去了。
好多東西多需要深入,成為系統性,有思想性的解決方案
故障總結
目錄
1.故障分類
2.故障分類的發生的機率
3.跟蹤系統調用,接口調用,要求最全的日志
4.針對以上要求,監控出報告
5.解決故障的方法
上代碼->監控
5.1測試
dubbo測試,調用測試,循環調用測試
比如幾十個接口,跳過接口測試,或者按比例測試
5.2開發
安全調用接口
5.3運維
監控報警沒到位,監控不全
1.比如各系統之間的調用
2.比如監控明細和一定程度的報警
尤其是mysql監控,不僅要監控性能,更重要的是一些參數比如連接配接數和鎖表數,mysql表大小
5.4是否早有迹象
具體待補充。
1.資料庫故障
本文轉自 liqius 51CTO部落格,原文連結:http://blog.51cto.com/szgb17/1889675,如需轉載請自行聯系原作者