網絡故障分析
一、網絡應用通路緩慢
故障較長的描述:
(1)同一VLAN的内網主機之間通路速度非常緩慢,如互相PING,網路上的芳鄰拷貝檔案等操作。
(2)不同VLAN間的主機,通路速度非常緩慢。
(3)内網主機可以打開網頁,但速度非常緩慢。
(4)内網主機PING外網域名或DNS伺服器時,傳回時間較大。
(5)網絡中的各種應用出現時斷時續的現象。
(6)内網主機打開網絡中某業務 系統時,響應非常緩慢,甚至出 現假死狀态。
故障原因分類:
(1)網絡丢包
1)網絡裝置丢包
2)網絡擁塞
3)MTU配置不當
4)網絡攻擊
5)負載均衡裝置配置不當
(2)網絡延遲大
1)裝置的延遲
2)傳輸距離延遲
3)貸款延遲
(3)應用響應慢
1)TCP連接配接慢
2)應用交易處理慢
(4)相關應用伺服器響應慢
1)DNS伺服器響應慢
2)資料庫伺服器響應慢
3)其他相關服務慢
故障詳細成因及解決方案:
針對網絡裝置丢包:
利用克萊網絡回溯分析系統采用多端部署的方式,在網絡中關鍵裝置的兩端進行資料包對比,确定該裝置是否丢包,進而準确定位丢包裝置。
推薦解決方案:
1)更新存在問題的裝置配置。
2)更換存在問題的網絡裝置。
針對網絡擁塞:
利用科來網絡回溯分析系統監控關鍵鍊路(一般是出口鍊路)的流量占用情況,檢視網絡使用率是否過高,每秒資料包是否過多,資料包大小分布是否合理、TCP會話是否正常等各項。
1)如果網絡擁塞的原因是P2P、病毒、攻擊等異常流量引起的,需對這些流量進行控制。
2)如果網絡擁塞的原因是網絡帶寬過小,應考慮增加網絡帶寬。
針對MTU配置不當:
利用科來網絡回溯分析系統采集關鍵鍊路資料,檢視傳輸MTU值,再檢視網絡中關鍵裝置的MTU裝置。
設定合适的MTU值。
針對網絡攻擊:
通過科來網絡回溯分析系統監控關鍵鍊路,實時發現網絡中的異常網絡攻擊,根據科來智能診斷,快速判斷網絡中是否存在異常網絡攻擊。
根據智能診斷判斷的位址進行排查,封堵。
針對負載均衡裝置配置不當:
利用科來網絡回溯分析系統通過多端部署方式,監控流量通過負載均衡後被配置設定情況,确定是否是用于負載均衡裝置把資料包配置設定到錯誤的鍊路引起丢包。
合理配置負載均衡政策
針對網絡延遲大:
利用科來網絡回溯分析系統采用多段部署的方式,在網絡中關鍵裝置的兩端進行資料包對比傳輸的TCP資料包延時,分析并定位造成延遲的裝置。
1)更新引發延遲裝置的配置。
2)更換引發延遲的網絡裝置。
針對傳輸距離延遲:
分析TCP連接配接中三次握手資料包的時間間隔,檢視用戶端網絡延遲、服務端網絡延遲,定位延遲位置。
采用多連接配接或其他傳輸層協定,避免網絡延遲給TCP傳輸帶來的影響。
針對帶寬延遲:
通過分析TCP傳輸的性能,确定是否存在帶寬延遲看。通過計算傳輸的資料量和鍊路帶寬容量,來确定帶寬對傳輸延遲的影響。
增加網絡帶寬
針對TCP連接配接慢:
利用科來網絡回溯分析系統捕獲應用通訊資料,通過定義應用直接檢視三次握手延遲,及用戶端、伺服器延遲,快速判斷TCP連接配接較慢是發生在用戶端還是伺服器。
提升網絡傳輸過程中的傳輸性能。
針對應用交易處理慢:
利用科來網絡回溯分析系統捕獲應用通訊資料,通過定義應用直接檢視用戶端請求時間和伺服器響應時間,判斷伺服器是否存在應用交易處理響應慢的現象。
針對DNS伺服器響應慢:
利用科來網絡回溯分析系統捕獲DNS通訊資料,分析DNS請求和響應資料包,檢視是否存在DNS伺服器響應慢的現象。
優化DNS伺服器的軟硬體設定。
針對資料庫伺服器響應慢:
利用科來網絡回溯分析系統捕獲資料庫通訊資料,分析背景資料庫的交易處理請求和響應資料包,檢視是否存在資料庫交易處理慢的現象。
推薦接具體方案:
優化資料庫伺服器的軟硬體配置,優化資料庫操作腳本。
其他相關響應慢:
利用科來網絡回溯分析系統捕獲應用通訊資料,分析其他相關服務的交易處理請求和響應資料包,檢視是否存在交易處理慢的現象。
優化相關服務的軟硬體配置。
二、網絡、應用無法通路
(1)内網主機不能與網際網路的任何應用進行通信,如網頁、郵件、QQ、FTP等都不能使用。
(2)内網主機PING不通DNS伺服器,網站域名。
(3)内網主機可以上QQ,但打不開網頁。
(4)内網主機不能通路網絡某個特定的應用服務。
(1)網絡不可達
1)實體鍊路中斷
2)網絡裝置當機
3)嚴重丢包
4)拒絕服務攻擊
5)路由不可達
6)政策中斷
(2)應用不可達
1)應用當機
2)應用拒絕服務
3)政策中斷
(3)應用無響應
應用故障
(4)相關應用無響應
1)DNS伺服器無響應
2)資料庫伺服器無法連接配接
3)其他相關服務無法連接配接
針對實體鍊路中斷:
通過PING定位斷點,檢視網絡裝置和實體鍊路狀态,确定是否存在鍊路中斷。
恢複鍊路的連通性。
針對網絡裝置當機:
通過PING定位斷點,檢視網絡裝置和實體鍊路狀态,确定是否存在網絡裝置當機。
恢複裝置正常運作。
針對嚴重丢包:
利用科來網絡回溯分析系統監控關鍵鍊路,檢視鍊路中TCP資料流是否存在大量重傳,如果有,則表明網絡中存在大量的丢包情況。通過PING目标主機确定是否存在大量丢包。同時通過分段捕獲分析資料包定位丢包裝置。
1)如果丢包的原因是P2P、病毒、攻擊等異常流量引起的,需對這些流量進行控制。
2)如果丢包的原因是某個裝置丢包,可考慮對其進行重新配置或更換。
針對拒絕服務攻擊:
利用科來網絡回溯分析系統監控關鍵鍊路,通過智能報警系統快速判斷網絡内是否存在拒絕服務攻擊,并迅速定位攻擊源。
定位攻擊源,并對其阻斷。
針對路由不可達:
利用科來網絡回溯分析系統監控關鍵鍊路,分析捕獲到的包中是否存在目的不可達的CMP資料包。通過tracert指令分析不可達的目标位址路由。
更新路由器的路由配置。
針對政策中斷:
利用科來網絡回溯分析系統采用多段部署的方式,在網絡中安全裝置的兩端進行資料包對比,定位中端點,檢視是否是由于防火牆等安全裝置的通路控制政策阻斷了應用通訊。
修正防火牆等裝置上的通路控制政策。