目前網絡迅速發展,并承載了許多重要的商業應用和服務,同時網絡使用者也越來越多。在這種網絡環境下,網絡工程師除了要完成諸如将裝置添加至網絡的簡單任務外,更多時候他們還需要去即時處理和解決一些複雜的網絡問題,以保證網絡正常快速地運作。
本文讨論了技術人員經常可能遇到的十個網絡問題,并介紹了它們的現象、原因和解決辦法。
問題 1 – 端口無法連接配接網絡
現象:将電腦、電話、無線接入點或列印機插入牆壁上的網絡插孔,而網絡連接配接不正常。交換機端口的連接配接訓示燈和網卡的連接配接訓示燈都不亮。
原因:若沒有修複牆壁插孔上的網絡連接配接,則時常會發生掉線或無法連接配接的問題。在許多企業中,隻有那些經常使用的連接配接才被修複。當移動了辦公室或會議室後,有時會發現那些不常使用的網絡插孔并沒有被測試過,或是那些無法連接配接的插孔可能是由于登記錯誤導緻的。此外,交換機端口可能被強制關閉。
解決辦法:檢查和确認交換機端口是否已被激活,且網絡連接配接已被修複過。當任何裝置被移動到辦公室時,請務必對新的網絡連接配接進行測試,確定他們能夠正常工作。就IP電話而言,也有可能是電話的電源供應不足。
問題 2 – 無法擷取到 IP位址
現象:網絡癱瘓或出現故障而不能正常運作。作業系統可能會提示用戶端目前無法從DHCP伺服器擷取到IP位址。檢查網卡的狀态後,發現沒有配置設定IP位址。
原因:沒有收到來自DHCP伺服器配置設定的IP位址。DHCP伺服器的IP位址耗盡、伺服器的服務癱瘓了、終端裝置可能被配置為使用靜态IP位址而不是通過DHCP配置設定、終端裝置的DHCP請求從來沒有到達伺服器端,這些都可能導緻用戶端無法擷取到IP位址。
尤其是如果一個新的裝置配置一個虛拟區域網路(VLAN),沒有建立與伺服器的服務請求連接配接時,裝置肯定不能擷取到IP位址。即将一個新裝置配置到一個VLAN時,若沒有将DHCP請求中繼到DHCP伺服器,就會導緻請求不能發送到DHCP伺服器端。
解決辦法:關鍵問題是多少使用者出現了同樣的問題,一個使用者還是多個使用者?如果隻有一個使用者受到影響,那麼請确認該用戶端的網絡設定是否配置為使用動态主機配置協定(DHCP)。
下一步,檢查交換機的端口被劃分到哪個VLAN,檢查屬于該VLAN的其他裝置能否擷取到IP位址。如果他們也不能擷取到IP位址,問題原因可能是路由器沒有将DHCP請求轉發到DHCP伺服器。如果多個子網内的許多裝置都出現了這個問題,那麼可能是DHCP伺服器出現了問題,即伺服器的DHCP服務可能沒有運作,或者它的IP位址已經耗盡。
問題 3 – 無法連接配接到應用伺服器
現象:當使用者試圖打開一個應用程式時,系統可能會提示無法連接配接到該應用程式伺服器。當使用電子郵件應用或客戶關系管理(CRM)應用時可能會出現這種問題。反映到服務台的常見投訴是網絡癱瘓了,而這可能并不是真正的原因。
原因:許多原因都可能導緻用戶端無法連接配接到應用伺服器。關鍵是需要詢問使用者這個問題是經常發生,還是斷斷續續發生?如果使用者終端已擷取了一個正确的IP位址,那麼可能是使用者和伺服器間的路由有問題。這種情況下,可以通過一個簡單的ping測試來驗證。如果連接配接時斷時續,則可能是由于伺服器太繁忙,而不能及時響應用戶端的請求所導緻的。
解決辦法:如果使用ping測試後發現路由沒有問題,那麼請檢查伺服器的負載和資源。檢查伺服器是否正忙于執行一個諸如備份的任務?如果不是這樣的話,請檢查用戶端和伺服器之間的網絡負荷,且側重關注廣域網連接配接(如果有的話)。
通常,用戶端和伺服器之間的網絡使用率過高也可能導緻用戶端能連接配接到應用伺服器。最好的辦法是使用一個SNMP工具來監測這些鍊路上的網絡使用率。另外,尋找所有交換機和路由器上的以太網錯誤,這些錯誤可能導緻用戶端與伺服器間的資料包丢失。
問題 4 –VLAN配置錯誤
現象:當在網絡上建立諸如無線寬帶或IP電話的新服務時,通常要用VLAN來隔離其與其他使用者間的流量。這就要求對承載這些服務的交換機端口配置正确的VLAN.如果VLAN配置不正确,那麼這個服務可能無法正常運作。IP電話如果沒有經來電管理裝置注冊授權過,那麼連接配接到該電話的個人電腦可能就無法連接配接到關鍵伺服器,或者無線使用者可能沒有擷取到适于該無線環境的正确IP位址。
原因:沒有對承載這些服務連接配接的交換機進行正确配置。也許在公司内部并沒有溝通好配置哪些端口來支援新服務。
解決辦法:通過測試,驗證該端口支援哪些VLAN.若條件允許,使用一個VLAN标簽生成特定VLAN的業務,檢查這個端口上是否配置了VLAN.通過檢查DHCP伺服器提供的IP位址,來确定VLAN配置在了哪些端口上。另外,檢查交換機的配置來驗證VLAN配置。
問題 5 – 雙工方式不比對
現象:網絡能夠連接配接,而雙工方式不比對,會導緻網絡性能很差。這種情況下,交換機和網卡的鍊路訓示燈都是亮着的。而網絡性能卻受到很大的影響,吞吐量會下降到100Kbps或者更低水準。
原因:網絡連接配接的一側裝置工作在全雙工(能夠同時發送和接收資料)模式下,而另一側的裝置工作在半雙工(在同一時刻隻能執行發送或接收)模式。全雙工側的裝置不需要等待即可不斷發送資料,不論對方能否收到資料它都會發送。
半雙工側裝置在發送前必須等待,直到它不接收資料才能開始發送。這意味着全雙工側裝置有可能會中斷半雙工方的資料傳輸,造成半雙工側中止傳輸。如果傳輸被中止,将需要重傳這個資料幀。這将大大減少半雙工側裝置所能使用的帶寬。
解決辦法:一般情況下,若網絡兩側裝置的雙工方式不互相比對,采取的常用辦法就是把網絡連接配接的一側裝置(通常是交換機)強制配置為全雙工,而讓另一側裝置(例如個人電腦)配置為自适應網絡鍊路狀态。
理想的情況是:自适應功能能夠确認對方的全雙工設定,并與這個鍊路設定相比對。然而事實卻未必如此。被強制設定為全雙工模式的裝置不再發送正确的信号。而網絡另一側的裝置恰恰需要這些信号來确定鍊路的速度和雙工方式,以及自适應對方鍊路設定。
是以,在這種情況下,需要自适應鍊路的裝置不得不去猜測鍊路的雙工方式。在不能确認雙工方式的情況下,自适應功能将預設鍊路狀态為半雙工方式。這就是大多情況下,網絡發生雙工方式不比對的主要原因。為了解決這個問題,需要将網絡上所有的連接配接都設定為自适應——除非你确實有别的原因。 在這些事件中,如交換機間的連接配接,一定要将兩側裝置設定為全雙工。
問題 6 – 應用性能緩慢
現象: 應用程式運作緩慢。它可能在某一界面上當機或在通路資料時停止運作。通常情況下,網絡鍊路狀态不佳是造成這些問題的主要原因。
原因: 确定網絡應用程式的性能問題可以幫助伺服器維護人員定位問題源。許多問題都可能導緻應用程式運作緩慢。其中最常見的原因是在伺服器在生産時間進行備份操作,資料庫伺服器的響應緩慢,以及網絡中丢包情況較嚴重。對于一位網絡技術員來說,最重要的事情就是首先确定是伺服器還是網絡造成了響應速度緩慢。
要确定這一點,可以從一個用戶端捕獲流量。尋找用戶端和伺服器之間的任何重傳資料包。如果存在重傳現象,則表示網絡傳輸過程中有資料包丢失,這會嚴重影響應用程式的性能。如果用戶端和伺服器之間不存在任何重傳,問題可能出在伺服器上,這種情況下可以嚴格監測伺服器。
解決辦法: 在追蹤一個故障時,雖然資料包分析儀的使用比較困難,他們往往都配有簡單計數器,可以顯示TCP重傳。使用該計數器可以幫助我們确定用戶端和伺服器之間的網絡是否存在資料包丢失的現象。
查找用戶端和伺服器之間的任何交換機和路由器的以太網錯誤(幀檢測序列錯誤,校準錯誤或碰撞),這些錯誤都能引起丢包現象。如果沒有錯誤,則觀察廣域網上是否有因鍊路使用率過高而導緻的丢包現象。
問題 7 – 列印故障
現象:有時候也會出現列印故障。列印機也許沒有問題,而發送到列印機上的任務可能不能正常執行。
原因: 首先需要确定是否隻有一位使用者遇到了這個問題,還是幾位使用者都遇到了同樣的問題。如果隻有一位使用者遇到了,那麼可能是他的電腦沒有正确連接配接到列印伺服器。如果不是這個原因,則可能是用戶端與列印機間的網絡連接配接有故障。資料包丢失可能會導緻列印問題,列印機上的網絡連接配接故障也可能會引起列印問題。
解決辦法: 檢查列印機的配置,確定它有一個正确的IP位址,并且可以連接配接到列印伺服器(如果列印伺服器和列印機是分離開的)。有時,更新列印機驅動程式也能夠解決列印問題。總體來說,需要確定列印機是網絡可達的,以及所有列印機驅動程式是最新的。
問題 8 –電纜故障
現象: 客戶的電腦終端能夠連接配接到網絡,網絡性能卻很差。電腦終端可能根本無法連接配接網絡。
原因: 在當今網絡,千兆鍊路連接配接到桌面系統是常見的。千兆鍊路需要四對電纜,是以任何性能低于5類線的電纜都不能支撐千兆連接配接。對于比較老舊的建築物,必須考慮到這個問題。另外,任何數量的電纜如果退撚(通常靠近RJ- 45端口或接線闆)可能會導緻信号的損失。這将導緻交換機端口或網卡出現幀檢測序列錯誤(FCS)。
解決辦法: 當出現由于電纜問題造成的網絡故障時,大多數情況下,都需要更換電纜。如果是由于電纜無撚導緻的,那麼重新加撚電纜一般能夠解決這個問題。當需要承載如千兆鍊路或以太網供電的新技術時,必須使用5類電纜或者更好的電纜。
問題 9 – DNS 故障
現象: 使用者不能通路網際網路或關鍵應用。可能是網絡癱瘓了。
原因: 問題可能歸咎于域名服務(DNS)故障。用戶端無法根據伺服器的IP位址解析出伺服器的名稱,是以發送不了連接配接請求。在用戶端配置了錯誤的DNS伺服器通常會導緻這個問題,用戶端發送的DNS請求不屬于伺服器的資料庫,或者網絡中會有資料包丢失。DNS是一個基于UDP的協定,是以丢失的資料包也不會重傳,是以會導緻DNS故障。
解決辦法:檢查用戶端的配置和設定的DNS伺服器。如果伺服器配置錯誤,則在用戶端上更改所設定的伺服器,或在提供域名服務的伺服器上調整配置。
多次重複測試DNS伺服器與用戶端間的連接配接,确認之間是否有因資料包丢失而導緻響應時延的情況。如果有資料包丢失,請檢查用戶端和伺服器間的以太網錯誤。捕獲失敗的DNS請求,确認是否有來自伺服器的DNS響應。最好是能夠啟動一個工具,該工具能夠不斷測試DNS伺服器,并在有問題時産生告警。
問題 10 –用戶端不能連接配接無線網絡
症狀: 用戶端能夠檢測到無線接入點,但是不能接入無線網絡。
原因:安全認證、無線信道幹擾和信号盲區可能會導緻這個問題。由于無線信号是不可見的,如果沒有專業無線工具的幫助,就很難追蹤到這些問題。
解決辦法:使用一個無線監測工具測量受影響地區的信号強度,如果可能的話,進行實地勘察,找出該地區的惡意接入點或不明接入點。可能是由于無線信道重疊而産生幹擾信号,進而影響了接入無線網絡的使用者感覺。
檢查周圍其他接入點産生的幹擾信号,或者其他幹擾裝置(如微波爐、無繩電話)産 生的噪聲。監控用戶端試圖進行關聯連接配接的接入點,密切關注連接配接失敗出在哪個步驟——關聯、認證還是授權。
總結