天天看點

網絡層 ICMP與ping:投石問路的偵察兵

無論是在宿舍,還是在辦公室,或者運維一個資料中心,我們常常會遇到網絡不通的問題。那台機器明明就在那裡,你甚至都可以通過機器的終端連上去看。它看着好好的,可是就是連不上去,究竟是哪裡出了問題呢?

ICMP 協定的格式

一般情況下,你會想到 ping 一下。那你知道 ping 是如何工作的嗎?

ping 是基于 ICMP 協定工作的。ICMP 全稱 Internet Control Message Protocol,就是網際網路控制封包協定。這裡面的關鍵詞是“控制”,那具體是怎麼控制的呢?

網絡包在異常複雜的網絡環境中傳輸時,常常會遇到各種各樣的問題。當遇到問題的時候,總不能“死個不明不白”,要傳出消息來,報告情況,這樣才可以調整傳輸政策。這就相當于我們經常看到的電視劇裡,古代行軍的時候,為将為帥者需要通過偵察兵、哨探或傳令兵等人肉的方式來掌握情況,控制整個戰局。

ICMP 封包是封裝在 IP 包裡面的。因為傳輸指令的時候,肯定需要源位址和目标位址。它本身非常簡單。因為作為偵查兵,要輕裝上陣,不能攜帶大量的包袱。

網絡層 ICMP與ping:投石問路的偵察兵

 ICMP 封包有很多的類型,不同的類型有不同的代碼。最常用的類型是主動請求為 8,主動請求的應答為 0。

查詢封包類型

我們經常在電視劇裡聽到這樣的話:主帥說,來人哪!前方戰事如何,快去派人打探,一有情況,立即通報!

這種是主帥發起的,主動檢視敵情,對應 ICMP 的查詢封包類型。例如,常用的 ping 就是查詢封包,是一種主動請求,并且獲得主動應答的 ICMP 協定。是以,ping 發的包也是符合 ICMP 協定格式的,隻不過它在後面增加了自己的格式。

對 ping 的主動請求,進行網絡抓包,稱為 ICMP ECHO REQUEST。同理主動請求的回複,稱為ICMP ECHO REPLY。比起原生的 ICMP,這裡面多了兩個字段。

  • 一個是辨別符。這個很好了解,你派出去兩隊偵查兵,一隊是偵查戰況的,一隊是去查找水源的,要有個辨別才能區分。
  • 另一個是序号,你派出去的偵查兵,都要編個号。如果派出去 10 個,回來 10 個,就說明前方戰況不錯;如果派出去 10 個,回來 2 個,說明情況可能不妙。

在選項資料中,ping 還會存放發送請求的時間值,來計算往返時間,說明路程的長短。 

差錯封包類型

當然也有另外一種方式,就是差錯封包。

主帥騎馬走着走着,突然來了一匹快馬,上面的小兵氣喘籲籲的:報告主公,不好啦!張将軍遭遇埋伏,全軍覆沒啦!這種是異常情況發起的,來報告發生了不好的事情,對應 ICMP 的差錯封包類型。

我舉幾個 ICMP 差錯封包的例子:終點不可達為 3,源抑制為 4,逾時為 11,重定向為 5。這些都是什麼意思呢?我給你具體解釋一下。

第一種是終點不可達 終點不可達為 3

 小兵:報告主公,您讓把糧草送到張将軍那裡,結果沒有送到。

如果你是主公,你肯定會問,為啥送不到?具體的原因在代碼中表示就是:

  • 網絡不可達代碼為 0
  • 主機不可達代碼為 1
  • 協定不可達代碼為 2
  • 端口不可達代碼為 3
  • 需要進行分片但設定了不分片位代碼為 4。

第二種是源站抑制,也就是讓源站放慢發送速度。小兵:報告主公,您糧草送的太多了吃不完。

第三種是時間逾時,也就是超過網絡包的生存時間還是沒到。小兵:報告主公,送糧草的人,自己把糧草吃完了,還沒找到地方,已經餓死啦。

第四種是路由重定向,也就是讓下次發給另一個路由器。小兵:報告主公,上次送糧草的人本來隻要走一站地鐵,非得從五環繞,下次别這樣了啊。

差錯封包的結構相對複雜一些。除了前面還是 IP,ICMP 的前 8 位元組不變,後面則跟上出錯的那個 IP 包的 IP 頭和 IP 正文的前 8 個位元組。

而且這類偵查兵特别恪盡職守,不但自己傳回來報信,還把一部分遺物也帶回來。

偵察兵:報告主公,張将軍已經戰死沙場,這是張将軍的印信和佩劍。

主公:神馬?張将軍是怎麼死的(可以檢視 ICMP 的前 8 位元組)?沒錯,這是張将軍的劍,是他的劍(IP 資料包的頭及正文前 8 位元組)。

ping:查詢封包類型的使用

接下來,我們重點來看 ping 的發送和接收過程。

網絡層 ICMP與ping:投石問路的偵察兵

假定主機 A 的 IP 位址是 192.168.1.1,主機 B 的 IP 位址是 192.168.1.2,它們都在同一個子網。那當你在主機 A 上運作“ping 192.168.1.2”後,會發生什麼呢?

ping 指令執行的時候,源主機首先會建構一個 ICMP 請求資料包,ICMP 資料包内包含多個字段。最重要的是兩個。

  • 第一個是類型字段,對于請求資料包而言該字段為 8
  • 另外一個是順序号,主要用于區分連續 ping 的時候發出的多個資料包。每發出一個請求資料包,順序号會自動加 1。
  • 為了能夠計算往返時間 RTT,它會在封包的資料部分插入發送時間。

然後,由 ICMP 協定将這個資料包連同位址 192.168.1.2 一起交給 IP 層。IP 層将以 192.168.1.2 作為目的位址,本機 IP 位址作為源位址,加上一些其他控制資訊,建構一個 IP 資料包。

接下來,需要加入 MAC 頭。如果在本節地ARP 映射表中查找出 IP 位址 192.168.1.2 所對應的 MAC 位址,則可以直接使用;如果沒有,則需要發送 ARP 協定查詢 MAC 位址,獲得 MAC 位址後,由資料鍊路層建構一個資料幀,目的位址是 IP 層傳過來的 MAC 位址,源位址則是本機的 MAC 位址;還要附加上一些控制資訊,依據以太網的媒體通路規則,将它們傳送出去。

主機 B 收到這個資料幀後,先檢查它的目的 MAC 位址,并和本機的 MAC 位址對比,如符合,則接收,否則就丢棄。接收後檢查該資料幀,将 IP 資料包從幀中提取出來,交給本機的 IP 層。同樣,IP 層檢查後,将有用的資訊提取後交給 ICMP 協定。

主機 B 會建構一個 ICMP 應答包,應答資料包的類型字段為 0,順序号為接收到的請求資料包中的順序号,然後再發送出去給主機 A。

在規定的時候間内,源主機如果沒有接到 ICMP 的應答包,則說明目标主機不可達;如果接收到了 ICMP 應答包,則說明目标主機可達。此時,源主機會檢查,用目前時刻減去該資料包最初從源主機上發出的時刻,就是 ICMP 資料包的時間延遲。

當然這隻是最簡單的,同一個區域網路裡面的情況。如果跨網段的話,還會涉及網關的轉發、路由器的轉發等等。但是對于 ICMP 的頭來講,是沒什麼影響的。會影響的是根據目标 IP 位址,選擇路由的下一跳,還有每經過一個路由器到達一個新的區域網路,需要換 MAC 頭裡面的 MAC 位址。

如果在自己的可控範圍之内,當遇到網絡不通的問題的時候,除了直接 ping 目标的 IP 位址之外,還應該有一個清晰的網絡拓撲圖。并且從理論上來講,應該要清楚地知道一個網絡包從源位址到目标位址都需要經過哪些裝置,然後逐個 ping 中間的這些裝置或者機器。如果可能的話,在這些關鍵點,通過 tcpdump -i eth0 icmp,檢視包有沒有到達某個點,回複的包到達了哪個點,可以更加容易推斷出錯的位置。

[root@jenkins-master ~]# ping 192.168.0.2
PING 192.168.0.2 (192.168.0.2) 56(84) bytes of data.
64 bytes from 192.168.0.2: icmp_seq=1 ttl=64 time=0.661 ms
64 bytes from 192.168.0.2: icmp_seq=2 ttl=64 time=0.444 ms
64 bytes from 192.168.0.2: icmp_seq=3 ttl=64 time=0.285 ms


[root@master ~]# tcpdump -i eth0 icmp
tcpdump: verbose output suppressed, use -v or -vv for full protocol decode
listening on eth0, link-type EN10MB (Ethernet), capture size 262144 bytes
21:14:05.152986 IP Jenkins-Master.localdomain > master.cluster.local: ICMP echo request, id 13037, seq 7, length 64
21:14:05.153055 IP master.cluster.local > Jenkins-Master.localdomain: ICMP echo reply, id 13037, seq 7, length 64
21:14:06.153394 IP Jenkins-Master.localdomain > master.cluster.local: ICMP echo request, id 13037, seq 8, length 64
21:14:06.153427 IP master.cluster.local > Jenkins-Master.localdomain: ICMP echo reply, id 13037, seq 8, length 64      

經常會遇到一個問題,如果不在我們的控制範圍内,很多中間裝置都是禁止 ping 的,但是 ping 不通不代表網絡不通。

網絡層 ICMP與ping:投石問路的偵察兵

繼續閱讀