天天看點

TCP的擁塞控制--慢啟動,擁塞避免,快重傳,快速恢複

擁塞現象是指到達通信子網中某一部分的分組數量過多,使得該部分網絡來不及處理,以緻引起這部分乃至整個網絡性能下降的現象,嚴重時甚至會導緻網絡通信業務陷入停頓,即出現死鎖現象。這種現象跟公路網中經常所見的交通擁擠一樣,當節假日公路網中車輛大量增加時,各種走向的車流互相幹擾,使每輛車到達目的地的時間都相對增加(即延遲增加),甚至有時在某段公路上車輛因堵塞而無法開動(即發生局部死鎖)。 — 摘自百度百科

端到端TCP擁塞控制的本質思想是通過調整發送端的發送速率來控制網絡的負荷量。具體地說,TCP不斷地通過加大發送的速率來對目前網絡的實際承載能力進行探測,根據逾時或者丢包等現象判斷目前網絡是否已經"超負荷“,然後迅速減小向網絡中發送資訊的速率,并在新的起點上繼續對網絡進行試探。進而達到控制網絡請求的目的,避免出現大規模的擁塞以緻導緻網絡不可用

早期的TCP協定隻有基于視窗的流量控制(flow control)機制而沒有考慮到可能由于網絡自己的傳輸能力不足,而導緻整個網絡發生崩潰(影響網絡的因素實在太多了,傳輸過程中有很多不可預見的問題)。

1988年V.Jacobson在論文中提出了由“慢啟動(Slow Start)”和“擁塞避免(Congestion Avoidance)”組成的TCP的網絡擁塞控制。在20多年的發展過程中,後人在此算法基礎上又進行了多次的改進和優化

與擁塞控制相關的有四個比較重要的版本:TCP Tahoe、TCP Reno、TCP NewReno和TCP SACK。

TCP Tahoe是早期的TCP版本,它包括了3個最基本的算法-“慢啟動”、“擁塞避免”和“快速重傳(Fast Retransmit)”。TCP Reno則在TCP Tahoe基礎上增加了“快速恢複(Fast Recovery)”算法,針對快速重傳作出特殊處理,避免了網絡擁塞不嚴重時采用“慢啟動”算法而導緻過度減小發送視窗大小的問題。

TCP NewReno的主要改進在于一個視窗内多個封包段丢失的問題。這樣可以避免TCP Reno中的多次重傳逾時。另外,TCP NewReno算法在快速恢複中引入了部分确認(Partial ACK)。它在快速恢複階段到達并且确認新資料,但它隻确認進入快速重傳之前發送的一部分資料。

TCP SACK(Selective Acknowledgement)也是對TCP Reno的改進,當檢測到擁塞後,不必重傳從資料丢失到檢測到丢失這段時間發送端發送的所有封包段,而是對這些封包段進行有選擇的确認和重傳,避免不必要的重傳。

基于丢包/逾時的擁塞控制

這種算法就是在發送方維護一個擁塞視窗(cwnd),大小等于發送視窗,如果發送方沒有在規定的時間間隔内收到接收方的應答,則就可以認為出現了網絡擁塞。

Slow Start 慢開始算法

所謂慢啟動,也就是在建立好連接配接的時候,先從較低的發送速率開始,一點點提速,試探一下網絡的承受能力,由于一開始的速率較低,是以提升速度可以快一點

慢啟動算法:

(1) 連接配接建立後先初始化擁塞視窗cwnd,其大小為1MSS( Maximum Segment Size 最大封包段長度)

(2) 用戶端收到服務端的ack後.就會将cwnd大小*2, 呈指數上升

(3) 當cwnd 達到慢開始門限 (ssthresh, slow start threshold)時,停止慢開始算法,進入“擁塞避免算法”

Congestion Avoidance 擁塞避免算法

擁塞避免算法思路是将增長速率變為線性增長,也就是每經過一個往返RTT時間就把發送方的cwnd加1

過了慢開始門限後,擁塞避免算法可以避免視窗增長速度過快導緻視窗擁塞,采用緩慢增加的方式調整到網絡的最佳值。

簡單來說:

  • 當cwnd < ssthresh ,使用慢開始算法;
  • 當cwnd = ssthresh,可以使用慢開始算法,也可以使用擁塞算法;
  • 當cwnd > ssthresh,使用擁塞算法;

通過上述兩個算法可以使得網絡傳輸速率一直增大,直到出現逾時,這時候需要将cwnd重新調整到1 MSS開始,使用慢開始算法,同時将慢開始門限ssthresh調整為cwnd逾時點的一半 ,然後繼續執行慢開始、擁塞避免算法。

Fast retransmit 快重傳算法 和 Fast Recovery 快速恢複算法

TCP擁塞控制預設認為網絡丢包是由于網絡擁塞導緻的,是以一般的TCP擁塞控制算法以丢包來判斷網絡是否進入擁塞狀态。對于丢包有兩種判定方式,一種是逾時重傳RTO[Retransmission Timeout],另一個是收到三個重複确認ACK(因為TCP一旦逾時就會重新發送資料包)。

重傳定時器 :

判斷封包段丢失的依據,發送端發送一個封包段同時啟動重傳定時器,如果重傳定時器逾時,但發送端還沒有收到接收端的ACK,就判斷該封包段丢失,重傳丢失封包段并重新啟動重傳定時器。

TCP采用動态重傳逾時估計,即以往返時間RTT為基礎來确定重傳逾時時間。其中最常用的是設定重傳逾時時間為往返時間RTT的兩倍,即重傳逾時時間= 2* RTT

Tahoe算法的不足之處在于,收到3個重複ACK或在逾時的情況下,Tahoe設定cwnd為1,然後進入慢啟動階段,大大降低了網絡的使用率。

而Reno算法針對上述問題進行了改進:

1)對于收到連續3個重複的ACK确認,算法不經過慢啟動階段,而直接進入擁塞避免階段;

2)增加了快速重傳和快速恢複機制

所謂的快速重傳就是說如果發送方接收到3個以上的重複ACK,TCP就認為發生了網絡擁塞(有封包丢失),需要重傳。此時不需要等到重傳定時器逾時,是以稱之為快速重傳,而在快速重傳後沒有使用慢啟動算法,而是直接進入擁塞避免算法(将慢開始門限值(ssthresh)和cwnd 調整為此時cwnd的一半),是以這又叫做快速恢複算法。

TCP的擁塞控制--慢啟動,擁塞避免,快重傳,快速恢複

其他擁塞控制算法

除了上述基于逾時/丢包的擁塞控制,TCP還有很多不同次元的擁塞控制算法

比如:

基于丢包的擁塞控制:将丢包視為出現擁塞,采取緩慢探測的方式,逐漸增大擁塞視窗,當出現丢包時,将擁塞視窗減小,如Reno、Cubic等。

基于時延的擁塞控制:将時延增加視為出現擁塞,延時增加時增大擁塞視窗,延時減小時減小擁塞視窗,如Vegas、FastTCP等。

基于鍊路容量的擁塞控制:實時測量網絡帶寬和時延,認為網絡上封包總量大于帶寬時延乘積時出現了擁塞,如BBR。

基于學習的擁塞控制:沒有特定的擁塞信号,而是借助評價函數,基于訓練資料,使用機器學習的方法形成一個控制政策,如Remy。

繼續閱讀