天天看點

網絡性能測試

實時音視訊這種實時業務一般用udp傳輸資料,其對網絡性能是非常敏感的,在實戰中,經常需要測試目前端到端或端到雲的網絡性能。在這裡我們讨論一下網絡性能測試中所涉及到名額,技術和相關工具,以及如何編寫自己的網絡性能測試工具。

先給出幾個比較重要的名額的定義以及它們的意義。

帶寬(吞吐量)

機關時間内傳輸的資料量,機關通常是每秒比特數,記作bps;

帶寬反映了網絡的傳輸能力,越大越好;

丢包

資料包丢失個數,等于“發送資料包數” - “接受資料包數”;

丢包反映了網絡可靠性,越小越好;

時延

資料包從發送開始到接收到該資料所耗費的時間,機關通常是毫秒;

時延反映了網絡的速度,越小越好;

抖動

指時延的變化,即兩個資料包時延的內插補點;

抖動反映了網絡的穩定性,越小越好;

亂序

指接收到的資料包順序和發送順序不一緻的次數;

亂序反映了網絡的穩定性,越小越好;

當亂序比較嚴重時,丢包也會比較嚴重,是以一般都以丢包名額為主,忽略亂序名額;

網上有很多測試網絡性能的工具,如果它們能滿足需求的話,就不用自己再造輪子了。

ping

ping是最常見的,幾乎在所有的OS上都有它的存在。 其工作原理如圖

網絡性能測試

Local發送的資料包,Remote收到資料包後原樣發回來;

資料包裡包含有序号和時間戳資訊;

序号用于判斷是否丢包;

時間戳用于計算來回時延(圖中藍色部分),它等于接收時間減去資料包時間戳;

不同OS的ping指令選項可能會略有差别,以Mac OSX的ping為例

$ping -s 1024 192.168.1.100

PING www.microsoft.com (23.42.217.205): 1024 data bytes

1032 bytes from 23.42.217.205: icmp_seq=0 ttl=49 time=83.883 ms

1032 bytes from 23.42.217.205: icmp_seq=1 ttl=49 time=77.958 ms

1032 bytes from 23.42.217.205: icmp_seq=2 ttl=49 time=80.053 ms

1032 bytes from 23.42.217.205: icmp_seq=3 ttl=49 time=78.244 ms

1032 bytes from 23.42.217.205: icmp_seq=4 ttl=49 time=77.937 ms

網絡性能測試

^C

--- 192.168.1.100 ping statistics ---

30 packets transmitted, 29 packets received, 3.3% packet loss

round-trip min/avg/max/stddev = 77.843/95.375/141.314/19.167 ms其中 -s 1024 訓示包的大小為1024位元組;從ping結果可以看出,發送了30個包,收到29個包,3.3%的丢包率,最小時延77.843毫秒,最大時延141.314毫秒,平均時延95.375毫秒,時延的标準差19.167。另外,ping用的是ICMP協定,網絡對ICMP協定處理性能,可能跟UDP或TCP是不一樣的,是以測試結果隻能做為參考。

小結:ping的優點是簡單便捷,可以測試時延和丢包,缺點是無法測試帶寬。

iperf

iperf功能功能強一些,可以測帶寬,丢包,抖動, 但是測不了時延。它的工作原理如圖:

網絡性能測試

從圖中可以看出iperf是單向發資料包,并不會像ping一樣接收方把資料包發回給發送方,是以它是測不了時延,但能測試抖動。抖動等于接收時間間隔(綠色長度)減去發送時間間隔(藍色長度,即timestamp2-timestamp1)。

下面是一個例子。

服務端:

$iperf -u -s -p 12345 -i 1 -w 1000000

------------------------------------------------------------

Server listening on UDP port 12345

Receiving 1470 byte datagrams

UDP buffer size: 977 KByte

用戶端:

$ iperf -u -c 127.0.0.1 -p 12345 -i 1 -t 5 -b 16K -l 62

Client connecting to 127.0.0.1, UDP port 12345

Sending 62 byte datagrams

UDP buffer size: 9.00 KByte (default)

[ 4] local 127.0.0.1 port 59805 connected with 127.0.0.1 port 12345

[ ID] Interval Transfer Bandwidth

[ 4] 0.0- 1.0 sec 2.00 KBytes 16.4 Kbits/sec

[ 4] 1.0- 2.0 sec 1.94 KBytes 15.9 Kbits/sec

[ 4] 2.0- 3.0 sec 1.94 KBytes 15.9 Kbits/sec

[ 4] 3.0- 4.0 sec 1.94 KBytes 15.9 Kbits/sec

[ 4] 4.0- 5.0 sec 2.00 KBytes 16.4 Kbits/sec

[ 4] 0.0- 5.1 sec 9.87 KBytes 16.0 Kbits/sec

[ 4] Sent 163 datagrams

[ 4] Server Report:

[ 4] 0.0- 5.1 sec 9.87 KBytes 16.0 Kbits/sec 0.046 ms 0/ 163 (0%)

其中 -b 16K 指定了帶寬參數。測試結果為丢包0個,平均抖動為0.046毫秒。

or(unsigned second = 0; second < test_seconds; second++)

{

  for(unsigned ui = 0; ui < 8; ui++)

  {

     sendto 1024 bytes;

  }

  msleep(1000);

}

從上面可以看出,ping和iperf各有優缺點,通常需要兩者組合才能滿足我們的需求。有時候現有工具不能滿足實際應用的需求,比如說完全模拟實際業務環境或者在産品裡內建測試功能,這時候就需要發揮“自己動手,豐衣足食”的精神,造出一個适合自己用的輪子來。我們這裡隻讨論關鍵點之一:如何勻速發送資料。

我們以設定發送包長為1024位元組,帶寬為64kbps為例子,讨論發送資料的實作方案。

發送資料最簡單的方法就是,起一個線程,每秒直接發送完目前秒的資料,然後sleep一秒,再繼續發送,如下:

這種方法比較簡單,但是因為發送資料是需要花費時間的,假如發送64Kbit花費了5毫秒,實際發送碼率(帶寬)為64/1005≈63.68Kbps,比設定值低一些。把發送時間考慮在内,第2個改進後的代碼版本如下:

for (unsigned second = 0; second < test_seconds; second++) 

    unsigned ts_start = gettimestamp();

    for (unsigned ui = 0; ui < 8; ui++)

    {

        sendto 1024 bytes;

    }

    unsigned elapsed = gettimestamp() - ts_start;

    msleep(1000-elapsed);

從大尺度上看,這個版本确實會按設定帶寬發送資料,但從小的的時間片上看,其瞬時發送速率是非常高的。假如發送64Kbit花費了5毫秒,則瞬時速率為 64*1000/5=12800Kbps,是設定值的20倍。這種瞬時高發送速率可能會導緻網絡中某些路由器或交換機來不及處理而大量丢包。是以我們繼續改進,在每發送一個包時check是否發送太快,如果發送太快的話就sleep一下緩一緩。改進後的第三個版本如下:

uint64_t sent_bytes = 0;

unsigned kick_time = gettimestamp();

for (unsigned second = 0; second < test_seconds; second++)

    sendto 1024 bytes; sent_bytes += 1024;

    unsigned elapsed = gettimestamp() - kick_time;

    unsigned normal = sent_bytes * 1000 * 8 / (64*1000); 

    if (normal > elapsed)

        msleep(normal-elapsed);

這個版本基本能夠按照設定值勻速發送資料了。當然,它還不是最完美的,當設定帶寬很高而包長很小時,會導緻太多的check,占用太多CPU。這裡就不繼續改進了,有興趣的看官可以自己實作之。

繼續閱讀