天天看點

QEMU-KVM中的多線程壓縮遷移技術

導讀 目前的遷移技術,都是通過向QEMUFILE中直接寫入裸記憶體資料來達到傳送虛拟機的目的端,這種情況下,發送的資料量大,進而會導緻更高的遷移時間(total time)和黑宕時間(downtime)。本文介紹的方法,在發送前對客戶機記憶體進行壓縮,在目的端接收到記憶體後,進行對資料進行解壓縮,進而恢複客戶機的記憶體。

1.技術原理

使用帶壓縮技術的遷移後,傳輸的資料總量會減少60%,總遷移時間減少70%+,同時當機時間減少50%以上。一方面,壓縮/解壓縮的過程會消耗CPU周期而加大了遷移的時間;另一方面,總傳輸資料量的銳減,又會減少遷移時間。為了能夠進行高速的壓縮,本技術中使用了多線程并發的方式,提高壓縮的目前虛拟機中,使用ZLIB完成壓縮/解壓縮的工作。

在CPU相同的情況下,ZLIB官方給出,解壓縮的速度是壓縮速度的4倍。也就是說,如果遷移的源端和目的端處理器相同的情況下,使得壓縮線程數量是解壓縮線程數量的4倍就可以在資源消耗最小的情況下,取得最優的壓縮為了更多的适應網絡狀況,虛拟機中引入了壓縮級别 -- Compression level。Compression level可以用來控制壓縮速率和壓縮比例。高的壓縮比率會消耗更多的時間,level 0就代表不進行壓縮, 1級代表最優的壓縮速率, 9級代表了最好的壓縮比率(最多的壓縮時間)。我們可以選擇從0級到9級中的任意一個級别。

2. 多線程壓縮動态遷移技術的應用場景

壓縮/解壓縮時間将會消耗CPU周期。是以,如果整個系統CPU都被壓得非常滿的情況下,避免使用這個特性。當網絡帶寬有限,CPU資源又足夠充足的情況下,使用多線程壓縮動态遷移技術會帶來比較好的效果。當網絡充足且CPU資源充足的情況下,使用本技術也将會減少總遷移時間。

3. 多線程壓縮遷移技術使能方法

源端:

1. 啟動虛拟機

/home/liufeng/qemu-system-x86_64 -machine accel=kvm -hda ./disk0.img -m 2048 -vnc 192.168.2.106:0 -monitor stdio
      

2. 使能源端多線程壓縮動态遷移技術

a.) migrate_set_capabilitycompress on //使能壓縮
b.) migrate_set_parametercompress-threads 12 //12個壓縮線程
c.) migrate_set_parametercompress-level 1 //壓縮級别為1級
      

3. 開始遷移

migrate -d tcp:192.168.2.105:6666
      

目的端:

1. 啟動虛拟機

/home/liufeng/qemu-system-x86_64 -machine accel=kvm -hda /home/kvm/vm/disk/disk0.img -m 2048 -vnc 192.168.2.105:0 -monitor stdio -incoming tcp:192.168.2.105:6666
      

2. 使能目的端多線程壓縮動态遷移技術

a.) migrate_set_capabilitycompress on
b.) migrate_set_parametercompress-level 1
c.) migrate_set_parameterdecompress-threads 3 //3個壓縮線程
      

3. 等待遷移完成

4. 效果驗證

運作環境:

CPU: Intel(R) Xeon(R) CPU E5-2650 v3 @2.30GHz

Logic core: 40

Socket : 2

RAM: 128G

NIC: 1000baseT/Full

Host OS: CentOSLinux release 7.2.1511 (Core) 64-bit

Guest OS: CentOS Linux release 7.2.1511 (Core) 64-bit

a. 情況一:帶寬無限制,CPU充足

原動态遷移

多線程壓縮技術動态遷移

壓縮級别: 1

壓縮線程數: 12

解壓縮線程數:3

遷移總時間(msec): 9536 4466
Downtime時間(msec): 34 22
傳輸資料量(KB) 307783 140445

效果:總的遷移時間減少50%;downtime時間減少35%

b. 情況二:帶寬有限制情況,CPU充足

原動态遷移

多線程壓縮技術動态遷移

壓縮級别: 1

壓縮線程數: 12

解壓縮線程數:3

遷移總時間(msec): 11720 5652
Downtime時間(msec): 169 21
傳輸資料量(KB) 311554 140189

效果:總遷移時間減少了200%,downtime時間減少了800%

5. 代碼實作分析

虛拟機實作代碼分析如下(本分析基于:QEMU 2.5):

1. 在啟動migration過程中,如果發現使能了多線程壓縮技術,則建立壓縮線程

QEMU-KVM中的多線程壓縮遷移技術

2. 遷移開始後,使用多線程壓縮技術

有migration_thread()進行遷移工作,在iterator和complete階段,如果發現使能了多線程壓縮技術,則通過compress_page_with_multi_thread()完成資料的壓縮和發送

QEMU-KVM中的多線程壓縮遷移技術

3. 通過zlib的compress2()函數完成資料的壓縮,并通過QEMU-FILE發送

最終在compress_page_with_multi_thread()中激活壓縮線程,通過zlib的compress2()函數完成資料的壓縮,并通過QEMU-FILE發送

QEMU-KVM中的多線程壓縮遷移技術

6. 可優化點

1. 壓縮算法

a. 目前使用的是開源zlib庫完成壓縮,還有其他壓縮庫的壓縮方式可以提供,以便适應更多的場景

b. 商業壓縮庫有着更好的效率

c. 通過FPGA進行硬體輔助壓縮

2. 壓縮政策

a. 虛拟機遷移算法自适應所有網絡,對網絡進行測試(是否滿足上面的公式),然後形成回報因子輸入到遷移算法中,遷移算法根據回報因子決定使用的壓縮算法、壓縮級别或者根本不壓縮,達到在所有網絡狀況下而縮短downtime的目的。

免費提供最新Linux技術教程書籍,為開源技術愛好者努力做得更多更好:https://www.linuxprobe.com/