QEMU-KVM中的多線程壓縮遷移技術

導讀	目前的遷移技術，都是通過向QEMUFILE中直接寫入裸記憶體資料來達到傳送虛拟機的目的端，這種情況下，發送的資料量大，進而會導緻更高的遷移時間(total time)和黑宕時間(downtime)。本文介紹的方法，在發送前對客戶機記憶體進行壓縮，在目的端接收到記憶體後，進行對資料進行解壓縮，進而恢複客戶機的記憶體。

1.技術原理

使用帶壓縮技術的遷移後，傳輸的資料總量會減少60%，總遷移時間減少70%+，同時當機時間減少50%以上。一方面，壓縮/解壓縮的過程會消耗CPU周期而加大了遷移的時間；另一方面，總傳輸資料量的銳減，又會減少遷移時間。為了能夠進行高速的壓縮，本技術中使用了多線程并發的方式，提高壓縮的目前虛拟機中，使用ZLIB完成壓縮/解壓縮的工作。

在CPU相同的情況下，ZLIB官方給出，解壓縮的速度是壓縮速度的4倍。也就是說，如果遷移的源端和目的端處理器相同的情況下，使得壓縮線程數量是解壓縮線程數量的4倍就可以在資源消耗最小的情況下，取得最優的壓縮為了更多的适應網絡狀況，虛拟機中引入了壓縮級别 -- Compression level。Compression level可以用來控制壓縮速率和壓縮比例。高的壓縮比率會消耗更多的時間，level 0就代表不進行壓縮， 1級代表最優的壓縮速率， 9級代表了最好的壓縮比率(最多的壓縮時間)。我們可以選擇從0級到9級中的任意一個級别。

2. 多線程壓縮動态遷移技術的應用場景

壓縮/解壓縮時間将會消耗CPU周期。是以，如果整個系統CPU都被壓得非常滿的情況下，避免使用這個特性。當網絡帶寬有限，CPU資源又足夠充足的情況下，使用多線程壓縮動态遷移技術會帶來比較好的效果。當網絡充足且CPU資源充足的情況下，使用本技術也将會減少總遷移時間。

3. 多線程壓縮遷移技術使能方法

源端：

1. 啟動虛拟機

/home/liufeng/qemu-system-x86_64 -machine accel=kvm -hda ./disk0.img -m 2048 -vnc 192.168.2.106:0 -monitor stdio

2. 使能源端多線程壓縮動态遷移技術

a.) migrate_set_capabilitycompress on //使能壓縮
b.) migrate_set_parametercompress-threads 12 //12個壓縮線程
c.) migrate_set_parametercompress-level 1 //壓縮級别為1級

3. 開始遷移

migrate -d tcp:192.168.2.105:6666

目的端：

1. 啟動虛拟機

/home/liufeng/qemu-system-x86_64 -machine accel=kvm -hda /home/kvm/vm/disk/disk0.img -m 2048 -vnc 192.168.2.105:0 -monitor stdio -incoming tcp:192.168.2.105:6666

2. 使能目的端多線程壓縮動态遷移技術

a.) migrate_set_capabilitycompress on
b.) migrate_set_parametercompress-level 1
c.) migrate_set_parameterdecompress-threads 3 //3個壓縮線程

3. 等待遷移完成

4. 效果驗證

運作環境:

CPU: Intel(R) Xeon(R) CPU E5-2650 v3 @2.30GHz

Logic core: 40

Socket : 2

RAM: 128G

NIC: 1000baseT/Full

Host OS: CentOSLinux release 7.2.1511 (Core) 64-bit

Guest OS: CentOS Linux release 7.2.1511 (Core) 64-bit

a. 情況一：帶寬無限制，CPU充足

原動态遷移	多線程壓縮技術動态遷移壓縮級别： 1 壓縮線程數： 12 解壓縮線程數：3
遷移總時間(msec):	9536	4466
Downtime時間(msec):	34	22
傳輸資料量(KB)	307783	140445

效果：總的遷移時間減少50%；downtime時間減少35%

b. 情況二：帶寬有限制情況，CPU充足

原動态遷移	多線程壓縮技術動态遷移壓縮級别： 1 壓縮線程數： 12 解壓縮線程數：3
遷移總時間(msec):	11720	5652
Downtime時間(msec):	169	21
傳輸資料量(KB)	311554	140189

效果：總遷移時間減少了200%,downtime時間減少了800%

5. 代碼實作分析

虛拟機實作代碼分析如下(本分析基于：QEMU 2.5)：

1. 在啟動migration過程中，如果發現使能了多線程壓縮技術，則建立壓縮線程

2. 遷移開始後，使用多線程壓縮技術

有migration_thread()進行遷移工作，在iterator和complete階段，如果發現使能了多線程壓縮技術，則通過compress_page_with_multi_thread()完成資料的壓縮和發送

3. 通過zlib的compress2()函數完成資料的壓縮，并通過QEMU-FILE發送

最終在compress_page_with_multi_thread()中激活壓縮線程，通過zlib的compress2()函數完成資料的壓縮，并通過QEMU-FILE發送

6. 可優化點

1. 壓縮算法

a. 目前使用的是開源zlib庫完成壓縮，還有其他壓縮庫的壓縮方式可以提供，以便适應更多的場景

b. 商業壓縮庫有着更好的效率

c. 通過FPGA進行硬體輔助壓縮

2. 壓縮政策

a. 虛拟機遷移算法自适應所有網絡，對網絡進行測試（是否滿足上面的公式），然後形成回報因子輸入到遷移算法中，遷移算法根據回報因子決定使用的壓縮算法、壓縮級别或者根本不壓縮，達到在所有網絡狀況下而縮短downtime的目的。

免費提供最新Linux技術教程書籍，為開源技術愛好者努力做得更多更好：https://www.linuxprobe.com/