天天看點

Linux 中的“大記憶體頁”(hugepage)是個什麼

本文中我們會詳細介紹大記憶體頁huge page,讓你能夠回答:Linux 中的“大記憶體頁”是什麼?在 RHEL6、RHEL7、​​Ubuntu​​ 等 Linux 中,如何啟用/禁用“大記憶體頁”?如何檢視“大記憶體頁”的目前值?

首先讓我們從“大記憶體頁”的基礎知識開始講起。

Linux 中的“大記憶體頁”是個什麼玩意?

“大記憶體頁”有助于 Linux 系統進行虛拟記憶體管理。顧名思義,除了标準的 4KB 大小的頁面外,它們還能幫助管理記憶體中的巨大的頁面。使用“大記憶體頁”,你最大可以定義 1GB 的頁面大小。

在系統啟動期間,你能用“大記憶體頁”為應用程式預留一部分記憶體。這部分記憶體,即被“大記憶體頁”占用的這些存儲器永遠不會被交換出記憶體。它會一直保留其中,除非你修改了配置。這會極大地提高像 Oracle 資料庫這樣的需要海量記憶體的應用程式的性能。

為什麼使用“大記憶體頁”?

在虛拟記憶體管理中,核心維護一個将虛拟記憶體位址映射到實體位址的表,對于每個頁面操作,核心都需要加載相關的映射。如果你的記憶體頁很小,那麼你需要加載的頁就會很多,導緻核心會加載更多的映射表。而這會降低性能。

使用“大記憶體頁”,意味着所需要的頁變少了。進而大大減少由核心加載的映射表的數量。這提高了核心級别的性能最終有利于應用程式的性能。

簡而言之,通過啟用“大記憶體頁”,系統具隻需要處理較少的頁面映射表,進而減少通路/維護它們的開銷!

如何配置“大記憶體頁”?

運作下面指令來檢視目前“大記憶體頁”的詳細内容。

root@kerneltalks # grep Huge /proc/meminfo
AnonHugePages:         0 kB
HugePages_Total:       0
HugePages_Free:        0
HugePages_Rsvd:        0
HugePages_Surp:        0
Hugepagesize:       2048 kB      

從上面輸出可以看到,每個頁的大小為 2MB(​

​Hugepagesize​

​),并且系統中目前有 ​

​0​

​ 個“大記憶體頁”(​

​HugePages_Total​

​)。這裡“大記憶體頁”的大小可以從 ​

​2MB​

​ 增加到 ​

​1GB​

​。

運作下面的腳本可以知道系統目前需要多少個巨大頁。該腳本取之于 Oracle。

#!/bin/bash
#
# hugepages_settings.sh
#
# Linux bash script to compute values for the
# recommended HugePages/HugeTLB configuration
#
# Note: This script does calculation for all shared memory
# segments available when the script is run, no matter it
# is an Oracle RDBMS shared memory segment or not.
# Check for the kernel version
KERN=`uname -r | awk -F. '{ printf("%d.%d\n",$1,$2); }'`
# Find out the HugePage size
HPG_SZ=`grep Hugepagesize /proc/meminfo | awk {'print $2'}`
# Start from 1 pages to be on the safe side and guarantee 1 free HugePage
NUM_PG=1
# Cumulative number of pages required to handle the running shared memory segments
for SEG_BYTES in `ipcs -m | awk {'print $5'} | grep "[0-9][0-9]*"`
do
   MIN_PG=`echo "$SEG_BYTES/($HPG_SZ*1024)" | bc -q`
   if [ $MIN_PG -gt 0 ]; then
      NUM_PG=`echo "$NUM_PG+$MIN_PG+1" | bc -q`
   fi
done
# Finish with results
case $KERN in
   '2.4') HUGETLB_POOL=`echo "$NUM_PG*$HPG_SZ/1024" | bc -q`;
          echo "Recommended setting: vm.hugetlb_pool = $HUGETLB_POOL" ;;
   '2.6' | '3.8' | '3.10' | '4.1' ) echo "Recommended setting: vm.nr_hugepages = $NUM_PG" ;;
    *) echo "Unrecognized kernel version $KERN. Exiting." ;;
esac
# End      

将它以 ​

​hugepages_settings.sh​

​ 為名儲存到 ​

​/tmp​

​ 中,然後運作之:

root@kerneltalks # sh /tmp/hugepages_settings.sh
Recommended setting: vm.nr_hugepages = 124      

你的輸出類似如上結果,隻是數字會有一些出入。

這意味着,你系統需要 124 個每個 2MB 的“大記憶體頁”!若你設定頁面大小為 4MB,則結果就變成了 62。你明白了吧?

配置核心中的“大記憶體頁”

本文最後一部分内容是配置上面提到的 ​​核心參數 ​​,然後重新加載。将下面内容添加到 ​

​/etc/sysctl.conf​

​ 中,然後輸入 ​

​sysctl -p​

​ 指令重新加載配置。

vm.nr_hugepages=126      

注意我們這裡多加了兩個額外的頁,因為我們希望在實際需要的頁面數量之外多一些額外的空閑頁。

現在,核心已經配置好了,但是要讓應用能夠使用這些“大記憶體頁”還需要提高記憶體的使用閥值。新的記憶體閥值應該為 126 個頁 x 每個頁 2 MB = 252 MB,也就是 258048 KB。

你需要編輯 ​

​/etc/security/limits.conf​

​ 中的如下配置:

soft memlock 258048hard memlock 258048      

某些情況下,這些設定是在指定應用的檔案中配置的,比如 Oracle DB 就是在 ​

​/etc/security/limits.d/99-grid-oracle-limits.conf​

​ 中配置的。

​​Understanding hugepages in Linux - SSLHOW​​

繼續閱讀