SQL Server 深入解析索引存儲(堆)

标簽：SQL SERVER/MSSQL SERVER/資料庫/DBA/索引體系結構/堆

本篇文章是關于堆的存儲結構。堆是不含聚集索引的表（是以隻有非聚集索引的表也是堆）。堆的 sys.partitions 中具有一行，對于堆使用的每個分區，都有 index_id = 0。預設情況下，一個堆有一個分區。當堆有多個分區時，每個分區有一個堆結構，其中包含該特定分區的資料。例如，如果一個堆有四個分區，則有四個堆結構；每個分區有一個堆結構。根據堆中的資料類型，每個堆結構将有一個或多個配置設定單元來存儲和管理特定分區的資料。每個堆中的每個分區至少有一個 IN_ROW_DATA 配置設定單元。如果堆包含大型對象 (LOB) 列，則該堆的每個分區還将有一個 LOB_DATA 配置設定單元。如果堆包含超過 8,060 位元組行大小限制的可變長度列，則該堆的每個分區還将有一個 ROW_OVERFLOW_DATA 配置設定單元。有關配置設定單元的詳細資訊，

sys.system_internals_allocation_units 系統視圖中的列 first_iam_page 指向管理特定分區中堆的配置設定空間的一系列 IAM 頁的第一頁。SQL Server 使用 IAM 頁在堆中移動。堆内的資料頁和行沒有任何特定的順序，也不連結在一起。資料頁之間唯一的邏輯連接配接是記錄在 IAM 頁内的資訊。

可以通過掃描 IAM 頁對堆進行表掃描或串行讀操作來找到容納該堆的頁的擴充盤區。因為 IAM 按擴充盤區在資料檔案記憶體在的順序表示它們，是以這意味着串行堆掃描連續沿每個檔案進行。使用 IAM 頁設定掃描順序還意味着堆中的行一般不按照插入的順序傳回。

頁面的組成

一個SQL資料頁面=标頭+資料行+剩餘空間+行偏移表（如果表中存在大資料類型字段）+溢出表（如果存在）

行偏移

分析114頁

整個資料頁有四部分組成

1.頁面在記憶體中的映射資訊（BUFFER:）

2. 頁頭部分（PAGE HEADER）：記錄了頁号、頁類型、記錄數，LSN及其他資訊，在上一章已經講過

3. 資料部分（DATA）：以16進制格式存儲行記錄（從第96個位元組開始）

4. 行偏移部分(OFFSET TABLE)：以倒序的順序記錄了行記錄的指針位置，這個使用2的顯示方式比較明顯看出

看看一行記錄在頁面中是怎樣記錄的

00000000: 30001000 01000000 76ff7401 64a40000 †0.......v.t.d...

00000010: 0300b801 00190031 00†††††††††††††††††.......1.

1位元組：30>00110000 ；右邊第一位開始是0位，第4位和第5位是1，由于在2008中null bit map總是存在的，是以隻考慮第五位，即存在變長字段。

1位元組：00；狀态位B在SQLServer2005/2008中未啟用，是以為00

2位元組：1000;這兩個位元組是表示定長列的位元組數，反過來排0010=1*16=16個位元組，表中的定長列ID(4個位元組)+IDATE(8個位元組)+4個位元組（預設加的）=16個位元組

N個位元組：01000000 76ff7401 64a40000；這N個位元組是定長字段的内容，總共12個位元組

2個位元組：0300；表中的字段數，由于表中隻有3個字段是以用0300表示

1個位元組：b8>10111000;這個位元組表示主要是判斷對應的字段内容是否有空值，1代表允許為空，前三個字段都不允許為空，而且表隻有三個字段是以不用看後面。

2個位元組：01 00；這個字段表示變長列的個數，根據剛才說的方法倒過來00 01=1個字段，表中頁隻有NAME字段是變長字段。

2個位元組*變長字段的個數：1900；由于表中隻有一個變長字段，是以隻有兩個位元組，表示第一個變長列的終止位置=25

N個位元組：變長字段的内容，3100轉換成字元剛好是‘1’

查詢

分析查詢可以看出無論你查詢的是'1'還是'900',都是掃描一次，邏輯讀取4次，因為存在4個頁，用ID去查也是一樣.

行溢出

總共插入了1000條記錄，一行占一頁再加上兩個IAM頁剛好2002頁，

存在兩個IAM頁，分别是3281和3283頁，還有一個比較特殊的頁3280頁，3280頁是溢出資料裡面的根頁，等一下看一下這頁的資料。

分析IAM頁

分析溢出頁

注意:不是堆頁和溢出頁就隻能一一對應，由于目前表中堆頁容納不下兩條記錄是以就導緻了堆頁和溢出頁一樣，當堆頁可以存多條記錄的時候就會出現一個堆頁對應多個溢出頁。

測試查詢

當我繼續往堆表裡插入資料直到表超過4G的時候會有新的IAM頁生成，而且IAM頁之間存在鍊關系（資料頁）。

查詢發現新生成的3135IAM頁種的資料頁的行溢出指向的是新生成的511256IAM頁的溢出頁，這樣的話IAM頁之間的鍊關系對查詢效率貌似沒有什麼改善的好處。

1. IAM用于查找配置設定給heap的所有資料頁資訊，IAM頁中記錄了所有的頁面的頁id。

2. 對于大多數較小的heap表來說，僅需要一個IAM頁就可以管理其頁面。

3. 若heap表大于4GB或包含LOB資料類型的話，則會包含多個IAM頁面。

4. 當查詢要擷取heap表的所有記錄時，SQL Server使用IAM頁來掃描heap表

堆表的頁是沒有規律的不存在頁鍊，是以導緻堆表的查詢效率很差,當查詢一個10萬條記錄的堆表邏輯讀取就需要10萬次，如果堆表的資料量很大需要多次進行實體讀擷取頁面的時候對于IO的消耗是非常大的，建議表都應該建聚集索引。

本文轉自pursuer.chen(陳敏華)部落格園部落格，原文連結：http://www.cnblogs.com/chenmh/p/4359171.html，如需轉載請自行聯系原作者

SQL Server 深入解析索引存儲(堆)

繼續閱讀

Linxu常用指令技巧彙總

ERROR 1 (HY000): Can't create/write to file '/tmp/#sql_4188_1.MYI' (Errcode: 28)

艱難安裝LDAP,SSL認證

《Linux指令行與Shell腳本程式設計大全第2版.布盧姆》pdf

MySQL的4種隔離級别？出現問題

XX系統實施過程問題總結

無元件上傳圖檔到資料庫中，最完整解決方案

【MySQL資料庫】資料庫索引事務1.索引2.事務

neo4j之cypher使用文檔

Ambari介紹和架構原理

NOSQL安全攻擊

mybatis_入門程式Mybatis入門

登入plsql 報錯 the account is locked --使用者被鎖

sqlServer根據經緯查距離

SequoiaDB巨杉資料庫C++驅動概述

win10本地scala和spark安裝安裝scala安裝spark