B+樹 && B+樹索引&&Cardinality值 ----- InnoDB存儲引擎内幕

1.二叉查找樹&平衡二叉樹

B+樹由二叉查找樹+平衡二叉樹演化而來

1.1下面來簡單介紹一下二叉查找樹
例子:

B+樹 && B+樹索引&&Cardinality值 ----- InnoDB存儲引擎内幕

上圖中:數字代表每個節點的鍵值

特點:
1.左子樹的鍵值總是<右子樹的鍵值
2.右子樹的鍵值總是>左子樹的鍵值

若對該樹進行查找，如查鍵值為5的記錄，先找到根6 因為6>5 往左子樹找得到3 < 5 再找右子樹找到鍵值共需要3次

缺點

B+樹 && B+樹索引&&Cardinality值 ----- InnoDB存儲引擎内幕

如果像上圖一樣查找的效率就低下了

由此引入1.2AVL平衡二叉樹

AVL定義:

1.首先符合二叉查找樹定義
2.滿足任何節點的兩個子樹高度差最大是1

缺點：需要維護的代價非常大，一般需要1次或者多次左旋和右旋來得到插入或更新後樹的平衡性

– 示例：

B+樹 && B+樹索引&&Cardinality值 ----- InnoDB存儲引擎内幕
平衡樹多用于記憶體結構對象中，是以維護的開銷相對較小。

2.B+樹

一顆B+樹要滿足以下特點:

1.有k個子樹其中間的節點就包含了k個元素每個元素不存資料隻是索引(指針) 所有值都儲存在葉子節點中
2.所有的葉子節點都包含了全部的元素資訊，包括指向該元素的指針，同時葉子節點依照關鍵字的大小自小而大連結。
3.所有中間節點元素都同時存在于子節點，在子節點元素中最大(最小)的

簡單概括:
1.子樹個數=非葉子節點數
2.非葉子節點僅是索引不存值可以有重複的元素
3.葉子節點存值用指針連接配接在一起

B+樹 && B+樹索引&&Cardinality值 ----- InnoDB存儲引擎内幕

B+樹 && B+樹索引&&Cardinality值 ----- InnoDB存儲引擎内幕

2.1B+樹的插入情況

插入的時候要保證插入後葉子節點依然排序需要考慮以下三種情況:

B+樹 && B+樹索引&&Cardinality值 ----- InnoDB存儲引擎内幕

舉例分析:

1.插入鍵值28 leaf page& index page都沒有滿符合第一種情況直接插入就可以

B+樹 && B+樹索引&&Cardinality值 ----- InnoDB存儲引擎内幕
2.插入鍵值70 Leaf Page值滿 Index Page未滿符合第二種情況

雖然沒有顯示，依然是雙向連結清單指針存在的

B+樹 && B+樹索引&&Cardinality值 ----- InnoDB存儲引擎内幕
3.插入鍵值95 Leaf Page & Index Page都滿了需要做兩次拆分

B+樹 && B+樹索引&&Cardinality值 ----- InnoDB存儲引擎内幕

為了保持平衡對于新插入的鍵值需要做大量的拆分頁(split)操作。

由于B+樹主要用于磁盤，頁的拆分表示磁盤的操作，是以盡量減少頁的拆分操作。提供了旋轉操作(Rotation)

看一下旋轉發生的條件:

1.Leaf Page已滿左右兄弟節點沒有滿
2.不做拆分而是将記錄移到所在頁的兄弟節點上
示例:插入70

B+樹 && B+樹索引&&Cardinality值 ----- InnoDB存儲引擎内幕

2.2B+樹的删除操作

同樣也是滿足三種情況 B+樹的删除操作同樣也要保證排序，根據其填充因子(fill factor 也就是非葉子節點部分 50%是最小值)的變化而衡量

B+樹 && B+樹索引&&Cardinality值 ----- InnoDB存儲引擎内幕

示例

B+樹 && B+樹索引&&Cardinality值 ----- InnoDB存儲引擎内幕

1.删除鍵值70 符合第一種情況

B+樹 && B+樹索引&&Cardinality值 ----- InnoDB存儲引擎内幕
2.删除鍵值25 同時是Index Page節點

B+樹 && B+樹索引&&Cardinality值 ----- InnoDB存儲引擎内幕
3.删除鍵值60 Fill Factor<50% 删除Index Page後再次需要合并 Index Page

B+樹 && B+樹索引&&Cardinality值 ----- InnoDB存儲引擎内幕

3.B+樹索引

在DB中的特點:高扇出性，B+樹的高度一般都是在2-4層（查找某鍵值隻需要2-4次IO）

B+索引分類

1.聚集索引（clustered index）

聚集索引就是按照每張表的主鍵構造一顆B+樹，而且葉子節點就存放了表的所有行記錄資料，也稱聚集索引的葉子節點是資料頁。每個資料頁都由雙向連結清單進行連結。**每個表隻能有一顆B+數進行排序隻有一個聚集索引 **。

（接下來的表空間存儲分析隻能以後補上了目前還沒弄懂）
2.輔助索引（Secondary Index 非聚集索引）

葉子節點并不包含全部資料。葉子節點包含了鍵值&&書簽（bookmark）書簽帶領指向與索引相對應的行資料

和聚集索引的關系

B+樹 && B+樹索引&&Cardinality值 ----- InnoDB存儲引擎内幕

輔助索引不影響資料在聚集索引中的組織，每張表可以有多個輔助索引。

InnoDB引擎周遊輔助索引找到主鍵索引的主鍵，再通過主鍵索引找到行記錄。

3.1B+樹索引的管理

3.1.1B+樹索引的管理

建立和删除有兩種:1.ALTER TABLE 2.CREATE | DROP INDEX

1.ALTER TABLE

B+樹 && B+樹索引&&Cardinality值 ----- InnoDB存儲引擎内幕
2.CREATE | DROP INDEX

B+樹 && B+樹索引&&Cardinality值 ----- InnoDB存儲引擎内幕

如果要檢視：show index from tb

B+樹 && B+樹索引&&Cardinality值 ----- InnoDB存儲引擎内幕

接下來分析每個參數的具體含義

1.Table:索引所在的表名
2.Non_unique:非唯一索引如果聚集索引(primary key = 0)
3.Key_name:索引名字
4.Seq_in_index:索引中該列的位置
5.Column_name:索引列的名稱
6.Collation:列以什麼方式存儲在索引中。兩種結果 A | NULL A:B+樹索引表示排序的 NULL:如果使用了Heap存儲引擎建立Hash索引顯示NULL.HASH根據Hash桶存放索引資料不對資料排序
7.cardinality :很關鍵的值表示索引中唯一值的數目的估計值。行數應盡可能為1.若非常小考慮是否删除該索引
8.Sup_part:是否是列的部分索引（列隻有部分被索引）NULL:整列被索引
9.Packed：關鍵字如何被壓縮
10.NULL:是否索引列含有NULL值
11.Index_type:索引類型 InnoDB隻支援B+樹顯示為BTREE
12.Comment:注釋

單獨介紹一下Cardinality: 該值優化器根據該值判斷是否使用這個索引問題:不是實時更新（每次更新索引不會更新這個值）建議更新完後使用 ANALYZE TABLE 指令。

1)Cardinality為NULL,在某些情況下可能發生索引建立了确沒有用同樣的語句一種走索引另一種走全表掃描。建議:在非高峰時期，對應用程式下的幾張核心表做ANALYZE TABLE操作。

3.1.2Fast Index Creation(FIC):

一般建索引的DDL操作過程：

B+樹 && B+樹索引&&Cardinality值 ----- InnoDB存儲引擎内幕

總結一下:1)建立臨時表（表結構用alter table實作） 2)把資料導入到tmp表中 3)删原表 4)把臨時表重名為原來的表

這種方式非常繁瑣 — 引入了FIC（快速索引建立）

輔助索引建立|删除流程：

1)存儲引擎對建索引的表上加s鎖不需要删表重建表快速了資料庫可用性得到提高
2)删除輔助索引需要更新内部視圖将輔助索引的空間标記為可用同時删除DB内部視圖上對該表索引定義即可

3.1.3Online Schema Change(有空要做個實驗了！！！)

MySQL 大表線上DML神器–pt-online-schema-change

pt-online-schema-change的實作原理

OSC實作過程:

B+樹 && B+樹索引&&Cardinality值 ----- InnoDB存儲引擎内幕

3.1.4DDL線上操作

MySQL5.6版本支援Online DDL操作，允許輔助索引建立同時還允許其他INSERT DELETE UPDATE (DML)操作

以下幾類DDL可以通過線上方式進行操作：

1.輔助索引的建立和删除
2.改變自增長
3.添加或删除外鍵限制
4.列的重命名

文法:

B+樹 && B+樹索引&&Cardinality值 ----- InnoDB存儲引擎内幕

ALGORITHM:指定了建立或删除索引的算法。

COPY(按照5.1版本前工作即要複制表進行建立删除) INPLACE(不需要建立臨時表) DEFAULT(根據old_alter_table來判斷是通過INPLACE | COPY算法預設值為OFF 使用inplace的方式)

LOCK:索引建立或删除時對表添加鎖的情況。

（1）NONE:執行索引或者删除操作時對目标表不添加任何的鎖即事務仍然可以進行讀寫操作不會收到阻塞。可以獲得最大并發度。

（2）SHARE:類似FIC 建立或删除索引加S鎖。對于并發讀事務依然可以執行遇到寫事務會發生等待操作。如果存儲引擎支援SHARE模式會傳回一個錯誤資訊。

（3）EXCLUSIVE:執行索引建立或删除操作時，對目标表加上一個X鎖讀寫事務不能進行是以會阻塞所有的線程，和COPY方式運作得到的狀态類似，但不需要像COPY方式那樣建立一張臨時表。

（4）DEFAULT:首先判斷目前操作是否可以用NONE模式，不能就判斷是否使用SHARE模式了，最後判斷是否可以使用EXCLUSIVE模式

實作Online DDL的原理：在執行建立或者删除操作的同時，将INSERT UPDATE DELETE這類DML記錄檔寫入到一個緩存中。待完成索引後重新應用到表上，達到資料一緻性。

4.Cardinality值：

添加索引的條件：在通路表中很少使用一部分時使用B+樹索引有意義。具有高選擇性的并且抽取小字段的資料可以建B+樹索引
高選擇性：取值範圍大如姓名 ID等大範圍（低選擇性：取值範圍小如性别字段地區字段類型字段類型字段可取值的範圍很小）

4.1統計Cardinality值：

考慮統計的因素：（1）統計頻率觸發更新為update & insert 更新一次就統計的話頻繁了（2）統計表數量級過大統計時間長不好

更新Cardinality政策：
1.表中1/16的資料已發生過變化
2.stat_modified_counter>2000 000 000(防止更新次數隻在一行若更新了該次數也需要更新統計)

采樣過程預設InnoDB存儲引擎對8個葉子節點進行采樣:

取得B+樹索引中葉子節點的數量記為A
随機取得B+樹索引中的8個葉子節點統計每個頁不同記錄的個數即為P1,P2…P8
根據采樣資訊給出Cardinality的預估值:Cardinality=(P1+P2+…P8)*A/8

可以得到統計采樣值不是精确值可能每次得到的值都不一樣

B+樹 && B+樹索引&&Cardinality值 ----- InnoDB存儲引擎内幕

B+樹 && B+樹索引&&Cardinality值 ----- InnoDB存儲引擎内幕

1.二叉查找樹&平衡二叉樹

2.B+樹

2.1B+樹的插入情況

2.2B+樹的删除操作

3.B+樹索引

3.1B+樹索引的管理

3.1.1B+樹索引的管理

3.1.2Fast Index Creation(FIC):

輔助索引建立|删除流程：

3.1.3Online Schema Change(有空要做個實驗了！！！)

3.1.4DDL線上操作

4.Cardinality值：

4.1統計Cardinality值：

繼續閱讀

資料結構-（2-3樹，2-3-4樹，B-樹，B+樹）1，二叉樹存在問題分析2，多叉樹B樹的介紹3，B+樹

資料結構 —— B樹和B+樹1、B樹2 B+樹

二叉樹的應用---4.B+樹（一）B+樹及其查找：（二）B+樹的插入和删除：

B樹與B+樹B+樹引出什麼是B樹什麼是B+樹B+樹的優點

二叉樹的基本操作（四）——關于B-樹，B+樹，B*樹的概念

MySQL innoDB索引底層原理詳解

輕松了解 MySQL InnoDB 索引、B+樹索引、查詢原理

面試官：MySQL的索引結構為什麼使用B+樹？

mysql索引之b+樹解讀前言索引的資料結構總結參考

Mysql B+數索引分析

第十三章為什麼表資料删掉一半，表檔案大小不變 ?

【資料結構與算法】B樹，B+樹，B*樹是什麼，有什麼差別呢？

為什麼大部分NOSQL資料庫選擇使用LSM樹而非B+樹？LSM Tree架構介紹核心流程LSM-Tree VS B+ Teee

NoSql中的B-tree、B+tree和LSM-tree

【網站高性能 3】----B+樹 vs LSM樹

查找算法 | B+樹詳細分析

B+樹 &amp;&amp; B+樹索引&amp;&amp;Cardinality值 ----- InnoDB存儲引擎内幕

1.二叉查找樹&平衡二叉樹

2.B+樹

2.1B+樹的插入情況

2.2B+樹的删除操作

3.B+樹索引

3.1B+樹索引的管理

3.1.1B+樹索引的管理

3.1.2Fast Index Creation(FIC):

輔助索引建立|删除流程：

3.1.3Online Schema Change(有空要做個實驗了！！！)

3.1.4DDL線上操作

4.Cardinality值：

4.1統計Cardinality值：

繼續閱讀

B+樹 && B+樹索引&&Cardinality值 ----- InnoDB存儲引擎内幕