天天看點

SQL SERVER全面優化-------索引有多重要?

  • 開篇小測驗

  下面這樣一個小SQL 你該怎麼樣添加最優索引

兩個表上現在隻有聚集索引      
bigproduct 表上已經有聚集索引 ProductID      
bigtransactionhistory 表上已經有聚集索引 TransactionID      

  

select p.productnumber,p.reorderpoint,th.Quantity
from bigproduct as p
join bigtransactionhistory as th on th.productid=p.productid and th.TransactionDate > p.SellStartDate
where p.name in ('LL Crankarm1000','ML Crankarm1000') and th.TransactionDate > '2010-01-01'      

  你是否一眼就能看出來呢?

  答案将在文章中逐漸揭曉~~~

  • 簡單粗暴的添加索引

  看過我前面文章的看官們一定會發現我很喜歡用“簡單粗暴”這個詞,一是因為詞彙量小文筆也差,真心用不出高大上的詞兒! 再一個,你們不喜歡簡單粗暴麼~~幹貨最重要,不是麼?

  首先我們看一下沒有優化前的執行計劃

SQL SERVER全面優化-------索引有多重要?
SQL SERVER全面優化-------索引有多重要?

  clustered index scan 這其實就是表掃描,不是table scan 隻是因為表上有聚集索引

  可以看出這個查詢倆表都使用了表掃描!  

  where 條件添加索引

  首先大多數人都知道 where 條件中的字段需要添加索引! 我們添加一下看看效果建立 

  在 bigproduct 表上建立 name 列索引 ,在bigtransactionhistory表上建立 TransactionDate 列索引。

  再次執行語句看一下效果!

SQL SERVER全面優化-------索引有多重要?
SQL SERVER全面優化-------索引有多重要?

  添加where索引以後可以看到以下幾個現象

  1. bigproduct 從原來的clustered index scan 變成 index seek
  2. 另外多出來個KEY Lookup(clustered)
  3. bigproduct 上添加的索引起了作用,邏輯讀bigproduct 由 601 變成 10。
  4. bigtransactionhistory 沒啥變化啊 還是clustered index scan

  解釋一下出現的現象 : 首先一點bigproduct 邊添加的where 條件索引,起到了作用,執行的時候不是全表掃描了,邏輯讀有明顯的下降,出現的 KEY Lookup 是因為選擇(select)的列,在索引中沒有,而需要通過聚集索引再查找一次,再找一次也意味着多一部分開銷!

  那麼同樣添加了where 條件索引的bigtransactionhistory 表為什麼沒起作用呢? 那是因為SQL優化器在選擇計劃的時候認為,不使用TransactionDate 列索引查找效率會更好! 

  真的麼? 我們來驗證一下,通過指定選擇索引,來讓優化器選擇索引查找!

SQL SERVER全面優化-------索引有多重要?
SQL SERVER全面優化-------索引有多重要?

   強制使用索引以後,可以看出邏輯讀由 14W 變成1961W,語句時間也變得很長,這就是優化器為什麼不選用你加的索引!優化器還是很智能的吧。

  高能預警:優化器可不是什麼時候都這麼智能的...由于緩存計劃或優化器抽風等原因,也會出現優化器用了這種索引,導緻你的語句奇慢,讀飙升直接影響到你的記憶體、磁盤、CPU資源!另外如果這樣一條語句是系統中一條很頻繁運作的語句,你的系統就挂了!沒錯就挂了!這就是開篇抛出的問題就是因為一條語句!

  消滅Key Lookup 添加select 字段

   這就是傳說中的覆寫索引! 

   看到執行計劃中存在Key Lookup 而且消耗占比很高,如上面強制索引的計劃,那麼我們就要想到的 在索引中包含那些SELECT 的列!如果消耗低,邏輯讀少,如上面bigproduct 表中的Key Lookup 就可以忽略(如果你追求完美,也一樣優化就可以了)。

   包含列的圖形化建立 : @秋仙 特意給你的說明

   

SQL SERVER全面優化-------索引有多重要?

   語句建立就是 :

SQL SERVER全面優化-------索引有多重要?
CREATE NONCLUSTERED INDEX TransactionDate包含ProductID_Quantity
ON [dbo].[bigTransactionHistory] ([TransactionDate])

------INCLUDE 就是包含列
INCLUDE ([ProductID],[Quantity])
GO      
SQL SERVER全面優化-------索引有多重要?

   下面我們添加一下看看效果 :

SQL SERVER全面優化-------索引有多重要?
SQL SERVER全面優化-------索引有多重要?

  添加select 索引字段後可以看出的現象:

  1. 優化器自己選擇了index seek
  2. bigtransactionhistory占比最高的Key Lookup消失了
  3. 邏輯讀由原來無索引的14W變成1W
  4. bigtransactionhistory表還提示缺少索引?

   通過優化索引添加select 字段,我們看出語句又一次得到了提升 bigtransactionhistory 從表掃描變成索引查找,邏輯讀由14W變成 1W!這是一個質的飛躍啊!

CREATE NONCLUSTERED INDEX TransactionDate包含ProductID_Quantity
ON [dbo].[bigTransactionHistory] ([TransactionDate])

------INCLUDE 就是包含列
INCLUDE ([ProductID],[Quantity])
GO      

   那為什麼還提示缺少索引呢? 建立一下試試吧!

  索引再優化加入表關聯列

  按照提示我們建立索引 : 和上一個索引的不同 ProductID 列由包含列變成了索引列!

USE [AdventureWorks2012]
GO
CREATE NONCLUSTERED INDEX ProductID_TransactionDate包含Quantity
ON [dbo].[bigTransactionHistory] ([ProductID],[TransactionDate])
INCLUDE ([Quantity])      

  我們看一下效果:

SQL SERVER全面優化-------索引有多重要?
SQL SERVER全面優化-------索引有多重要?

  再次優化索引以後可以看到以下幾個現象

  1. bigtransactionhistory表還是索引查找index seek
  2. bigtransactionhistory依然沒有了Key Lookup
  3. 兩表關聯的hash join 變成了nested loops
  4. 并行計劃變成了串行
  5. 邏輯讀又從1W 變成18

  又一次質的飛躍!讀從原來的14W 變成1W 又變成18,這樣大大減少了記憶體和IO的消耗,另外并行計劃也變成了串行,無疑又減少了大量CPU的消耗!語句時間,我想這裡就不用多說了吧?

  高能預警:這裡所說的hash join,并行變串行,不懂的朋友可以在百度自行學習,這裡隻是針對目前語句的情況,不能一概而論!

  精簡你的索引

  大家都知道,索引會導緻update、insert、delete操作變慢!那麼盡量精簡你的索引就是一個很重要的話題了!

   上面的優化過程中我們建立了幾個索引,以bigTransactionHistory為例來看一下:

SQL SERVER全面優化-------索引有多重要?

   腳本這裡就不貼了,其實我們最後建立的索引 ProductID_TransactionDate包含Quantity 已經包含了前兩個索引,而且可以說無論任何類似語句都使用ProductID_TransactionDate包含Quantity 就可以了!