大資料幹貨 SQL優化方案精解十則

一、避免進行null判斷

應盡量避免在 where 子句中對字段進行 null 值判斷，否則将導緻引擎放棄使用索引而進行全表掃描，這裡最好不要給資料庫留NULL，盡可能的使用 NOT NULL填充資料庫。

備注、描述、評論之類的可以設定為 NULL，最好不要使用NULL。不要錯誤的認為NULL 不需要空間，如char(100) 型，在字段建立時，空間就固定了。不管是否插入值（NULL也包含在内），都是占用 100個字元的空間的，如果是varchar這樣的變長字段， null 不占用空間。可以在num上設定預設值0，確定表中num列沒有null值。

二、不要使用select *

使用select *的話會增加解析的時間，另外也會把不需要的資料同時查詢出來，進而延長資料傳輸時間，耗費精力。如text類型的字段，通常用來儲存一些内容比較繁雜的東西，如果使用select *，則會把該字段也查詢出來。

三、謹慎使用模糊查詢

當模糊比對以%開頭時，該列索引将失效。若不以%開頭，該列索引有效。

四、不要使用列号

使用列号的話，将會增加不必要的解析時間。

五、優先使用UNION ALL，避免使用UNION

因為UNION 會将各查詢子集的記錄做比較，故比起UNION ALL ，通常速度都會慢上許多。一般來說，如果使用UNION ALL能滿足要求的話，務必使用UNION ALL。還有一種情況，如果業務上能夠確定不會出現重複記錄。

六、在where語句或者order by語句中避免對索引字段進行計算操作

當在索引列上進行操作之後，索引将會失效。正确做法應該是将值計算好再傳入進來。

七、使用not exist代替not in

如果查詢語句使用了not in 那麼内外表都進行全表掃描，沒有用到索引；而not extsts 的子查詢依然能用到表上的索引。

八、exist和in的差別

in 是把外表和内表作hash 連接配接，而exists是對外表作loop循環，每次loop循環

再對内表進行查詢。是以，in用到的是外表的索引， exists用到的是内表的索引。如果查詢的兩個表大小相當，那麼用in和exists差别不大。如果兩個表中一個較小，一個是大表，則子查詢表大的用exists，子查詢表小的用in。

九、避免在索引列上做如下操作

1.避免在索引列上使用IS NULL和IS NOT NULL。
2.避免在索引列上出現資料類型轉換。（比如某字段是String類型，參數傳入時是int類型）當在索引列上使用如上操作時，索引将會失效，造成全表掃描。

十、複雜操作可以考慮适當拆成幾步

有時候會有通過一個SQL語句來實作複雜業務的例子出現，為了實作複雜的業務，嵌套多級子查詢。造成SQL性能問題。對于這種情況可以考慮拆分SQL，通過多個SQL語句實作，或者把部分程式能完成的工作交給程式完成。

大資料幹貨 SQL優化方案精解十則

繼續閱讀

Linxu常用指令技巧彙總

ERROR 1 (HY000): Can't create/write to file '/tmp/#sql_4188_1.MYI' (Errcode: 28)

艱難安裝LDAP,SSL認證

《Linux指令行與Shell腳本程式設計大全第2版.布盧姆》pdf

MySQL的4種隔離級别？出現問題

XX系統實施過程問題總結

無元件上傳圖檔到資料庫中，最完整解決方案

【MySQL資料庫】資料庫索引事務1.索引2.事務

neo4j之cypher使用文檔

Ambari介紹和架構原理

NOSQL安全攻擊

mybatis_入門程式Mybatis入門

登入plsql 報錯 the account is locked --使用者被鎖

sqlServer根據經緯查距離

SequoiaDB巨杉資料庫C++驅動概述

win10本地scala和spark安裝安裝scala安裝spark