下面分别建立三張表,并分别插入1W條簡單的資料用來測試,詳情如下:
[1] test_a 有主鍵但無索引
CREATE TABLE `test_a` (
`id` int(10) unsigned NOT NULL AUTO_INCREMENT,
`title` varchar(100) NOT NULL,
`content` text NOT NULL,
`number` int(10) unsigned NOT NULL,
PRIMARY KEY (`id`)
) ENGINE=InnoDB AUTO_INCREMENT=0 DEFAULT CHARSET=utf8;
[2] test_b 有主鍵和單列索引
CREATE TABLE `test_b` (
`id` int(10) unsigned NOT NULL AUTO_INCREMENT,
`title` varchar(100) NOT NULL,
`content` text NOT NULL,
`number` int(10) unsigned NOT NULL,
PRIMARY KEY (`id`),
UNIQUE KEY `titleIndex` (`title`) USING BTREE,
UNIQUE KEY `numberIndex` (`number`) USING BTREE
) ENGINE=InnoDB AUTO_INCREMENT=0 DEFAULT CHARSET=utf8;
[3] test_c 有主鍵群組合索引
CREATE TABLE `test_c` (
`id` int(10) unsigned NOT NULL AUTO_INCREMENT,
`title` varchar(100) NOT NULL,
`content` text NOT NULL,
`number` int(10) unsigned NOT NULL,
PRIMARY KEY (`id`),
KEY `titleNumberIndex` (`title`,`number`) USING BTREE
) ENGINE=InnoDB AUTO_INCREMENT=0 DEFAULT CHARSET=utf8;
下面按照單列索引群組合索引分别對以上三張表進行查詢測試,另外下面的時間都是多次測試取的平均值。
[1] 單列索引
[1.1] 查詢指定的字段
[SQL] SELECT * FROM test_a WHERE title = 'title_5000';
[USE] 12ms
[SQL] SELECT * FROM test_b WHERE title = 'title_5000';
[USE] <1ms
說明:可以看到未加索引時間為12ms,加索引後小于1ms,還是相差很大的。
[SQL] SELECT * FROM test_a WHERE content = 'content_5000';
[USE] 13ms
[SQL] SELECT * FROM test_b WHERE content = 'content_5000';
[USE] 13ms
說明:由于content字段都未加索引,是以時間基本一緻。
[1.2] 測試LIKE查詢
[SQL] SELECT * FROM test_a WHERE title LIKE '%5000';
[USE] 13ms
[SQL] SELECT * FROM test_b WHERE title LIKE '%5000';
[USE] 13ms
說明:兩者用時基本一緻,是以索引并未命中。
[SQL] SELECT * FROM test_a WHERE title LIKE '5000%';
[USE] 12ms
[SQL] SELECT * FROM test_b WHERE title LIKE '5000%';
[USE] <1ms
說明:如果LIKE是字首比對則會命中索引,否則不會命中。另外以上的查詢結果為空,但是不影響說明索引的作用。
[1.3] 測試OR語句
[SQL] SELECT * FROM test_a WHERE title = 'title_5000' OR content = 'content_5000';
[USE] 13ms
[SQL] SELECT * FROM test_b WHERE title = 'title_5000' OR content = 'content_5000';
[USE] 13ms
說明:兩者用時基本一緻,是以索引并未命中。
[SQL] SELECT * FROM test_a WHERE title = 'title_5000' OR number = '5000';
[USE] 13ms
[SQL] SELECT * FROM test_b WHERE title = 'title_5000' OR number = '5000';
[USE] <1ms
說明:如果OR兩邊的字段都加索引則命中,否則隻有一個加索引則不命中。
[1.4] 測試IN語句
[SQL] SELECT * FROM test_a WHERE title IN('title_4999','title_5000','title_5001');
[USE] 12ms
[SQL] SELECT * FROM test_b WHERE title IN('title_4999','title_5000','title_5001');
[USE] <1ms
說明:IN語句也是可以命中索引的。
[1.5] 測試(BETWEEN,>,>=,
[SQL] SELECT * FROM test_a WHERE number <= 5000;
[USE] 14ms
[SQL] SELECT * FROM test_b WHERE number <= 5000;
[USE] 14ms
[SQL] SELECT * FROM test_a WHERE number < 5000;
[USE] 14ms
[SQL] SELECT * FROM test_b WHERE number < 5000;
[USE] 14ms
[SQL] SELECT * FROM test_a WHERE number > 5000;
[USE] 14ms
[SQL] SELECT * FROM test_b WHERE number > 5000;
[USE] 14ms
[SQL] SELECT * FROM test_a WHERE number >= 5000;
[USE] 14ms
[SQL] SELECT * FROM test_b WHERE number >= 5000;
[USE] 14ms
[SQL] SELECT * FROM test_b FORCE INDEX(numberIndex) WHERE number >= 5000;
[USE] 14ms
[SQL] SELECT * FROM test_a WHERE number BETWEEN 4999 AND 5001;
[USE] 11ms
[SQL] SELECT * FROM test_b WHERE number BETWEEN 4999 AND 5001;
[USE] <1ms
說明:BETWEEN可以命中索引,其他比較符号未命中索引,強制使用索引效果也不明顯,這個應該是與MySQL的索引足夠性判斷,如果索引大于30%就會使用全表掃描,具體待我查證後再詳細介紹。
[1.6] 字段使用函數
[SQL] SELECT * FROM test_a WHERE SUBSTR(title,7,4) = '5000';
[USE] 13ms
[SQL] SELECT * FROM test_b WHERE SUBSTR(title,7,4) = '5000';
[USE] 13ms
說明:對字段使用函數則不能命中索引。
[2] 組合索引
[2.1] 測試OR語句
[SQL] SELECT * FROM test_a WHERE title = 'title_5000' OR content = 'content_5000';
[USE] 13ms
[SQL] SELECT * FROM test_c WHERE title = 'title_5000' OR content = 'content_5000';
[USE] 13ms
說明:組合索引中的OR語句沒有命中索引。
[2.2] 測試AND語句
[SQL] SELECT * FROM test_a WHERE title = 'title_5000' AND number = 5000;
[USE] 12ms
[SQL] SELECT * FROM test_c WHERE title = 'title_5000' AND number = 5000;
[USE] <1ms
[SQL] SELECT * FROM test_a WHERE number = 5000;
[USE] 12ms
[SQL] SELECT * FROM test_c WHERE number = 5000;
[USE] 12ms
[SQL] SELECT * FROM test_a WHERE title = 'title_5000';
[USE] 12ms
[SQL] SELECT * FROM test_c WHERE title = 'title_5000';
[USE] <1ms
說明:以上證明了最左字首比對原則。
MySQL中EXPLAIN解釋指令
EXPLAIN指令顯示了mysql如何使用索引來處理select語句以及連接配接表。可以幫助選擇更好的索引和寫出更優化的查詢語句。
使用方法,在select語句前加上explain就可以了,如:
1
explain select surname,first_name form a,b where a.id=b.id
EXPLAIN列的解釋:
table:顯示這一行的資料是關于哪張表的
type:這是重要的列,顯示連接配接使用了何種類型。從最好到最差的連接配接類型為const、eq_reg、ref、range、indexhe和ALL
possible_keys:顯示可能應用在這張表中的索引。如果為空,沒有可能的索引。可以為相關的域從WHERE語句中選擇一個合适的語句
key:實際使用的索引。如果為NULL,則沒有使用索引。很少的情況下,MYSQL會選擇優化不足的索引。這種情況下,可以在SELECT語句中使用USE INDEX(indexname)來強制使用一個索引或者用IGNORE INDEX(indexname)來強制MYSQL忽略索引
key_len:使用的索引的長度。在不損失精确性的情況下,長度越短越好
ref:顯示索引的哪一列被使用了,如果可能的話,是一個常數
rows:MYSQL認為必須檢查的用來傳回請求資料的行數
Extra:關于MYSQL如何解析查詢的額外資訊。将在表4.3中讨論,但這裡可以看到的壞的例子是Using temporary和Using filesort,意思MYSQL根本不能使用索引,結果是檢索會很慢
extra列傳回的描述的意義
Distinct:一旦MYSQL找到了與行相聯合比對的行,就不再搜尋了
Not exists: MYSQL優化了LEFT JOIN,一旦它找到了比對LEFT JOIN标準的行,就不再搜尋了
Range checked for each Record(index map:#):沒有找到理想的索引,是以對于從前面表中來的每一個行組合,MYSQL檢查使用哪個索引,并用它來從表中傳回行。這是使用索引的最慢的連接配接之一
Using filesort: 看到這個的時候,查詢就需要優化了。MYSQL需要進行額外的步驟來發現如何對傳回的行排序。它根據連接配接類型以及存儲排序鍵值和比對條件的全部行的行指針來排序全部行
Using index: 列資料是從僅僅使用了索引中的資訊而沒有讀取實際的行動的表傳回的,這發生在對表的全部的請求列都是同一個索引的部分的時候
Using temporary 看到這個的時候,查詢需要優化了。這裡,MYSQL需要建立一個臨時表來存儲結果,這通常發生在對不同的列集進行ORDER BY上,而不是GROUP BY上
Where used 使用了WHERE從句來限制哪些行将與下一張表比對或者是傳回給使用者。如果不想傳回表中的全部行,并且連接配接類型ALL或index,這就會發生,或者是查詢有問題不同連接配接類型的解釋(按照效率高低的順序排序)
system 表隻有一行:system表。這是const連接配接類型的特殊情況
const:表中的一個記錄的最大值能夠比對這個查詢(索引可以是主鍵或惟一索引)。因為隻有一行,這個值實際就是常數,因為MYSQL先讀這個值然後把它當做常數來對待
eq_ref:在連接配接中,MYSQL在查詢時,從前面的表中,對每一個記錄的聯合都從表中讀取一個記錄,它在查詢使用了索引為主鍵或惟一鍵的全部時使用
ref:這個連接配接類型隻有在查詢使用了不是惟一或主鍵的鍵或者是這些類型的部分(比如,利用最左邊字首)時發生。對于之前的表的每一個行聯合,全部記錄都将從表中讀出。這個類型嚴重依賴于根據索引比對的記錄多少—越少越好
range:這個連接配接類型使用索引傳回一個範圍中的行,比如使用>或
index: 這個連接配接類型對前面的表中的每一個記錄聯合進行完全掃描(比ALL更好,因為索引一般小于表資料)
ALL:這個連接配接類型對于前面的每一個記錄聯合進行完全掃描,這一般比較糟糕,應該盡量避免