如何正确建立MYSQL資料庫索引
索引是快速搜尋的關鍵。MySQL索引的建立對于MySQL的高效運作是很重要的。下面介紹幾種常見的MySQL索引類型。
在資料庫表中,對字段建立索引可以大大提高查詢速度。假如我們建立了一個 mytable表:
CREATE TABLE mytable( ID INT NOT NULL, username VARCHAR(16) NOT NULL ); 我們随機向裡面插入了10000條記錄,其中有一條:5555, admin。
在查找username="admin"的記錄 SELECT * FROM mytable WHERE username=‘admin’;時,如果在username上已經建立了索引,MySQL無須任何掃描,即準确可找到該記錄。相反,MySQL會掃描所有記錄,即要查詢10000條記錄。
索引分單列索引群組合索引。單列索引,即一個索引隻包含單個列,一個表可以有多個單列索引,但這不是組合索引。組合索引,即一個索引包含多個列。
MySQL索引類型包括:
(1)普通索引
這是最基本的索引,它沒有任何限制。它有以下幾種建立方式:
◆建立索引
CREATE INDEX indexName ON mytable(username(length)); 如果是CHAR,VARCHAR類型,length可以小于字段實際長度;如果是BLOB和TEXT類型,必須指定 length,下同。
◆修改表結構
ALTER mytable ADD INDEX [indexName] ON (username(length))
◆建立表的時候直接指定
CREATE TABLE mytable( ID INT NOT NULL, username VARCHAR(16) NOT NULL, INDEX [indexName] (username(length)) );
删除索引的文法:
DROP INDEX [indexName] ON mytable;
(2)唯一索引
它與前面的普通索引類似,不同的就是:索引列的值必須唯一,但允許有空值。如果是組合索引,則列值的組合必須唯一。它有以下幾種建立方式:
◆建立索引
CREATE UNIQUE INDEX indexName ON mytable(username(length))
◆修改表結構
ALTER mytable ADD UNIQUE [indexName] ON (username(length))
◆建立表的時候直接指定
CREATE TABLE mytable( ID INT NOT NULL, username VARCHAR(16) NOT NULL, UNIQUE [indexName] (username(length)) );
(3)主鍵索引
它是一種特殊的唯一索引,不允許有空值。一般是在建表的時候同時建立主鍵索引:
CREATE TABLE mytable( ID INT NOT NULL, username VARCHAR(16) NOT NULL, PRIMARY KEY(ID) ); 當然也可以用 ALTER 指令。記住:一個表隻能有一個主鍵。
(4)組合索引
為了形象地對比單列索引群組合索引,為表添加多個字段:
CREATE TABLE mytable( ID INT NOT NULL, username VARCHAR(16) NOT NULL, city VARCHAR(50) NOT NULL, age INT NOT NULL ); 為了進一步榨取MySQL的效率,就要考慮建立組合索引。就是将 name, city, age建到一個索引裡:
ALTER TABLE mytable ADD INDEX name_city_age (name(10),city,age); 建表時,usernname長度為 16,這裡用 10。這是因為一般情況下名字的長度不會超過10,這樣會加速索引查詢速度,還會減少索引檔案的大小,提高INSERT的更新速度。
如果分别在 usernname,city,age上建立單列索引,讓該表有3個單列索引,查詢時和上述的組合索引效率也會大不一樣,遠遠低于我們的組合索引。雖然此時有了三個索引,但MySQL隻能用到其中的那個它認為似乎是最有效率的單列索引。
建立這樣的組合索引,其實是相當于分别建立了下面三組組合索引:
usernname,city,age usernname,city usernname 為什麼沒有 city,age這樣的組合索引呢?這是因為MySQL組合索引“最左字首”的結果。簡單的了解就是隻從最左面的開始組合。并不是隻要包含這三列的查詢都會用到該組合索引,下面的幾個SQL就會用到這個組合索引:
SELECT * FROM mytable WHREE username=“admin” AND city=“鄭州”
SELECT * FROM mytable WHREE username=“admin”
而下面幾個則不會用到:
SELECT * FROM mytable WHREE age=20 AND city=“鄭州”
SELECT * FROM mytable WHREE city=“鄭州”
比如有一條語句是這樣的:select * from users where area=’beijing’ and age=22;
如果我們是在area和age上分别建立單個索引的話,由于mysql查詢每次隻能使用一個索引,是以雖然這樣已經相對不做索引時全表掃描提高了很多效率,但是如果在area、age兩列上建立複合索引的話将帶來更高的效率。
如果我們建立了 (area, age,salary)的複合索引,那麼其實相當于建立了 (area,age,salary)、(area,age)、(area)三個索引,這被稱為“最佳左字首”特性。是以我們在建立複合索引時應該将最常用作限制條件的列放在最左邊,依次遞減。
(5)建立索引的時機
到這裡我們已經學會了建立索引,那麼我們需要在什麼情況下建立索引呢?一般來說,在WHERE和JOIN中出現的列需要建立索引,但也不完全如此,因為MySQL隻對<,<=,=,>,>=,BETWEEN,IN,以及某些時候的LIKE才會使用索引。例如:
SELECT t.Name FROM mytable t LEFT JOIN mytable m ON t.Name=m.username WHERE m.age=20 AND m.city=‘鄭州’ 此時就需要對city和age建立索引,由于mytable表的userame也出現在了JOIN子句中,也要對它建立索引的必要。
剛才提到隻有某些時候的LIKE才需建立索引。因為在以通配符%和_開頭作查詢時,MySQL不會使用索引。例如下句會使用索引:
SELECT * FROM mytable WHERE username like’admin%’
而下句就不會使用:
SELECT * FROM mytable WHEREt Name like’%admin’ 是以,在使用LIKE時應注意以上的差別。
對于查詢占主要的應用來說,索引顯得尤為重要。很多時候性能問題很簡單的就是因為我們忘了添加索引而造成的,或者說沒有添加更為有效的索引導緻。如果不加
索引的話,那麼查找任何哪怕隻是一條特定的資料都會進行一次全表掃描,如果一張表的資料量很大而符合條件的結果又很少,那麼不加索引會引起緻命的性能下
降。但是也不是什麼情況都非得建索引不可,比如性别可能就隻有兩個值,建索引不僅沒什麼優勢,還會影響到更新速度,這被稱為過渡索引。
(6)索引的不足之處
上面都在說使用索引的好處,但過多的使用索引将會造成濫用。是以索引也會有它的缺點:
◆雖然索引大大提高了查詢速度,但同時卻會降低更新表的速度,如對表進行INSERT、UPDATE和DELETE。因為更新表時,MySQL不僅要儲存資料,還要儲存一下索引檔案。
◆建立索引會占用磁盤空間的索引檔案。一般情況這個問題不太嚴重,但如果你在一個大表上建立了多種組合索引,索引檔案就會膨脹的很快。
索引隻是提高效率的一個因素,如果你的MySQL有大資料量的表,就需要花時間研究建立最優秀的索引,或優化查詢語句。
(7)使用索引的注意事項
使用索引時,有以下一些技巧和注意事項:
◆索引不會包含有NULL值的列
隻要列中包含有NULL值都将不會被包含在索引中,複合索引中隻要有一列含有NULL值,那麼這一列對于此複合索引就是無效的。是以我們在資料庫設計時不要讓字段的預設值為NULL。
◆使用短索引
對串列進行索引,如果可能應該指定一個字首長度。例如,如果有一個CHAR(255)的列,如果在前10個或20個字元内,多數值是惟一的,那麼就不要對整個列進行索引。短索引不僅可以提高查詢速度而且可以節省磁盤空間和I/O操作。
◆索引列排序
Mysql查詢每次隻能使用一個索引,是以如果where子句中已經使用了索引的話,那麼order by中的列是不會使用索引的。是以資料庫預設排序可以符合要求的情況下不要使用排序操作;盡量不要包含多個列的排序,如果需要最好給這些列建立複合索引。
◆like語句操作
一般情況下不鼓勵使用like操作,如果非使用不可,如何使用也是一個問題。like “%aaa%” 不會使用索引,而like “aaa%”可以使用索引。
◆不要在列上進行運算
select * from users where YEAR(adddate)<2007; 将在每個行上進行運算,這将導緻索引失效而進行全表掃描,是以我們可以改成:
select * from users where adddate<‘2007-01-01’;
◆不使用NOT IN和<>操作
以上,就對其中MySQL索引類型進行了介紹。
######################################################################################################################
表的主鍵
自動建立唯一索引
如zl_yhjbqk(使用者基本情況)中的hbs_bh(戶辨別編号)
表的字段唯一限制
ORACLE利用索引來保證資料的完整性
如lc_hj(流程環節)中的lc_bh+hj_sx(流程編号+環節順序)
直接條件查詢的字段
在SQL中用于條件限制的字段
如zl_yhjbqk(使用者基本情況)中的qc_bh(區冊編号)
select * from zl_yhjbqk where qc_bh=<2000 and qc_bh>=5000;
查詢中與其它表關聯的字段
字段常常建立了外鍵關系
如zl_ydcf(用電成份)中的jldb_bh(計量點表編号)
select * from zl_ydcf a,zl_yhdb b where a.jldb_bh=b.jldb_bh and b.jldb_bh=’540100214511’
查詢中排序的字段
排序的字段如果通過索引去通路那将大大提高排序速度
select * from zl_yhjbqk order by qc_bh(建立qc_bh索引)
select * from zl_yhjbqk where qc_bh=’7001’ order by cb_sx(建立qc_bh+cb_sx複合索引,注:隻是一個索引,其中包括qc_bh和cb_sx字段)
查詢中統計或分組統計的字段
select max(hbs_bh) from zl_yhjbqk
select qc_bh,count(*) from zl_yhjbqk group by qc_bh
什麼情況下應不建或少建索引
表記錄太少
如果一個表隻有5條記錄,采用索引去通路記錄的話,那首先需通路索引表,再通過索引表通路資料表,一般索引表與資料表不在同一個資料塊,這種情況下ORACLE至少要往返讀取資料塊兩次。而不用索引的情況下ORACLE會将所有的資料一次讀出,處理速度顯然會比用索引快。
如表zl_sybm(使用部門)一般隻有幾條記錄,除了主鍵外對任何一個字段建索引都不會産生性能優化,實際上如果對這個表進行了統計分析後ORACLE也不會用你建的索引,而是自動執行全表通路。如:
select * from zl_sybm where sydw_bh=’5401’(對sydw_bh建立索引不會産生性能優化)
經常插入、删除、修改的表
對一些經常處理的業務表應在查詢允許的情況下盡量減少索引,如 zl_yhbm,gc_dfss,gc_dfys,gc_fpdy等業務表。
資料重複且分布平均的表字段(如:性别字段)
假如一個表有10萬行記錄,有一個字段A隻有T和F兩種值,且每個值的分布機率大約為 50%,那麼對這種表A字段建索引一般不會提高資料庫的查詢速度。
經常和主字段一塊查詢但主字段索引值比較多的表字段
如gc_dfss(電費實收)表經常按收費序号、使用者辨別編号、抄表日期、電費發生年月、操作 标志來具體查詢某一筆收款的情況,如果将所有的字段都建在一個索引裡那将會增加資料的修改、插入、删除時間,從實際上分析一筆收款如果按收費序号索引就已 經将記錄減少到隻有幾條,如果再按後面的幾個字段索引查詢将對性能不産生太大的影響。
對千萬級MySQL資料庫建立索引的事項及提高性能的手段
一、注意事項:
首先,應當考慮表空間和磁盤空間是否足夠。我們知道索引也是一種資料,在建立索引的時候勢必也會占用大量表空間。是以在對一大表建立索引的時候首先應當考慮的是空間容量問題。
其次,在對建立索引的時候要對表進行加鎖,是以應當注意操作在業務空閑的時候進行。
二、性能調整方面:
首當其沖的考慮因素便是磁盤I/O。實體上,應當盡量把索引與資料分散到不同的磁盤上(不考慮陣列的情況)。邏輯上,資料表空間與索引表空間分開。這是在建索引時應當遵守的基本準則。
其次,我們知道,在建立索引的時候要對表進行全表的掃描工作,是以,應當考慮調大初始化參數 db_file_multiblock_read_count的值。一般設定為32或更大。
再次,建立索引除了要進行全表掃描外同時還要對資料進行大量的排序操作,是以,應當調整排序區的大小。
9i之前,可以在session級别上加大sort_area_size的大小,比如設定為100m或者更大。
9i以後,如果初始化參數workarea_size_policy的值為TRUE,則排序區從pga_aggregate_target裡自動配置設定獲得。
最後,建立索引的時候,可以加上nologging選項。以減少在建立索引過程中産生的大量 redo,進而提高執行的速度。
######################################################################################################################
一般來說,以下的欄位都必須記得加上索引:
1、關聯查詢的外鍵字段要加索引(Foreign key)
2、會被排序的欄位(被放在order方法中)
3、會被查詢的欄位(被放在where方法中)
4、會被group的欄位(被放在group方法中)
寫少讀多就多建索引, 寫多讀少就少建索引, 資料量少就不建索引。
設計好MySql的索引可以讓你的資料庫飛起來,大大的提高資料庫效率。