天天看點

mysql分表 查詢 優化_MySQL性能管理及架構(查詢優化、分庫分表)一遍文章搞定...

相關配置參數:

slow_query_log # 啟動停止記錄慢查日志,慢查詢日志預設是沒有開啟的可以在配置檔案中開啟(on)

slow_query_log_file # 指定慢查日志的存儲路徑及檔案,日志存儲和資料從存儲應該分開存儲

long_query_time # 指定記錄慢查詢日志SQL執行時間的閥值預設值為10秒通常,對于一個繁忙的系統來說,改為0.001秒(1毫秒)比較合适

log_queries_not_using_indexes #是否記錄未使用索引的SQL

複制代碼

常用工具: mysqldumpslow 和 pt-query-digest

pt-query-digest --explain h=127.0.0.1,u=root,[email protected] slow-mysql.log

複制代碼

1.1.3 實時擷取有性能問題的SQL(推薦)

mysql分表 查詢 優化_MySQL性能管理及架構(查詢優化、分庫分表)一遍文章搞定...

SELECT id,user,host,DB,command,time,state,info

FROM information_schema.processlist

WHERE TIME>=60

複制代碼

查詢目前 伺服器 執行超過60s的SQL,可以通過腳本周期性的來執行這條SQL,就能查出有問題的SQL。

1.2 SQL的解析預處理及生成執行計劃(重要)

1.2.1 查詢過程描述(重點!!!)

mysql分表 查詢 優化_MySQL性能管理及架構(查詢優化、分庫分表)一遍文章搞定...

通過上圖可以清晰的了解到 MySql 查詢執行的大緻過程:

1.發送SQL語句。

2.查詢緩存,如果命中緩存直接傳回結果。

3.SQL解析,預處理,再由優化器生成對應的查詢執行計劃。

4.執行查詢,調用存儲引擎API擷取資料。

5.傳回結果。

1.2.2 查詢緩存對性能的影響(建議關閉緩存)

第一階段:

相關配置參數:

query_cache_type # 設定查詢緩存是否可用

query_cache_size # 設定查詢緩存的記憶體大小

query_cache_limit # 設定查詢緩存可用的存儲最大值(加上sql_no_cache可以提高效率)

query_cache_wlock_invalidate # 設定資料表被鎖後是否傳回緩存中的資料

query_cache_min_res_unit # 設定查詢緩存配置設定的記憶體塊的最小單

複制代碼

緩存查找是利用對大小寫敏感的哈希查找來實作的,Hash查找隻能進行全值查找(sql完全一緻),

如果緩存命中,檢查使用者權限,如果權限允許,直接傳回,查詢不被解析,也不會生成查詢計劃。

複制代碼

在一個讀寫比較頻繁的系統中,建議 關閉緩存 ,因為緩存更新會加鎖。将 query_cache_type 設定為 off , query_cache_size 設定為 0 。

1.2.3 第二階段:MySQL依照執行計劃和存儲引擎進行互動

這個階段包括了多個子過程:

mysql分表 查詢 優化_MySQL性能管理及架構(查詢優化、分庫分表)一遍文章搞定...
mysql分表 查詢 優化_MySQL性能管理及架構(查詢優化、分庫分表)一遍文章搞定...
mysql分表 查詢 優化_MySQL性能管理及架構(查詢優化、分庫分表)一遍文章搞定...

一條查詢可以有多種查詢方式,查詢優化器會對每一種查詢方式的(存儲引擎)統計資訊進行比較,找到成本最低的查詢方式,這也就是索引不能太多的原因。

1.3 會造成MySQL生成錯誤的執行計劃的原因

1、統計資訊不準确

2、成本估算與實際的執行計劃成本不同

mysql分表 查詢 優化_MySQL性能管理及架構(查詢優化、分庫分表)一遍文章搞定...

3、給出的最優執行計劃與估計的不同

mysql分表 查詢 優化_MySQL性能管理及架構(查詢優化、分庫分表)一遍文章搞定...

4、MySQL不考慮并發查詢

5、會基于固定規則生成執行計劃

6、MySQL不考慮不受其控制的成本,如存儲過程,使用者自定義函數

1.4 MySQL優化器可優化的SQL類型

查詢優化器:對查詢進行優化并查詢mysql認為的成本最低的執行計劃。

為了生成最優的執行計劃,查詢優化器會對一些查詢進行改寫

複制代碼

可以優化的sql類型

1、重新定義表的關聯順序;

mysql分表 查詢 優化_MySQL性能管理及架構(查詢優化、分庫分表)一遍文章搞定...

2、将外連接配接轉換為内連接配接;

3、使用等價變換規則;

mysql分表 查詢 優化_MySQL性能管理及架構(查詢優化、分庫分表)一遍文章搞定...

4、優化count(),min(),max();

mysql分表 查詢 優化_MySQL性能管理及架構(查詢優化、分庫分表)一遍文章搞定...

5、将一個表達式轉換為常數;

6、子查詢優化;

mysql分表 查詢 優化_MySQL性能管理及架構(查詢優化、分庫分表)一遍文章搞定...

7、提前終止查詢,如發現一個不成立條件(如where id = -1),立即傳回一個空結果;

8、對in()條件進行優化;

1.5 查詢處理各個階段所需要的時間

1.5.1 使用profile(目前已經不推薦使用了)

set profiling = 1; #啟動profile,這是一個session級的配制執行查詢

show profiles; # 查詢每一個查詢所消耗的總時間的資訊

show profiles for query N; # 查詢的每個階段所消耗的時間

1.5.2 performance_schema是5.5引入的一個性能分析引擎(5.5版本時期開銷比較大)

啟動監控和曆史記錄表: use performance_schema

update setup_instruments set enabled='YES',TIME = 'YES' WHERE NAME LIKE 'stage%';

update set_consumbers set enabled='YES',TIME = 'YES' WHERE NAME LIKE 'event%';

複制代碼

mysql分表 查詢 優化_MySQL性能管理及架構(查詢優化、分庫分表)一遍文章搞定...
mysql分表 查詢 優化_MySQL性能管理及架構(查詢優化、分庫分表)一遍文章搞定...

1.6 特定SQL的查詢優化

1.6.1 大表的資料修改

mysql分表 查詢 優化_MySQL性能管理及架構(查詢優化、分庫分表)一遍文章搞定...
mysql分表 查詢 優化_MySQL性能管理及架構(查詢優化、分庫分表)一遍文章搞定...

1.6.2 大表的結構修改

mysql分表 查詢 優化_MySQL性能管理及架構(查詢優化、分庫分表)一遍文章搞定...

1.利用主從複制,先對從伺服器進入修改,然後主從切換

2.(推薦)

添加一個新表(修改後的結構),老表資料導入新表,老表建立觸發器,修改資料同步到新表,

老表加一個排它鎖(重命名), 新表重命名, 删除老表。

複制代碼

mysql分表 查詢 優化_MySQL性能管理及架構(查詢優化、分庫分表)一遍文章搞定...

修改語句這個樣子:

alter table sbtest4 modify c varchar(150) not null default ''

複制代碼

利用 工具 修改:

mysql分表 查詢 優化_MySQL性能管理及架構(查詢優化、分庫分表)一遍文章搞定...

1.6.3 優化not in 和 <> 查詢

子查詢改寫為關聯查詢:

mysql分表 查詢 優化_MySQL性能管理及架構(查詢優化、分庫分表)一遍文章搞定...

二、分庫分表

2.1 分庫分表的幾種方式

分擔讀負載 可通過 一主多從,更新硬體來解決。

複制代碼

2.1.1 把一個執行個體中的多個 資料庫 拆分到不同執行個體(叢集)

mysql分表 查詢 優化_MySQL性能管理及架構(查詢優化、分庫分表)一遍文章搞定...

拆分簡單,不允許跨庫。但并不能減少寫負載

複制代碼

2.1.2 把一個庫中的表分離到不同的資料庫中

mysql分表 查詢 優化_MySQL性能管理及架構(查詢優化、分庫分表)一遍文章搞定...

該方式隻能在一定時間内減少寫壓力。

以上兩種方式隻能暫時解決讀寫性能問題。

2.1.3 資料庫分片

對一個庫中的相關表進行水準拆分到不同執行個體的資料庫中

複制代碼

mysql分表 查詢 優化_MySQL性能管理及架構(查詢優化、分庫分表)一遍文章搞定...

2.1.3.1 如何選擇分區鍵

1.分區鍵要能盡可能避免跨分區查詢的發生

2.分區鍵要盡可能使各個分區中的資料平均

2.1.3.2 分片中如何生成全局唯一ID

mysql分表 查詢 優化_MySQL性能管理及架構(查詢優化、分庫分表)一遍文章搞定...

擴充:表的垂直拆分和水準拆分

随着業務的發展,資料庫成為了整個系統性能的一個瓶頸,這時候就需要對資料庫進行優化,但是單單是優化隻能提高有限的一點性能,這時候要想解決問題需要的是從資料庫架構層面去思考問題。資料庫的架構是一個很大的課題,裡面最實用的有兩個,一個是資料庫拆分,一個是讀寫分離。今天就來談談資料庫的兩種拆分方式。

一、垂直拆分

垂直拆分很簡單,就是根據不同的業務來劃分不同的資料庫。比如一個電商系統根據業務可以分成商品表、會員表、訂單表。原先,這些表都是放在同一個資料庫伺服器上,現在需要垂直拆分資料庫,就是将商品表單獨放在一個資料庫中,會員表單獨放在一個資料庫中,訂單表單獨放在一個資料庫中,這樣就解決了表與表之間的io競争。

二、水準拆分

垂直拆分比較簡單,水準拆分就比較複雜了,要考慮很多東西。垂直拆分根據業務來拆分,或者說的直白點就是根據表名來拆分,而水準拆分是根據表裡面的字段來拆分(記住是根據字段來拆分,而不是拆分字段,拆分後的每一張表的表結構都是一樣)。比如要拆分使用者表,可以根據使用者的注冊時間這一字段來拆分整個表,2016年注冊的使用者放在使用者表1中,2017年注冊的使用者放在使用者表2中,2018年注冊的使用者放在使用者表3中。這就是水準拆分,看似很簡單,實際上要考慮的東西是很多的。就比如上述的例子,我們用時間來拆分,就會有局限性。一個好産品上線後,在開始的時候使用者數量都是很少的,都需要一定時間的沉澱,才會有一個使用者數量的爆發期。如果用時間來拆分,就會出現一種情況,就是使用者表1的規模很小,而使用者表2的規模卻很大,是使用者表1的好幾倍,而使用者表三可能是使用者表1的好幾十倍。這樣的話,拆分水準拆分的意義就不大了。一般使用者表都是使用者id來拆分的,具體還要結合實際業務去分析。是以,水準拆分是一件很複雜的事情,大家在進行水準拆分的時候一定要考慮到方方面面,這樣才能設計出優秀的資料庫架構方案。