天天看點

58到家資料庫30條軍規解讀

軍規适用場景:并發量大、資料量大的網際網路業務

軍規:介紹内容

解讀:講解原因,解讀比軍規更重要

----

一、基礎規範

(1)必須使用InnoDB存儲引擎

解讀:支援事務、行級鎖、并發性能更好、CPU及記憶體緩存頁優化使得資源使用率更高

(2)必須使用UTF8字元集

解讀:萬國碼,無需轉碼,無亂碼風險,節省空間

(3)資料表、資料字段必須加入中文注釋

解讀:N年後誰tm知道這個r1,r2,r3字段是幹嘛的

(4)禁止使用存儲過程、視圖、觸發器、Event

解讀:高并發大資料的網際網路業務,架構設計思路是“解放資料庫CPU,将計算轉移到服務層”,并發量大的情況下,這些功能很可能将資料庫拖死,業務邏輯放到服務層具備更好的擴充性,能夠輕易實作“增機器就加性能”。資料庫擅長存儲與索引,CPU計算還是上移吧

(5)禁止存儲大檔案或者大照片

解讀:為何要讓資料庫做它不擅長的事情?大檔案和照片存儲在檔案系統,資料庫裡存URI多好

二、命名規範

(6)隻允許使用内網域名,而不是ip連接配接資料庫

(7)線上環境、開發環境、測試環境資料庫内網域名遵循命名規範

業務名稱:xxx

線上環境:dj.xxx.db

開發環境:dj.xxx.rdb

測試環境:dj.xxx.tdb

從庫在名稱後加-s辨別,備庫在名稱後加-ss辨別

線上從庫:dj.xxx-s.db

線上備庫:dj.xxx-sss.db

(8)庫名、表名、字段名:小寫,下劃線風格,不超過32個字元,必須見名知意,禁止拼音英文混用

(9)表名t_xxx,非唯一索引名idx_xxx,唯一索引名uniq_xxx

三、表設計規範

(10)單執行個體表數目必須小于500

(11)單表列數目必須小于30

(12)表必須有主鍵,例如自增主鍵

解讀:

a)主鍵遞增,資料行寫入可以提高插入性能,可以避免page分裂,減少表碎片提升空間和記憶體的使用

b)主鍵要選擇較短的資料類型, Innodb引擎普通索引都會儲存主鍵的值,較短的資料類型可以有效的減少索引的磁盤空間,提高索引的緩存效率

c) 無主鍵的表删除,在row模式的主從架構,會導緻備庫夯住

(13)禁止使用外鍵,如果有外鍵完整性限制,需要應用程式控制

解讀:外鍵會導緻表與表之間耦合,update與delete操作都會涉及相關聯的表,十分影響sql 的性能,甚至會造成死鎖。高并發情況下容易造成資料庫性能,大資料高并發業務場景資料庫使用以性能優先

四、字段設計規範

(14)必須把字段定義為NOT NULL并且提供預設值

a)null的列使索引/索引統計/值比較都更加複雜,對MySQL來說更難優化

b)null 這種類型MySQL内部需要進行特殊處理,增加資料庫處理記錄的複雜性;同等條件下,表中有較多空字段的時候,資料庫的處理性能會降低很多

c)null值需要更多的存儲空,無論是表還是索引中每行中的null的列都需要額外的空間來辨別

d)對null 的處理時候,隻能采用is null或is not null,而不能采用=、in、<、<>、!=、not in這些操作符号。如:where name!=’shenjian’,如果存在name為null值的記錄,查詢結果就不會包含name為null值的記錄

(15)禁止使用TEXT、BLOB類型

解讀:會浪費更多的磁盤和記憶體空間,非必要的大量的大字段查詢會淘汰掉熱資料,導緻記憶體命中率急劇降低,影響資料庫性能

(16)禁止使用小數存儲貨币

解讀:使用整數吧,小數容易導緻錢對不上

(17)必須使用varchar(20)存儲手機号

a)涉及到區号或者國家代号,可能出現+-()

b)手機号會去做數學運算麼?

c)varchar可以支援模糊查詢,例如:like“138%”

(18)禁止使用ENUM,可使用TINYINT代替

a)增加新的ENUM值要做DDL操作

b)ENUM的内部實際存儲就是整數,你以為自己定義的是字元串?

五、索引設計規範

(19)單表索引建議控制在5個以内

(20)單索引字段數不允許超過5個

解讀:字段超過5個時,實際已經起不到有效過濾資料的作用了

(21)禁止在更新十分頻繁、區分度不高的屬性上建立索引

a)更新會變更B+樹,更新頻繁的字段建立索引會大大降低資料庫性能

b)“性别”這種區分度不大的屬性,建立索引是沒有什麼意義的,不能有效過濾資料,性能與全表掃描類似

(22)建立組合索引,必須把區分度高的字段放在前面

解讀:能夠更加有效的過濾資料

六、SQL使用規範

(23)禁止使用SELECT *,隻擷取必要的字段,需要顯示說明列屬性

a)讀取不需要的列會增加CPU、IO、NET消耗

b)不能有效的利用覆寫索引

c)使用SELECT *容易在增加或者删除字段後出現程式BUG

(24)禁止使用INSERT INTO t_xxx VALUES(xxx),必須顯示指定插入的列屬性

解讀:容易在增加或者删除字段後出現程式BUG

(25)禁止使用屬性隐式轉換

解讀:SELECT uid FROM t_user WHERE phone=13812345678 會導緻全表掃描,而不能命中phone索引,猜猜為什麼?(這個線上問題不止出現過一次)

(26)禁止在WHERE條件的屬性上使用函數或者表達式

解讀:SELECT uid FROM t_user WHERE from_unixtime(day)>='2017-02-15' 會導緻全表掃描

正确的寫法是:SELECT uid FROM t_user WHERE day>= unix_timestamp('2017-02-15 00:00:00')

(27)禁止負向查詢,以及%開頭的模糊查詢

a)負向查詢條件:NOT、!=、<>、!<、!>、NOT IN、NOT LIKE等,會導緻全表掃描

b)%開頭的模糊查詢,會導緻全表掃描

(28)禁止大表使用JOIN查詢,禁止大表使用子查詢

解讀:會産生臨時表,消耗較多記憶體與CPU,極大影響資料庫性能

(29)禁止使用OR條件,必須改為IN查詢

解讀:舊版本Mysql的OR查詢是不能命中索引的,即使能命中索引,為何要讓資料庫耗費更多的CPU幫助實施查詢優化呢?

(30)應用程式必須捕獲SQL異常,并有相應處理

總結:大資料量高并發的網際網路業務,極大影響資料庫性能的都不讓用,不讓用喲。