天天看點

網際網路MySQL開發規範

       寫在前面:無規矩不成方圓。對于剛加入網際網路的朋友們,肯定會接觸到mysql,mysql作為網際網路最流行的關系型資料庫産品,它有它擅長的地方,也有它不足的短闆,針對它的特性,結合網際網路大多應用的特點,筆者根據自己多年網際網路公司的mysql dba經驗,現總結出網際網路mysql的一些開發規範,僅供參考。

作者是微信訂閱号yunweibang特約技術專家劉秋岐,多年資料庫經驗,如有問題可以訂閱yunweibang并留言。

摘要:

基礎規範

命名規範

庫、表、字段開發設計規範

索引規範

sql規範

流程規範

(1) 使用innodb存儲引擎

(2) 表字元集使用utf8

(3) 所有表都需要添加注釋

(4) 單表資料量建議控制在5000w以内

(5) 不在資料庫中存儲圖、檔案等大資料

(6) 禁止線上上做資料庫壓力測試

(7) 禁從測試、開發環境直連資料庫

(1) 庫名表名字段名必須有固定的命名長度,12個字元以内

(2) 庫名、表名、字段名禁止超過32個字元。須見名之意

(3) 庫名、表名、字段名禁止使用mysql保留字

(4) 臨時庫、表名必須以tmp為字首,并以日期為字尾

(5) 備份庫、表必須以bak為字首,并以日期為字尾

(1) 禁使用分區表

(2) 拆分大字段和通路頻率低的字段,分離冷熱資料

(3) 用hash進散表,表名字尾使進制數,下标從0開始

(4) 按日期時間分表需符合yyyy[mm][dd][hh]格式

(5) 采用合适的分庫分表政策。例如千庫十表、十庫百表等

(6) 盡可能不使用text、blob類型

(7) 用decimal代替float和double存儲精确浮點數

(8) 越簡單越好:将字元轉化為數字、使用tinyint來代替enum類型

(9) 所有字段均定義為not null

(10) 使用unsigned存儲非負整數

(11) int類型固定占用4位元組存儲

(12) 使用timestamp存儲時間

(13) 使用int unsigned存儲ipv4

(14) 使用varbinary存儲大小寫敏感的變長字元串

(15) 禁止在資料庫中存儲明文密碼,把密碼加密後存儲

(16) 用好數值類型字段

tinyint      (1byte)

smallint     (2byte)

mediumint   (3byte)

int         (4byte)

bigint       (8byte)

類型

位元組

最小值

最大值

(帶符号的/無符号的)

tinyint

1

-128

127

無符号

255

smallint

2

-32768

32767

65535

mediumint

3

-8388608

8388607

16777215

int

4

-2147483648

2147483647

4294967295

bigint

8

-9223372036854775808

9223372036854775807

18446744073709551615

如果數值字段沒有那麼大,就不要用 bigint

(17) 存儲ip最好用int存儲而非char(15)

(18) 不允許使用enum

(19) 避免使用null字段

null字段很難查詢優化,null字段的索引需要額外空間,null字段的複合索引無效

(20) 少用text/blob,varchar的性能會比text高很多,實在避免不了blob,請拆表

(21) 資料庫中不允許存儲大檔案,或者照片,可以将大對象放到磁盤上,資料庫中存儲它的路徑

1、索引的數量要控制:

(1) 單張表中索引數量不超過5個

(2) 單個索引中的字段數不超過5個

(3) 對字元串使用字首索引,字首索引長度不超過8個字元

(4) 建議優先考慮字首索引,必要時可添加僞列并建立索引

2、主鍵準則

(1) 表必須有主鍵

(2) 不使用更新頻繁的列作為主鍵

(3) 盡量不選擇字元串列作為主鍵

(4) 不使用uuid md5 hash這些作為主鍵(數值太離散了)

(5) 預設使非空的唯一鍵作為主鍵

(6) 建議選擇自增或發号器

3、重要的sql必須被索引,比如:

(1) update、delete語句的where條件列

(2) order by、group by、distinct的字段

4、多表join的字段注意以下:

(1) 區分度最大的字段放在前面

(2) 核sql優先考慮覆寫索引

(3) 避免備援和重複索引

(4) 索引要綜合評估資料密度和分布以及考慮查詢和更新比例

5、索引禁忌

(1) 不在低基數列上建立索引,例如“性别”

(2) 不在索引列進行數學運算和函數運算

6、盡量不使用外鍵

(1) 外鍵用來保護參照完整性,可在業務端實作

(2) 對父表和子表的操作會互相影響,降低可用性

7、索引命名:非唯一索引必須以 idx_字段1_字段2命名,唯一是以必須以uniq_字段1_字段2命名,索引名稱必須全部小寫

8、建立的唯一索引必須不能和主鍵重複

9、索引字段的預設值不能為null,要改為其他的default或者空。null非常影響索引的查詢效率

10、反複檢視與表相關的sql,符合最左字首的特點建立索引。多條字段重複的語句,要修改語句條件字段的順序,為其建立一條聯合索引,減少索引數量

11、能使用唯一索引就要使用唯一索引,提高查詢效率

12、研發要經常使用explain,如果發現索引選擇性差,必須讓他們學會使用hint

(1) sql語句盡可能簡單

大的sql想辦法拆成小的sql語句(充分利用query cache和充分利用多核cpu)

(2) 事務要簡單,整個事務的時間長度不要太長

(3) 避免使用觸發器、函數、存儲過程

(4) 降低業務耦合度,為sacle out、sharding留有餘地

(5) 避免在資料庫中進數學運算(mysql不擅長數學運算和邏輯判斷)

(4) 不要用select *,查詢哪幾個字段就select 這幾個字段

(5) sql中使用到or的改寫為用 in()   (or的效率沒有in的效率高)

(6) in裡面數字的個數建議控制在1000以内

(7) limit分頁注意效率。limit越大,效率越低。可以改寫limit,比如例子改寫:

select id from tlimit 10000, 10;  =>  select id from t where id > 10000 limit10;

(9) 使用union all替代union

(10) 避免使大表的join

(11) 使用group by 分組、自動排序

(12) 對資料的更新要打散後批量更新,不要一次更新太多資料

(13) 減少與資料庫的互動次數

(13) 注意使用性能分析工具

sql explain  /  showprofile   /    mysqlsla

(14) sql語句要求所有研發,sql關鍵字全部是大寫,每個詞隻允許有一個空格

(15) sql語句不可以出現隐式轉換,比如 select id from 表 where id='1'

(16) in條件裡面的資料數量要少,我記得應該是500個以内,要學會使用exist代替in,exist在一些場景查詢會比in快

(17) 能不用not in就不用notin,坑太多了。。會把空和null給查出來

(18) 在sql語句中,禁止使用字首是%的like

(19) 不使用負向查詢,如not in/like

(19) 關于分頁查詢:程式裡建議合理使用分頁來提高效率limit,offset較大要配合子查詢使用

(20) 禁止在資料庫中跑大查詢

(21) 使預編譯語句,隻傳參數,比傳遞sql語句更高效;一次解析,多次使用;降低sql注入機率

(22) 禁止使order by rand()

(23) 禁單條sql語句同時更新多個表

(1) 所有的建表操作需要提前告知該表涉及的查詢sql;

(2) 所有的建表需要确定建立哪些索引後才可以建表上線;

(3) 所有的改表結構、加索引操作都需要将涉及到所改表的查詢sql發出來告知dba等相關人員;

(4) 在建新表加字段之前,要求研發至少要提前3天郵件出來,給dba們評估、優化和稽核的時間

(5)批量導入、導出資料必須提前通知dba協助觀察

(6) 禁線上上從庫執行背景管理和統計類查詢

(7) 禁有super權限的應用程式賬号存在

(8) 推廣活動或上線新功能必須提前通知dba進行流量評估

(9) 不在業務高峰期批量更新、查詢資料庫

轉載本文請務必帶有本訂閱号二維碼及作者資訊

出自:http://mp.weixin.qq.com/s?plg_nld=1&plg_uin=1&mid=207132223&idx=1&plg_nld=1&scene=22&plg_auth=1&__biz=mza3mzywnjq3na%3d%3d&plg_dev=1&srcid=11031h8kgqs39botbxdbsowl&plg_usr=1&plg_vkey=1&sn=f5d98146f28235d91fe3e675cead4ce5#rd