天天看點

SQLSERVER資料庫開發的二十一條軍規

SQL SERVER資料庫開發的二十一條軍規

如果你正在負責一基于SQL SERVER 的項目,或者剛剛接觸SQL SERVER,你可能将面臨一些資料庫性能的問題。這篇文章會提供一些有用的經驗-----關于如何形成好的設計。

一、了解你用的工具

不要輕視這一點,這是本文最關鍵的一條。也許你也看到有很多的SQL SERVER程式員沒有掌握全部的T-SQL指令和SQL SERVER提供的各種工具。你也許不願花一個月時間專門學習那些你永遠也用不到的指令,但你至少應該用一個周末浏覽所有的T-SQL指令,以便對它門有所了解。将來,當你設計一個查詢時,你會記起:“對了,有一個指令可以完全實作我需要的功能。”,于是,到MSDN檢視這個指令的确切用法。

二、不要使用遊标

除非你已黔驢技窮,否則請不要使用遊标。大多數初學者都習慣使用遊标,因為這是他們感覺比較熟悉和舒适的程式設計方式,但不幸的是這會導緻糟糕的性能。顯然,SQL的總體目标是你要實作什麼,而不是怎樣實作,對于循環,T-SQL無能為力。

三、規範化你的資料表

為什麼不規範化你的資料庫?大概有兩個借口:出于性能的考慮和純粹因為懶惰。至于第二點,你遲早得為此付出代價。而關于性能的問題,你不需要優化根本就不慢的東西。我經常看到一些程式員”反規範化”資料庫,他們的理由是“原來的設計太慢了”,可結果卻常常是他們讓系統更慢了。DBMS被設計用來處理規範資料庫的,是以,記住:按規範化的要求設計資料庫。

        四、不要使用SELECT  *

這點不太容易做到,我自己也常這樣幹。可是如果在SELECT中指定你所需要的列,将會帶來如下好處:

1、     減少記憶體消耗和網絡帶寬。

2、     你可以得到更安全的設計。

3、     給查詢優化器機會從索引讀取所有需要的列。

五、了解你将要對資料表進行的操作

為你的資料庫建立一個健壯的索引,那可是功德一件。可要做到這一點簡直就是一門藝術。每當你為一個表添加一個索引,SELECT會更快了,可INSERT和DELETE卻大大的變慢了,因為維護索引需要許多額外的工作。顯然,這裡問題的關鍵是:你要對這張表進行什麼樣的操作。這個問題不太好把握,特别是涉及DELETE和UPDATE時,因為這些語句通常在WHERE部分包含SELECT指令。

六、不要給“性别“列建立索引

首先,我們必須了解索引是如何加速對表的通路的。你可以将索引了解為基于一定的标準對表進行劃分的一種方式。如果你給類似于“性别“這樣的列建立了一個索引,你僅僅是将表劃分為兩部分:男和女。你在處理一個有1,000,000條記錄的表,這樣的劃分有什麼意義? 記住:維護索引是比較費時的。當你設計索引時,請遵循這樣的規則:根據列可能包含的不同内容的數目從多到少排列,比如:姓名+省份+性别。

七、使用事務

請使用事務,特别是當查詢比較耗時。如果系統出現問題,這樣做會救你一命。一般有經驗的程式員都有體會----你經常會碰到一些不可預料的情況導緻存儲過程崩潰。

八、小心死鎖

按照一定次序來通路你的表。如果你先鎖住表A, 再鎖住表B,那麼在所有的存儲過程中都要按這個順序來鎖定他們。如果你不經意的在某過存儲過程中先鎖定表B,再鎖定表A,這可能會導緻一個死鎖。如果鎖定順序沒有被預先詳細的設計好,死鎖是不太容易被發現的。

九、不要打開大的資料集

一個經常提出的問題是:我怎樣才能迅速的将100000條記錄添加到ComboBox中? 這是不對的,你不能也不需要這樣做。很簡單,你的使用者要浏覽100000條記錄才能找到需要的記錄,他一定會詛咒你的。在這裡,你需要做的是設計一個更好的UI,為你的使用者顯示不超過100或200條記錄。

十、不要使用伺服器端遊标

與伺服器端遊标比起來,用戶端遊标可以減少伺服器和網絡的系統開銷,并且減少鎖定時間。

十一、使用參數查詢

有時,CSDN上有類似這樣的問題:“SELECT * FROM a WHERE a.id=‘A’B,因為單引号查詢發生異常,該怎麼辦?“,而普遍的回答是用兩個單引号代替一個單引号,這是錯誤的。這樣治标不治本,因為你還會在其它一些字元上遇到這樣的問題,更何況這會導緻嚴重的Bug,除此之外,這樣做還會使SQL Server緩沖系統無法發揮應有的作用。使用參數查詢,釜底抽薪,這些問題統統不存在。

十二、在程式編碼時使用大資料量的資料庫

程式員在開發中使用的測試資料庫一般資料量都不大,可經常的是最終使用者的資料量都很大。我們通常的做法是不對的,原因很簡單:現在硬碟不貴,可為什麼性能問題卻要等到已經無可挽回的時候才被注意呢?

十三、請不要用INSERT導入大批量資料

請不要這樣做,除非那是必須的。使用UTS或BCP, 這樣你可以一舉兼得靈活性和速度。

十四、注意逾時問題

查詢資料庫時,一般資料庫連接配接逾時的預設值都比較小,比如15秒或30秒,而有些查詢運作時間比這長,特别是資料庫的資料量不斷變大時。

十五、不要忽略同時修改同一記錄的問題

有時候,兩個使用者同時修改同一記錄,這樣,後一修改者修改了前一修改者的操作,某些更新就會丢失。處理這種情況不是很難,建立一個timestamp字段,在寫入前檢查他,如果允許,就合并修改,如果存在沖突,提示使用者。

十六、在細節表中插入記錄時,不要在主表中執行SELECT MAX(id)

這是一個普遍的錯誤,當兩個使用者在同一時間插入資料時,這會導緻錯誤。你可以使用SCOPE_IDENTITY,IDENT_CURRENT和IDENTITY。如果可能,不要使用IDENTITY,因為在有解發器的情況下,它會引起一些問題。

十七、避免将列設為NULLable

如果可能的話,你應該避免将列設為NULLABLE。系統會為NULLable的列每一行配置設定一個額外的位元組,查詢時會帶來更多的系統開銷。将列設為NULLable使編碼變得複雜,因為每一次通路這些列時都必須先進行檢查。我并不是說NULL是麻煩的根源,如果你的業務規則中允許“空資料“,那麼,将列設為NULLable有時會發揮很好的作用。

十八、盡量不要使用TEXT資料類型

除非你使用TEXT處理一個很大的資料,否則不要使用他。因為他不易查詢,速度慢,用的不好還會浪費大量的空間。一般的,VARCHAR能更好的處理你的資料。

十九、盡量不要使用臨時表

盡量不要使用臨時表,除非你必須這樣做。一般使用子查詢可以代替臨時表。使用臨時表會帶來系統開銷,如果你使用COM+進行程式設計,它還會給你帶來很大的麻煩,因為COM定義+使用資料庫連接配接池而臨時表卻自始至終都存在。SQL SERVER提供了一些替代方案,比如Table資料類型。

二十、學會分析查詢

二十一、使用參照完整性

定義主鍵、唯一鍵限制和外鍵,這樣做可以節約大量時間。