天天看點

Oracle資料庫SQL語句性能調整的基本原則

這篇論壇文章(賽迪網技術社群)詳細的介紹了Oracle資料庫SQL語句性能調整的基本原則,具體内容請參考下文。

一、問題的提出

在應用系統開發初期,由于開發資料庫資料比較少,對于查詢SQL語句,複雜視圖的的編寫等體會不出SQL語句各種寫法的性能優劣,但是如果将應用系統送出實際應用後,随着資料庫中資料的增加,系統的響應速度就成為目前系統需要解決的最主要的問題之一。系統優化中一個很重要的方面就是SQL語句的優化。對于海量資料,劣質SQL語句和優質SQL語句之間的速度差别可以達到上百倍,可見對于一個系統不是簡單地能實作其功能就可,而是要寫出高品質的SQL語句,提高系統的可用性。

在多數情況下,Oracle使用索引來更快地周遊表,優化器主要根據定義的索引來提高性能。但是,如果在SQL語句的where子句中寫的SQL代碼不合理,就會造成優化器删去索引而使用全表掃描,一般就這種SQL語句就是所謂的劣質SQL語句。在編寫SQL語句時我們應清楚優化器根據何種原則來删除索引,這有助于寫出高性能的SQL語句。

二、SQL語句編寫注意問題

下面就某些SQL語句的where子句編寫中需要注意的問題作詳細介紹。在這些where子句中,即使某些列存在索引,但是由于編寫了劣質的SQL,系統在運作該SQL語句時也不能使用該索引,而同樣使用全表掃描,這就造成了響應速度的極大降低。

1. IS NULL 與 IS NOT NULL

不能用null作索引,任何包含null值的列都将不會被包含在索引中。即使索引有多列這樣的情況下,隻要這些列中有一列含有null,該列就會從索引中排除。也就是說如果某列存在空值,即使對該列建索引也不會提高性能。任何在where子句中使用is null或is not null的語句優化器是不允許使用索引的。

2. 聯接列

對于有聯接的列,即使最後的聯接值為一個靜态值,優化器是不會使用索引的。我們一起來看一個例子,假定有一個職工表(employee),對于一個職工的姓和名分成兩列存放(FIRST_NAME和LAST_NAME),現在要查詢一個叫比爾.克林頓(Bill Cliton)的職工。

下面是一個采用聯接查詢的SQL語句:

select * from employss

where

first_name||''||last_name ='Beill Cliton';

上面這條語句完全可以查詢出是否有Bill Cliton這個員工,但是這裡需要注意,系統優化器對基于last_name建立的索引沒有使用。

當采用下面這種SQL語句的編寫,Oracle系統就可以采用基于last_name建立的索引。

Select * from employee

first_name ='Beill' and last_name ='Cliton';

遇到下面這種情況又如何處理呢?如果一個變量(name)中存放着Bill Cliton這個員工的姓名,對于這種情況我們又如何避免全程周遊,使用索引呢?可以使用一個函數,将變量name中的姓和名分開就可以了,但是有一點需要注意,這個函數是不能作用在索引列上。下面是SQL查詢腳本:

select * from employee

first_name = SUBSTR('&&name',1,INSTR('&&name',' ')-1)

and

last_name = SUBSTR('&&name',INSTR('&&name’,' ')+1)

3. 帶通配符(%)的like語句

同樣以上面的例子來看這種情況。目前的需求是這樣的,要求在職工表中查詢名字中包含cliton的人。可以采用如下的查詢SQL語句:

select * from employee where last_name like '%cliton%';

這裡由于通配符(%)在搜尋詞首出現,是以Oracle系統不使用last_name的索引。在很多情況下可能無法避免這種情況,但是一定要心中有底,通配符如此使用會降低查詢速度。然而當通配符出現在字元串其他位置時,優化器就能利用索引。在下面的查詢中索引得到了使用:

select * from employee where last_name like 'c%';

4. Order by語句

ORDER BY語句決定了Oracle如何将傳回的查詢結果排序。Order by語句對要排序的列沒有什麼特别的限制,也可以将函數加入列中(象聯接或者附加等)。任何在Order by語句的非索引項或者有計算表達式都将降低查詢速度。

仔細檢查order by語句以找出非索引項或者表達式,它們會降低性能。解決這個問題的辦法就是重寫order by語句以使用索引,也可以為所使用的列建立另外一個索引,同時應絕對避免在order by子句中使用表達式。

5. NOT

我們在查詢時經常在where子句使用一些邏輯表達式,如大于、小于、等于以及不等于等等,也可以使用and(與)、or(或)以及not(非)。NOT可用來對任何邏輯運算符号取反。下面是一個NOT子句的例子:

... where not (status ='VALID')

如果要使用NOT,則應在取反的短語前面加上括号,并在短語前面加上NOT運算符。NOT運算符包含在另外一個邏輯運算符中,這就是不等于(<>)運算符。換句話說,即使不在查詢where子句中顯式地加入NOT詞,NOT仍在運算符中,見下例:

... where status <>'INVALID';

再看下面這個例子:

select * from employee where salary<>3000;

對這個查詢,可以改寫為不使用NOT:

select * from employee where salary<3000 or salary>3000;

雖然這兩種查詢的結果一樣,但是第二種查詢方案會比第一種查詢方案更快些。第二種查詢允許Oracle對salary列使用索引,而第一種查詢則不能使用索引。

6. IN和EXISTS

有時候會将一列和一系列值相比較。最簡單的辦法就是在where子句中使用子查詢。在where子句中可以使用兩種格式的子查詢。

第一種格式是使用IN操作符:

... where column in(select * from ... where ...);

第二種格式是使用EXIST操作符:

... where exists (select 'X' from ...where ...);

我相信絕大多數人會使用第一種格式,因為它比較容易編寫,而實際上第二種格式要遠比第一種格式的效率高。在Oracle中可以幾乎将所有的IN操作符子查詢改寫為使用EXISTS的子查詢。

第二種格式中,子查詢以‘select 'X'開始。運用EXISTS子句不管子查詢從表中抽取什麼資料它隻檢視where子句。這樣優化器就不必周遊整個表而僅根據索引就可完成工作(這裡假定在where語句中使用的列存在索引)。相對于IN子句來說,EXISTS使用相連子查詢,構造起來要比IN子查詢困難一些。

通過使用EXIST,Oracle系統會首先檢查主查詢,然後運作子查詢直到它找到第一個比對項,這就節省了時間。Oracle系統在執行IN子查詢時,首先執行子查詢,并将獲得的結果清單存放在在一個加了索引的臨時表中。在執行子查詢之前,系統先将主查詢挂起,待子查詢執行完畢,存放在臨時表中以後再執行主查詢。這也就是使用EXISTS比使用IN通常查詢速度快的原因。

同時應盡可能使用NOT EXISTS來代替NOT IN,盡管二者都使用了NOT(不能使用索引而降低速度),NOT EXISTS要比NOT IN查詢效率更高。

=====================================================

Oracle的SQL調優是一個複雜的主題,甚至是需要整本書來介紹OracleSQL調優的細微差别。不過有一些基本的規則是每個OracleDBA都需要跟從的,這些規則可以改善他們系統的性能。SQL調優的目标是簡單的:

消除不必要的大表全表搜尋:不必要的全表搜尋導緻大量不必要的I/O,進而拖慢整個資料庫的性能。調優專家首先會根據查詢傳回的行數目來評價SQL。在一個有序的表中,如果查詢傳回少于40%的行,或者在一個無序的表中,傳回少于7%的行,那麼這個查詢都可以調整為使用一個索引來代替全表搜尋。對于不必要的全表搜尋來說,最常見的調優方法是增加索引。可以在表中加入标準的B樹索引,也可以加入bitmap和基于函數的索引。要決定是否消除一個全表搜尋,你可以仔細檢查索引搜尋的I/O開銷和全表搜尋的開銷,它們的開銷和資料塊的讀取和可能的并行執行有關,并将兩者作對比。在一些情況下,一些不必要的全表搜尋的消除可以通過強制使用一個index來達到,隻需要在SQL語句中加入一個索引的提示就可以了。

在全表搜尋是一個最快的通路方法時,将小表的全表搜尋放到緩存中,調優專家應該確定有一個專門的資料緩沖用作行緩沖。在Oracle7中,你可以使用altertablexxxcache語句,在Oracle8或以上,小表可以被強制為放到KEEP池中緩沖。

確定最優的索引使用:對于改善查詢的速度,這是特别重要的。有時Oracle可以選擇多個索引來進行查詢,調優專家必須檢查每個索引并且確定Oracle使用正确的索引。它還包括bitmap和基于函數的索引的使用。

確定最優的JOIN操作:有些查詢使用NESTEDLOOPjoin快一些,有些則是HASHjoin快一些,另外一些則是sort-mergejoin更快。

這些規則看來簡單,不過它們占SQL調優任務的100%,并且它們也無需完全懂得OracleSQL的内部運作。以下我們來簡單概覽以下OracleSQL的優化。

我們首先簡要檢視Oracle的排序,并且看一看排序操作是如何影響性能的。

調整Oracle的排序操作

排序是SQL文法中一個小的方面,但很重要,在Oracle的調整中,它常常被忽略。當使用createindex、ORDERBY或者GROUPBY的語句時,Oracle資料庫将會自動執行排序的操作。通常,在以下的情況下Oracle會進行排序的操作:

使用Orderby的SQL語句

使用Groupby的SQL語句

在建立索引的時候

進行tablejoin時,由于現有索引的不足而導緻SQL優化器調用MERGESORT

當與Oracle建立起一個session時,在記憶體中就會為該session配置設定一個私有的排序區域。如果該連接配接是一個專用的連接配接(dedicatedconnection),那麼就會根據init.ora中sort_area_size參數的大小在記憶體中配置設定一個ProgramGlobalArea(PGA)。如果連接配接是通過多線程伺服器建立的,那麼排序的空間就在large_pool中配置設定。不幸的是,對于所有的session,用做排序的記憶體量都必須是一樣的,我們不能為需要更大排序的操作配置設定額外的排序區域。是以,設計者必須作出一個平衡,在配置設定足夠的排序區域以避免發生大的排序任務時出現磁盤排序(disksorts)的同時,對于那些并不需要進行很大排序的任務,就會出現一些浪費。當然,當排序的空間需求超出了sort_area_size的大小時,這時将會在TEMP表空間中分頁進行磁盤排序。磁盤排序要比記憶體排序大概慢14,000倍。

上面我們已經提到,私有排序區域的大小是有init.ora中的sort_area_size參數決定的。每個排序所占用的大小由init.ora中的sort_area_retained_size參數決定。當排序不能在配置設定的空間中完成時,就會使用磁盤排序的方式,即在Oracle執行個體中的臨時表空間中進行。

磁盤排序的開銷是很大的,有幾個方面的原因。首先,和記憶體排序相比較,它們特别慢;而且磁盤排序會消耗臨時表空間中的資源。Oracle還必須配置設定緩沖池塊來保持臨時表空間中的塊。無論什麼時候,記憶體排序都比磁盤排序好,磁盤排序将會令任務變慢,并且會影響Oracle執行個體的目前任務的執行。還有,過多的磁盤排序将會令freebufferwaits的值變高,進而令其它任務的資料塊由緩沖中移走。

原文連結:

http://tech.ccidnet.com/art/1107/20080506/1441239_1.html