天天看點

Oracle專家調優秘密

在過去的十年中,Oracle已經成為世界上最專業的資料庫之一。對于IT專家來說,就是要確定利用Oracle的強大特性來提高他們公司的生産力。最有效的方法之一是通過Oracle調優。它有大量的調整參數和技術來改進你的Oracle資料庫的性能。     Oracle調優是一個複雜的主題。關于調優可以寫整整一本書,不過,為了改善Oracle資料庫的性能,有一些基本的概念是每個Oracle DBA都應該遵從的。     在這篇簡介中,我們将簡要地介紹以下的Oracle主題:     --外部調整:我們應該記住Oracle并不是單獨運作的。是以我們将檢視一下通過調整Oracle伺服器以得到高的性能。     --Row re-sequencing以減少磁盤I/O:我們應該懂得Oracle調優最重要的目标是減少I/O。     --Oracle SQL調整。Oracle SQL調整是Oracle調整中最重要的領域之一,隻要通過一些簡單的SQL調優規則就可以大幅度地提升SQL語句的性能,這是一點都不奇怪的。     --調整Oracle排序:排序對于Oracle性能也是有很大影響的。     --調整Oracle的競争:表和索引的參數設定對于UPDATE和INSERT的性能有很大的影響。     我們首先從調整Oracle外部的環境開始。如果記憶體和CPU的資源不足的話,任何的Oracle調整都是沒有幫助的。     外部的性能問題     Oracle并不是單獨運作的。Oracle資料庫的性能和外部的環境有很大的關系。這些外部的條件包括有:     .CPU--CPU資源的不足令查詢變慢。當查詢超過了Oracle伺服器的CPU性能時,你的資料庫性能就受到CPU的限制。     .記憶體--可用于Oralce的記憶體數量也會影響SQL的性能,特别是在資料緩沖和記憶體排序方面。     .網絡--大量的Net8通信令SQL的性能變慢。     許多新手都錯誤的認為應該首先調整Oracle資料庫,而不是先确認外部資源是否足夠。實際上,如果外部環境出現瓶頸,再多的Oracle調整都是沒有幫助的。     在檢查Oracle的外部環境時,有兩個方面是需要注意的:     1、當運作隊列的數目超過伺服器的CPU數量時,伺服器的性能就會受到CPU的限制。補救的方法是為伺服器增加額外的CPU或者關閉需要很多處理資源的元件,例如Oracle Parallel Query。     2、記憶體分頁。當記憶體分頁時,記憶體容量已經不足,而記憶體頁是與磁盤上的交換區進行互動的。補救的方法是增加更多的記憶體,減少Oracle SGA的大小,或者關閉Oracle的多線程伺服器。     可以使用各種标準的伺服器工具來得到伺服器的統計資料,例如vmstat,glance,top和sar。DBA的目标是確定資料庫伺服器擁有足夠的CPU和記憶體資源來處理Oracle的請求。     以下讓我們來看一下Oracle的row-resequencing是如何能夠極大地減少磁盤I/O的。     Row-resequencing(行的重新排序)     就象我們上面提到的,有經驗的Oracle DBA都知道I/O是響應時間的最大組成部分。其中磁盤I/O特别厲害,因為當Oracle由磁盤上的一個資料檔案得到一個資料塊時,讀的程序就必須等待實體I/O操作完成。磁盤操作要比資料緩沖慢10,000倍。是以,如果可以令I/O最小化,或者減少由于磁盤上的檔案競争而帶來的瓶頸,就可以大大地改善Oracle資料庫的性能。     如果系統響應很慢,通過減少磁盤I/O就可以有一個很快的改善。如果在一個事務中通過按一定的範圍搜尋primary-key索引來通路表,那麼重新以CTAS的方法組織表将是你減少I/O的首要政策。通過在實體上将行排序為和primary-key索引一樣的順序,就可以加快獲得資料的速度。     就象磁盤的負載平衡一樣,行的重新排序也是很簡單的,而且也很快。通過與其它的DBA管理技巧一起使用,就可以在高I/O的系統中大大地減少響應的時間。     在高容量的線上事務處理環境中(online transaction processing,OLTP),資料是由一個primary索引得到的,重新排序表格的行就可以令連續塊的順序和它們的primary索引一樣,這樣就可以在索引驅動的表格查詢中,減少實體I/O并且改善響應時間。這個技巧僅在應用選擇多行的時候有用,或者在使用索引範圍搜尋和應用發出多個查詢來得到連續的key時有效。對于随機的唯一primary-key(主鍵)的通路将不會由行重新排序中得到好處。     讓我們看一下它是如何工作的。考慮以下的一個SQL的查詢,它使用一個索引來得到100行:    select salary from employee     where last_name like 'B%';   這個查詢将會使用last_name_index,搜尋其中的每一行來得到目标行。這個查詢将會至少使用100次實體磁盤的讀取,因為employee的行存放在不同的資料塊中。     不過,如果表中的行已經重新排序為和last_name_index的一樣,同樣的查詢又會怎樣處理呢?我們可以看到這個查詢隻需要三次的磁盤I/O就讀完全部100個員工的資料(一次用作索引的讀取,兩次用作資料塊的讀取),減少了97次的塊讀取。     重新排序帶來的性能改善的程度在于在你開始的時候行的亂序性如何,以及你需要由序列中通路多少行。至于一個表中的行與索引的排序鍵的比對程度,可以檢視資料字典中的dba_indexes和dba_tables視圖得到。     在dba_indexes的視圖中,檢視clustering_factor列。如果clustering_factor的值和表中的塊數目大緻一樣,那麼你的表和索引的順序是一樣的。不過,如果clustering_factor 的值接近表中的行數目,那就表明表格中的行和索引的順序是不一樣的。     行重新排序的作用是不可以小看的。在需要進行大範圍的索引搜尋的大表中,行重新排序可以令查詢的性能提高三倍。     一旦你已經決定重新排序表中的行,你可以使用以下的工具之一來重新組織表格。     . 使用Oracle的Create Table As Select (CTAS) 文法來拷貝表格     . Oracle9i自帶的表格重新組織工具     以下,我們來看以下SQL語句的調優。   SQL調優     Oracle的SQL調優是一個複雜的主題,甚至是需要整本書來介紹Oracle SQL調優的細微差别。不過有一些基本的規則是每個Oracle DBA都需要跟從的,這些規則可以改善他們系統的性能。SQL調優的目标是簡單的:     . 消除不必要的大表全表搜尋:不必要的全表搜尋導緻大量不必要的I/O,進而拖慢整個資料庫的性能。調優專家首先會根據查詢傳回的行數目來評價SQL。在一個有序的表中,如果查詢傳回少于40%的行,或者在一個無序的表中,傳回少于7%的行,那麼這個查詢都可以調整為使用一個索引來代替全表搜尋。對于不必要的全表搜尋來說,最常見的調優方法是增加索引。可以在表中加入标準的B樹索引,也可以加入bitmap和基于函數的索引。要決定是否消除一個全表搜尋,你可以仔細檢查索引搜尋的I/O開銷和全表搜尋的開銷,它們的開銷和資料塊的讀取和可能的并行執行有關,并将兩者作對比。在一些情況下,一些不必要的全表搜尋的消除可以通過強制使用一個index來達到,隻需要在SQL語句中加入一個索引的提示就可以了。     . 在全表搜尋是一個最快的通路方法時,将小表的全表搜尋放到緩存中,調優專家應該確定有一個專門的資料緩沖用作行緩沖。在Oracle7中,你可以使用alter table xxx cache語句,在Oracle8或以上,小表可以被強制為放到KEEP池中緩沖。     . 確定最優的索引使用 :對于改善查詢的速度,這是特别重要的。有時Oracle可以選擇多個索引來進行查詢,調優專家必須檢查每個索引并且確定Oracle使用正确的索引。它還包括bitmap和基于函數的索引的使用。     . 確定最優的JOIN操作:有些查詢使用NESTED LOOP join快一些,有些則是HASH join快一些,另外一些則是sort-merge join更快。     這些規則看來簡單,不過它們占SQL調優任務的90%,并且它們也無需完全懂得Oracle SQL的内部運作。以下我們來簡單概覽以下Oracle SQL的優化。     我們首先簡要檢視Oracle的排序,并且看一看排序操作是如何影響性能的。     調整Oracle的排序操作     排序是SQL文法中一個小的方面,但很重要,在Oracle的調整中,它常常被忽略。當使用create index、ORDER BY或者GROUP BY的語句時,Oracle資料庫将會自動執行排序的操作。通常,在以下的情況下Oracle會進行排序的操作:     使用Order by的SQL語句     使用Group by的SQL語句     在建立索引的時候     進行table join時,由于現有索引的不足而導緻SQL優化器調用MERGE SORT     當與Oracle建立起一個session時,在記憶體中就會為該session配置設定一個私有的排序區域。如果該連接配接是一個專用的連接配接(dedicated connection),那麼就會根據init.ora中sort_area_size參數的大小在記憶體中配置設定一個Program Global Area (PGA) 。如果連接配接是通過多線程伺服器建立的,那麼排序的空間就在large_pool中配置設定。不幸的是,對于所有的session,用做排序的記憶體量都必須是一樣的,我們不能為需要更大排序的操作配置設定額外的排序區域。是以,設計者必須作出一個平衡,在配置設定足夠的排序區域以避免發生大的排序任務時出現磁盤排序(disk sorts)的同時,對于那些并不需要進行很大排序的任務,就會出現一些浪費。當然,當排序的空間需求超出了sort_area_size的大小時,這時将會在TEMP表空間中分頁進行磁盤排序。磁盤排序要比記憶體排序大概慢14,000倍。     上面我們已經提到,私有排序區域的大小是有init.ora中的sort_area_size參數決定的。每個排序所占用的大小由init.ora中的sort_area_retained_size參數決定。當排序不能在配置設定的空間中完成時,就會使用磁盤排序的方式,即在Oracle執行個體中的臨時表空間中進行。     磁盤排序的開銷是很大的,有幾個方面的原因。首先,和記憶體排序相比較,它們特别慢;而且磁盤排序會消耗臨時表空間中的資源。Oracle還必須配置設定緩沖池塊來保持臨時表空間中的塊。無論什麼時候,記憶體排序都比磁盤排序好,磁盤排序将會令任務變慢,并且會影響Oracle執行個體的目前任務的執行。還有,過多的磁盤排序将會令free buffer waits的值變高,進而令其它任務的資料塊由緩沖中移走。     接着,讓我們看一下Oracle的競争,并且看一下表的存儲參數的設定是如何影響SQL UPDATE和INSERT語句的性能的。   調整Oracle的競争     Oracle的其中一個優點時它可以管理每個表空間中的自由空間。Oracle負責處理表和索引的空間管理,這樣就可以讓我們無需懂得Oracle的表和索引的内部運作。不過,對于有經驗的Oracle調優專家來說,他需要懂得Oracle是如何管理表的extent和空閑的資料塊。對于調整擁有高的insert或者update的系統來說,這是非常重要的。     要精通對象的調整,你需要懂得freelists和freelist組的行為,它們和pctfree及pctused參數的值有關。這些知識對于企業資源計劃(ERP)的應用是特别重要的,因為在這些應用中,不正确的表設定通常是DML語句執行慢的原因。     對于初學者來說,最常見的錯誤是認為預設的Oracle參數對于所有的對象都是最佳的。除非磁盤的消耗不是一個問題,否則在設定表的pctfree和pctused參數時,就必須考慮平均的行長和資料庫的塊大小,這樣空的塊才會被有效地放到freelists中。當這些設定不正确時,那些得到的freelists也是"dead"塊,因為它們沒有足夠的空間來存儲一行,這樣将會導緻明顯的處理延遲。     Freelists對于有效地重新使用Oracle表空間中的空間是很重要的,它和pctfree及pctused這兩個存儲參數的設定直接相關。通過将pctused設定為一個高的值,這時資料庫就會盡快地重新使用塊。不過,高性能和有效地重新使用表的塊是對立的。在調整Oracle的表格和索引時,需要認真考慮究竟需要高性能還是有效的空間重用,并且據此來設定表的參數。以下我們來看一下這些freelists是如何影響Oracle的性能的。     當有一個請求需要插入一行到表格中時,Oracle就會到freelist中尋找一個有足夠的空間來容納一行的塊。你也許知道,freelist串是放在表格或者索引的第一個塊中,這個塊也被稱為段頭(segment header)。pctfree和pctused 參數的唯一目的就是為了控制塊如何在freelists中進出。雖然freelist link和 unlink是簡單的Oracle功能,不過設定freelist link (pctused) 和unlink (pctfree) 對Oracle的性能确實有影響。     由DBA的基本知識知道,pctfree參數是控制freelist un-links的(即将塊由freelists中移除)。設定pctfree=10 意味着每個塊都保留10%的空間用作行擴充。pctused參數是控制freelist re-links的。設定pctused=40意味着隻有在塊的使用低于40%時才會回到表格的freelists中。     許多新手對于一個塊重新回到freelists後的處理都有些誤解。其實,一旦由于一個删除的操作而令塊被重新加入到freelist中,它将會一直保留在freelist中即使空間的使用超過了60%,隻有在到達pctfree時才會将資料塊由freelist中移走。     表格和索引存儲參數設定的要求總結     以下的一些規則是用來設定freelists, freelist groups, pctfree和pctused存儲參數的。你也知道,pctused和pctfree的值是可以很容易地通過alter table指令修改的,一個好的DBA應該知道如何設定這些參數的最佳值。     有效地使用空間和高性能之間是有沖突的,而表格的存儲參數就是控制這個方面的沖突:     . 對于需要有效地重新使用空間,可以設定一個高的pctused值,不過副作用是需要額外的I/O。一個高的pctused值意味着相對滿的塊都會放到freelist中。是以,這些塊在再次滿之前隻可以接受幾行記錄,進而導緻更多的I/O。     . 追求高性能的話,可以将pctused設定為一個低的值,這意味着Oracle不會将資料塊放到freelists中直到它幾乎是空的。那麼塊将可以在滿之前接收更多的行,是以可以減少插入操作的I/O。要記住Oracle擴充新塊的性能要比重新使用現有的塊高。對于Oracle來說,擴充一個表比管理freelists消耗更少的資源。     讓我們來回顧一下設定對象存儲參數的一些常見規則:     .經常将pctused設定為可以接收一條新行。對于不能接受一行的free blocks對于我們來說是沒有用的。如果這樣做,将會令Oracle的性能變慢,因為Oracle将在擴充表來得到一個空的塊之前,企圖讀取5個"dead"的free block。     .表格中chained rows的出現意味着pctfree太低或者是db_block_size太少。在很多情況下,RAW和LONG RAW列都很巨大,以至超過了Oracle的最大塊的大小,這時chained rows是不可以避免的。     .如果一個表有同時插入的SQL語句,那麼它需要有同時删除的語句。運作單一個一個清除的工作将會把全部的空閑塊放到一個freelist中,而沒有其它包含有任何空閑塊的freelists出現。     .freelist參數應該設定為表格同時更新的最大值。例如,如果在任何時候,某個表最多有20個使用者執行插入的操作,那麼該表的參數應該設定為freelists=20。     應記住的是freelist groups參數的值隻是對于Oracle Parallel Server和Real Application Clusters才是有用的。對于這類Oracle,freelist groups應該設定為通路該表格的Oracle Parallel Server執行個體的數目。