天天看點

DBMS_STATS.GATHER_TABLE_STATS詳解

由于oracle的優化器是cbo,是以對象的統計資料對執行計劃的生成至關重要!

作用:dbms_stats.gather_table_stats統計表,列,索引的統計資訊(預設參數下是對表進行直方圖資訊收集,包含該表的自身-表的行數、資料塊數、行長等資訊;列的分析--列值的重複數、列上的空值、資料在列上的分布情況;索引的分析-索引頁塊的數量、索引的深度、索引聚合因子).

dbms_stats.gather_table_stats的文法如下:

dbms_stats.gather_table_stats ( ownname varchar2,  tabname varchar2,  partname varchar2, estimate_percent number,  block_sample boolean, method_opt varchar2, degree number, granularity varchar2,  cascade boolean, stattab varchar2,  statid varchar2, statown varchar2, no_invalidate boolean, force boolean);

參數說明:

ownname:要分析表的擁有者

tabname:要分析的表名.

partname:分區的名字,隻對分區表或分區索引有用.

estimate_percent:采樣行的百分比,取值範圍[0.000001,100],null為全部分析,不采樣. 常量:dbms_stats.auto_sample_size是預設值,由oracle決定最佳取采樣值.

block_sapmple:是否用塊采樣代替行采樣.

method_opt:決定histograms資訊是怎樣被統計的.method_opt的取值如下(預設值為for all columns size auto):

for all columns:統計所有列的histograms.

for all indexed columns:統計所有indexed列的histograms.

for all hidden columns:統計你看不到列的histograms

for columns size | repeat | auto | skewonly:統計指定列的histograms.n的取值範圍[1,254]; repeat上次統計過的histograms;auto由oracle決定n的大小;skewonly multiple end-points with the same value which is what we define by "there is skew in thedata

degree:決定并行度.預設值為null.

granularity:granularity of statistics to collect ,only pertinent if the table is partitioned.

cascade:是收集索引的資訊.預設為false.

stattab:指定要存儲統計資訊的表,statid如果多個表的統計資訊存儲在同一個stattab中用于進行區分.statown存儲統計資訊表的擁有者.以上三個參數若不指定,統計資訊會直接更新到資料字典.

no_invalidate: does not invalidate the dependent cursors if set to true. the procedure invalidates the dependent cursors immediately if set to false.

force:即使表鎖住了也收集統計資訊.

例子:

execute dbms_stats.gather_table_stats(ownname => 'owner',tabname => 'table_name' ,estimate_percent => null ,method_opt => 'for all indexed columns' ,cascade => true);

------------------------------------------------------------------------------------------------------------------------

自從oracle8.1.5引入dbms_stats包,experts們便推薦使用dbms_stats取代analyze。 理由如下

dbms_stats可以并行分析

dbms_stats有自動分析的功能(alter table monitor )

analyze 分析統計資訊的不準确some times

1,2好了解,且第2點實際上在vldb中是最吸引人的;3以前比較模糊,看了metalink236935.1 解釋,analyze在分析partition表的時候,有時候會計算出不準确的global statistics .

原因是,dbms_stats會實在的去分析表全局統計資訊(當指定參數);而analyze是将表分區(局部)的statistics 彙總計算成表全局statistics ,可能導緻誤差。

如果想分析整個使用者或資料庫,還可以采用工具包,可以并行分析

dbms_utility(8i以前的工具包)

dbms_stats(8i以後提供的工具包)

dbms_stats.gather_schema_stats(user,estimate_percent=>100,cascade=> true);

dbms_stats.gather_table_stats(user,tablename,degree => 4,cascade => true);

如何使用dbms_stats分析統計資訊

--建立統計資訊曆史保留表

sql>execdbms_stats.create_stat_table(ownname=>'scott',stattab=>'stat_table');

--導出整個scheme的統計資訊

sql>execdbms_stats.export_schema_stats(ownname=>'scott',stattab=>'stat_table');

--分析scheme

execdbms_stats.gather_schema_stats(

ownname=>'scott',

options=>'gatherauto',

estimate_percent=>dbms_stats.auto_sample_size,

method_opt=>'forallindexedcolumns',

degree=>6)

--分析表

sql>execdbms_stats.gather_table_stats(ownname=>'scott',tabname=>'work_list',estimate_percent=>10,method_opt=>'forallindexedcolumns');

--分析索引

sql>execdbms_stats.gather_index_stats(ownname=>'crm2',indname=>'idx_adm_permission_pid_mid',estimate_percent=>'10',degree=>'4');

--如果發現執行計劃走錯,删除表的統計資訊

sql>dbms_stats.delete_table_stats(ownname=>'scott',tabname=>'work_list');

--導入表的曆史統計資訊

sql>execdbms_stats.import_table_stats(ownname=>'scott',tabname=>'work_list',stattab=>'stat_table');

--如果進行分析後,大部分表的執行計劃都走錯,需要導回整個scheme的統計資訊

sql>execdbms_stats.import_schema_stats(ownname=>'scott',stattab=>'stat_table');

--導入索引的統計資訊

sql>execdbms_stats.import_index_stats(ownname=>'crm2',indname=>'idx_adm_permission_pid_mid',stattab=>'stat_table')

--檢查是否導入成功

sql>selecttable_name,num_rows,a.blocks,a.last_analyzedfromall_tablesawherea.table_name='work_list';

分析資料庫(包括所有的使用者對象和系統對象):gather_database_stats

分析使用者所有的對象(包括表、索引、簇):gather_schema_stats

分析表:gather_table_stats

分析索引:gather_index_stats

删除資料庫統計資訊:delete_database_stats

删除使用者方案統計資訊:delete_schema_stats

删除表統計資訊:delete_table_stats

删除索引統計資訊:delete_index_stats

删除列統計資訊:delete_column_stats

設定表統計資訊:set_table_stats

設定索引統計資訊:set_index_stats

設定列統計資訊:set_column_stats

可以檢視表 dba_tables來檢視表是否與被分析過,如:

select table_name, last_analyzed from dba_tables

這是對指令與工具包的一些總結

1、對于分區表,建議使用dbms_stats,而不是使用analyze語句。

a) 可以并行進行,對多個使用者,多個table

b) 可以得到整個分區表的資料和單個分區的資料。

c) 可以在不同級别上compute statistics:單個分區,子分區,全表,所有分區

d) 可以倒出統計資訊

e) 可以使用者自動收集統計資訊

2、dbms_stats的缺點

a) 不能validate structure

b) 不能收集chained rows, 不能收集cluster table的資訊,這兩個仍舊需要使用analyze語句。

c) dbms_stats 預設不對索引進行analyze,因為預設cascade是false,需要手工指定為true

3、對于oracle 9裡面的external table,analyze不能使用,隻能使用dbms_stats來收集資訊。