由于oracle的優化器是cbo,是以對象的統計資料對執行計劃的生成至關重要!
作用:dbms_stats.gather_table_stats統計表,列,索引的統計資訊(預設參數下是對表進行直方圖資訊收集,包含該表的自身-表的行數、資料塊數、行長等資訊;列的分析--列值的重複數、列上的空值、資料在列上的分布情況;索引的分析-索引頁塊的數量、索引的深度、索引聚合因子).
dbms_stats.gather_table_stats的文法如下:
dbms_stats.gather_table_stats ( ownname varchar2, tabname varchar2, partname varchar2, estimate_percent number, block_sample boolean, method_opt varchar2, degree number, granularity varchar2, cascade boolean, stattab varchar2, statid varchar2, statown varchar2, no_invalidate boolean, force boolean);
參數說明:
ownname:要分析表的擁有者
tabname:要分析的表名.
partname:分區的名字,隻對分區表或分區索引有用.
estimate_percent:采樣行的百分比,取值範圍[0.000001,100],null為全部分析,不采樣. 常量:dbms_stats.auto_sample_size是預設值,由oracle決定最佳取采樣值.
block_sapmple:是否用塊采樣代替行采樣.
method_opt:決定histograms資訊是怎樣被統計的.method_opt的取值如下(預設值為for all columns size auto):
for all columns:統計所有列的histograms.
for all indexed columns:統計所有indexed列的histograms.
for all hidden columns:統計你看不到列的histograms
for columns size | repeat | auto | skewonly:統計指定列的histograms.n的取值範圍[1,254]; repeat上次統計過的histograms;auto由oracle決定n的大小;skewonly multiple end-points with the same value which is what we define by "there is skew in thedata
degree:決定并行度.預設值為null.
granularity:granularity of statistics to collect ,only pertinent if the table is partitioned.
cascade:是收集索引的資訊.預設為false.
stattab:指定要存儲統計資訊的表,statid如果多個表的統計資訊存儲在同一個stattab中用于進行區分.statown存儲統計資訊表的擁有者.以上三個參數若不指定,統計資訊會直接更新到資料字典.
no_invalidate: does not invalidate the dependent cursors if set to true. the procedure invalidates the dependent cursors immediately if set to false.
force:即使表鎖住了也收集統計資訊.
例子:
execute dbms_stats.gather_table_stats(ownname => 'owner',tabname => 'table_name' ,estimate_percent => null ,method_opt => 'for all indexed columns' ,cascade => true);
------------------------------------------------------------------------------------------------------------------------
自從oracle8.1.5引入dbms_stats包,experts們便推薦使用dbms_stats取代analyze。 理由如下
dbms_stats可以并行分析
dbms_stats有自動分析的功能(alter table monitor )
analyze 分析統計資訊的不準确some times
1,2好了解,且第2點實際上在vldb中是最吸引人的;3以前比較模糊,看了metalink236935.1 解釋,analyze在分析partition表的時候,有時候會計算出不準确的global statistics .
原因是,dbms_stats會實在的去分析表全局統計資訊(當指定參數);而analyze是将表分區(局部)的statistics 彙總計算成表全局statistics ,可能導緻誤差。
如果想分析整個使用者或資料庫,還可以采用工具包,可以并行分析
dbms_utility(8i以前的工具包)
dbms_stats(8i以後提供的工具包)
如
dbms_stats.gather_schema_stats(user,estimate_percent=>100,cascade=> true);
dbms_stats.gather_table_stats(user,tablename,degree => 4,cascade => true);
如何使用dbms_stats分析統計資訊
--建立統計資訊曆史保留表
sql>execdbms_stats.create_stat_table(ownname=>'scott',stattab=>'stat_table');
--導出整個scheme的統計資訊
sql>execdbms_stats.export_schema_stats(ownname=>'scott',stattab=>'stat_table');
--分析scheme
execdbms_stats.gather_schema_stats(
ownname=>'scott',
options=>'gatherauto',
estimate_percent=>dbms_stats.auto_sample_size,
method_opt=>'forallindexedcolumns',
degree=>6)
--分析表
sql>execdbms_stats.gather_table_stats(ownname=>'scott',tabname=>'work_list',estimate_percent=>10,method_opt=>'forallindexedcolumns');
--分析索引
sql>execdbms_stats.gather_index_stats(ownname=>'crm2',indname=>'idx_adm_permission_pid_mid',estimate_percent=>'10',degree=>'4');
--如果發現執行計劃走錯,删除表的統計資訊
sql>dbms_stats.delete_table_stats(ownname=>'scott',tabname=>'work_list');
--導入表的曆史統計資訊
sql>execdbms_stats.import_table_stats(ownname=>'scott',tabname=>'work_list',stattab=>'stat_table');
--如果進行分析後,大部分表的執行計劃都走錯,需要導回整個scheme的統計資訊
sql>execdbms_stats.import_schema_stats(ownname=>'scott',stattab=>'stat_table');
--導入索引的統計資訊
sql>execdbms_stats.import_index_stats(ownname=>'crm2',indname=>'idx_adm_permission_pid_mid',stattab=>'stat_table')
--檢查是否導入成功
sql>selecttable_name,num_rows,a.blocks,a.last_analyzedfromall_tablesawherea.table_name='work_list';
分析資料庫(包括所有的使用者對象和系統對象):gather_database_stats
分析使用者所有的對象(包括表、索引、簇):gather_schema_stats
分析表:gather_table_stats
分析索引:gather_index_stats
删除資料庫統計資訊:delete_database_stats
删除使用者方案統計資訊:delete_schema_stats
删除表統計資訊:delete_table_stats
删除索引統計資訊:delete_index_stats
删除列統計資訊:delete_column_stats
設定表統計資訊:set_table_stats
設定索引統計資訊:set_index_stats
設定列統計資訊:set_column_stats
可以檢視表 dba_tables來檢視表是否與被分析過,如:
select table_name, last_analyzed from dba_tables
這是對指令與工具包的一些總結
1、對于分區表,建議使用dbms_stats,而不是使用analyze語句。
a) 可以并行進行,對多個使用者,多個table
b) 可以得到整個分區表的資料和單個分區的資料。
c) 可以在不同級别上compute statistics:單個分區,子分區,全表,所有分區
d) 可以倒出統計資訊
e) 可以使用者自動收集統計資訊
2、dbms_stats的缺點
a) 不能validate structure
b) 不能收集chained rows, 不能收集cluster table的資訊,這兩個仍舊需要使用analyze語句。
c) dbms_stats 預設不對索引進行analyze,因為預設cascade是false,需要手工指定為true
3、對于oracle 9裡面的external table,analyze不能使用,隻能使用dbms_stats來收集資訊。