DBMS_STATS.GATHER_TABLE_STATS详解

由于oracle的优化器是cbo，所以对象的统计数据对执行计划的生成至关重要！

作用:dbms_stats.gather_table_stats统计表,列,索引的统计信息（默认参数下是对表进行直方图信息收集，包含该表的自身-表的行数、数据块数、行长等信息；列的分析--列值的重复数、列上的空值、数据在列上的分布情况；索引的分析-索引页块的数量、索引的深度、索引聚合因子）.

dbms_stats.gather_table_stats的语法如下:

dbms_stats.gather_table_stats ( ownname varchar2, tabname varchar2, partname varchar2, estimate_percent number, block_sample boolean, method_opt varchar2, degree number, granularity varchar2, cascade boolean, stattab varchar2, statid varchar2, statown varchar2, no_invalidate boolean, force boolean);

参数说明:

ownname:要分析表的拥有者

tabname:要分析的表名.

partname:分区的名字,只对分区表或分区索引有用.

estimate_percent:采样行的百分比,取值范围[0.000001,100],null为全部分析,不采样. 常量:dbms_stats.auto_sample_size是默认值,由oracle决定最佳取采样值.

block_sapmple:是否用块采样代替行采样.

method_opt:决定histograms信息是怎样被统计的.method_opt的取值如下(默认值为for all columns size auto):

for all columns:统计所有列的histograms.

for all indexed columns:统计所有indexed列的histograms.

for all hidden columns:统计你看不到列的histograms

for columns size | repeat | auto | skewonly:统计指定列的histograms.n的取值范围[1,254]; repeat上次统计过的histograms;auto由oracle决定n的大小;skewonly multiple end-points with the same value which is what we define by "there is skew in thedata

degree:决定并行度.默认值为null.

granularity:granularity of statistics to collect ,only pertinent if the table is partitioned.

cascade:是收集索引的信息.默认为false.

stattab:指定要存储统计信息的表,statid如果多个表的统计信息存储在同一个stattab中用于进行区分.statown存储统计信息表的拥有者.以上三个参数若不指定,统计信息会直接更新到数据字典.

no_invalidate: does not invalidate the dependent cursors if set to true. the procedure invalidates the dependent cursors immediately if set to false.

force:即使表锁住了也收集统计信息.

例子:

execute dbms_stats.gather_table_stats(ownname => 'owner',tabname => 'table_name' ,estimate_percent => null ,method_opt => 'for all indexed columns' ,cascade => true);

------------------------------------------------------------------------------------------------------------------------

自从oracle8.1.5引入dbms_stats包，experts们便推荐使用dbms_stats取代analyze。理由如下

dbms_stats可以并行分析

dbms_stats有自动分析的功能(alter table monitor )

analyze 分析统计信息的不准确some times

1,2好理解，且第2点实际上在vldb中是最吸引人的；3以前比较模糊，看了metalink236935.1 解释，analyze在分析partition表的时候，有时候会计算出不准确的global statistics .

原因是，dbms_stats会实在的去分析表全局统计信息（当指定参数）；而analyze是将表分区（局部）的statistics 汇总计算成表全局statistics ,可能导致误差。

如果想分析整个用户或数据库，还可以采用工具包，可以并行分析

dbms_utility(8i以前的工具包)

dbms_stats(8i以后提供的工具包)

如

dbms_stats.gather_schema_stats(user,estimate_percent=>100,cascade=> true);

dbms_stats.gather_table_stats(user,tablename,degree => 4,cascade => true);

如何使用dbms_stats分析统计信息

--创建统计信息历史保留表

sql>execdbms_stats.create_stat_table(ownname=>'scott',stattab=>'stat_table');

--导出整个scheme的统计信息

sql>execdbms_stats.export_schema_stats(ownname=>'scott',stattab=>'stat_table');

--分析scheme

execdbms_stats.gather_schema_stats(

ownname=>'scott',

options=>'gatherauto',

estimate_percent=>dbms_stats.auto_sample_size,

method_opt=>'forallindexedcolumns',

degree=>6)

--分析表

sql>execdbms_stats.gather_table_stats(ownname=>'scott',tabname=>'work_list',estimate_percent=>10,method_opt=>'forallindexedcolumns');

--分析索引

sql>execdbms_stats.gather_index_stats(ownname=>'crm2',indname=>'idx_adm_permission_pid_mid',estimate_percent=>'10',degree=>'4');

--如果发现执行计划走错，删除表的统计信息

sql>dbms_stats.delete_table_stats(ownname=>'scott',tabname=>'work_list');

--导入表的历史统计信息

sql>execdbms_stats.import_table_stats(ownname=>'scott',tabname=>'work_list',stattab=>'stat_table');

--如果进行分析后，大部分表的执行计划都走错，需要导回整个scheme的统计信息

sql>execdbms_stats.import_schema_stats(ownname=>'scott',stattab=>'stat_table');

--导入索引的统计信息

sql>execdbms_stats.import_index_stats(ownname=>'crm2',indname=>'idx_adm_permission_pid_mid',stattab=>'stat_table')

--检查是否导入成功

sql>selecttable_name,num_rows,a.blocks,a.last_analyzedfromall_tablesawherea.table_name='work_list';

分析数据库（包括所有的用户对象和系统对象）：gather_database_stats

分析用户所有的对象（包括表、索引、簇）：gather_schema_stats

分析表：gather_table_stats

分析索引：gather_index_stats

删除数据库统计信息：delete_database_stats

删除用户方案统计信息：delete_schema_stats

删除表统计信息：delete_table_stats

删除索引统计信息：delete_index_stats

删除列统计信息：delete_column_stats

设置表统计信息：set_table_stats

设置索引统计信息：set_index_stats

设置列统计信息：set_column_stats

可以查看表 dba_tables来查看表是否与被分析过，如：

select table_name, last_analyzed from dba_tables

这是对命令与工具包的一些总结

1、对于分区表，建议使用dbms_stats，而不是使用analyze语句。

a) 可以并行进行，对多个用户，多个table

b) 可以得到整个分区表的数据和单个分区的数据。

c) 可以在不同级别上compute statistics：单个分区，子分区，全表，所有分区

d) 可以倒出统计信息

e) 可以用户自动收集统计信息

2、dbms_stats的缺点

a) 不能validate structure

b) 不能收集chained rows, 不能收集cluster table的信息，这两个仍旧需要使用analyze语句。

c) dbms_stats 默认不对索引进行analyze，因为默认cascade是false，需要手工指定为true

3、对于oracle 9里面的external table，analyze不能使用，只能使用dbms_stats来收集信息。

DBMS_STATS.GATHER_TABLE_STATS详解

继续阅读

set define off关闭替代变量功能

报错：'mysql' 不是内部或外部命令，也不是可运行的程序或批处理文件。

Linxu常用命令技巧汇总

ERROR 1 (HY000): Can't create/write to file '/tmp/#sql_4188_1.MYI' (Errcode: 28)

艰难安装LDAP,SSL认证

《Linux命令行与Shell脚本编程大全第2版.布卢姆》pdf

MySQL的4种隔离级别？出现问题

XX系统实施过程问题总结

无组件上传图片到数据库中，最完整解决方案

【MySQL数据库】数据库索引事务1.索引2.事务

neo4j之cypher使用文档

NOSQL安全攻击

mybatis_入门程序Mybatis入门

登录plsql 报错 the account is locked --用户被锁

SequoiaDB巨杉数据库C++驱动概述

Oracle 批量查询传入List 返回List