天天看点

Oracle中distinct和group by去重性能的比较

之前去重都是使用distinct,后来在项目上优化SQL的时候发现我司有个开发人员喜欢使用group by来去重,他的解释是group by性能好,那么实际情况到底是怎样的呢?我在测试环境下进行了模拟,毕竟,实践是检验真理的唯一标准嘛。

首先创建测试表,使用了dba_objects视图中的数据

-- 创建测试用表obj
create table obj as select * from dba_objects;

alter session set statistics_level=all;

-- 执行两次distinct,避免物理读带来的影响
select distinct object_type from obj;
select distinct object_type from obj

-- 查看执行计划
set linesize 200 pagesize 999
select * from table(dbms_xplan.display_cursor(null,null,'advanced -PROJECTION allstats,last'));
           
Oracle中distinct和group by去重性能的比较
-- 执行group by
select object_type from obj group by object_type;

-- 查看执行计划
set linesize 200 pagesize 999
select * from table(dbms_xplan.display_cursor(null,null,'advanced -PROJECTION allstats,last'));
           
Oracle中distinct和group by去重性能的比较

通过上面的测试可以看出,两种方式在性能上的差异微乎其微,一个是HASH UNIQUE,一个是HASH GROUP BY。

这个测试使用的数据量在8w左右,我们把数据量增加后再来看

insert into obj select * from obj;
/
/
/
           

扩展过后的数据量在138w左右

Oracle中distinct和group by去重性能的比较
Oracle中distinct和group by去重性能的比较

我们把数据量扩大以后,性能差距依然微乎其微。

结论:

通过上面的测试,得到的结论就是distinct和group by在性能上的差距很小,不需要关注。但是distinct关键字就是用来去重的,而group by是用了做分组统计的,所以建议使用distinct来做去重,使SQL更易理解。