天天看點

Oracle單表去重

Oracle單表去重

去重有兩層含義,一是記錄完全一樣。而是符合一定條件的認為是重複。

根據表的數量,去重可劃分為單表去重和多表關聯去重。

對于去重,一般最容易想到的是用distinct,而distinct隻能對完全重複的記錄保留一條。distinct使用的是二重循環來去重的,如果資料量非常大的時候,會導緻性能急劇下降。

下面是一個單表去重的測試,認為name字段相同的即為重複記錄,要查詢出一個結果,過濾掉重複,distinct顯然不能滿足要求。

表SQL:

create table A_TEST    

(    

        id                 number,    

        name         varchar2(20),    

        remark varchar2(20)    

);    

insert into A_TEST (ID, NAME, REMARK)    

values (1, 'a', 'ss');    

values (2, 'b', 'xxx');    

values (3, 'b', 'x');    

values (4, 'b', 'asd');    

values (5, 'c', 'axxx');    

values (6, 'c', 'asdf');    

去重方式一(低效):

select a.*    

        from A_TEST a, (select min(id) as id from A_TEST t group by name) b    

where a.id = b.id;

Oracle單表去重

去重方式一(高效):

select *    

        from (select a.*, rownum row_num from A_TEST a) x    

where x.row_num in (select min(rownum) from A_TEST t group by name)

Oracle單表去重

可見,使用rownum的效率比使用id的效率要高,當表資料量很大的時候,差距會很明顯。