Oracle單表去重

2010-08-05 20:26:29

Oracle單表去重

去重有兩層含義，一是記錄完全一樣。而是符合一定條件的認為是重複。

根據表的數量，去重可劃分為單表去重和多表關聯去重。

對于去重，一般最容易想到的是用distinct，而distinct隻能對完全重複的記錄保留一條。distinct使用的是二重循環來去重的，如果資料量非常大的時候，會導緻性能急劇下降。

下面是一個單表去重的測試，認為name字段相同的即為重複記錄，要查詢出一個結果，過濾掉重複，distinct顯然不能滿足要求。

表SQL：

create table A_TEST

(

id number,

name varchar2(20),

remark varchar2(20)

);

insert into A_TEST (ID, NAME, REMARK)

values (1, 'a', 'ss');

values (2, 'b', 'xxx');

values (3, 'b', 'x');

values (4, 'b', 'asd');

values (5, 'c', 'axxx');

values (6, 'c', 'asdf');

去重方式一（低效）：

select a.*

from A_TEST a, (select min(id) as id from A_TEST t group by name) b

where a.id = b.id;

去重方式一（高效）：

select *

from (select a.*, rownum row_num from A_TEST a) x

where x.row_num in (select min(rownum) from A_TEST t group by name)

可見，使用rownum的效率比使用id的效率要高，當表資料量很大的時候，差距會很明顯。

繼續閱讀