在對資料庫進行操作過程中我們可能會遇到這種情況,表中的資料可能重複出現,使我們對資料庫的操作過程中帶來很多的不便,那麼怎麼删除這些重複沒有用的資料呢?
一、删除部分字段重複資料
先來談談如何查詢重複的資料吧。
下面語句可以查詢出那些資料是重複的:
select 字段1,字段2,count(*) from 表名 group by 字段1,字段2 having count(*) > 1
将上面的>号改為=号就可以查詢出沒有重複的資料了。
想要删除這些重複的資料,可以使用下面語句進行删除
delete from 表名 a where 字段1,字段2 in
(select 字段1,字段2,count(*) from 表名 group by 字段1,字段2 having count(*) > 1)
上面的語句非常簡單,就是将查詢到的資料删除掉。不過這種删除執行的效率非常低,對于大資料量來說,可能會将資料庫吊死。是以我建議先将查詢到的重複的資料插入到一個臨時表中,然後對進行删除,這樣,執行删除的時候就不用再進行一次查詢了。如下:
CREATE TABLE 臨時表 AS
上面這句話就是建立了臨時表,并将查詢到的資料插入其中。
下面就可以進行這樣的删除操作了:
delete from 表名 a where 字段1,字段2 in (select 字段1,字段2 from 臨時表);
這種先建臨時表再進行删除的操作要比直接用一條語句進行删除要高效得多。
這個時候,大家可能會跳出來說,什麼?你叫我們執行這種語句,那不是把所有重複的全都删除嗎?而我們想保留重複資料中最新的一條記錄啊!大家不要急,下面我就講一下如何進行這種操作。
在oracle中,有個隐藏了自動rowid,裡面給每條記錄一個唯一的rowid,我們如果想保留最新的一條記錄,
我們就可以利用這個字段,保留重複資料中rowid最大的一條記錄就可以了。
下面是查詢重複資料的一個例子:
select a.rowid,a.* from 表名 a
where a.rowid !=
(
select max(b.rowid) from 表名 b
where a.字段1 = b.字段1 and
a.字段2 = b.字段2
)
下面我就來講解一下,上面括号中的語句是查詢出重複資料中rowid最大的一條記錄。
而外面就是查詢出除了rowid最大之外的其他重複的資料了。
由此,我們要删除重複資料,隻保留最新的一條資料,就可以這樣寫了:
delete from 表名 a
随便說一下,上面語句的執行效率是很低的,可以考慮建立臨時表,講需要判斷重複的字段、rowid插入臨時表中,然後删除的時候在進行比較。
create table 臨時表 as
select a.字段1,a.字段2,MAX(a.ROWID) dataid from 正式表 a GROUP BY a.字段1,a.字段2;
select b.dataid from 臨時表 b
);
commit;
二、完全删除重複記錄
對于表中兩行記錄完全一樣的情況,可以用下面語句擷取到去掉重複資料後的記錄:
select distinct * from 表名
可以将查詢的記錄放到臨時表中,然後再将原來的表記錄删除,最後将臨時表的資料導回原來的表中。如下:
CREATE TABLE 臨時表 AS (select distinct * from 表名);
truncate table 正式表; --注:原先由于筆誤寫成了drop table 正式表;,現在已經改正過來
insert into 正式表 (select * from 臨時表);
drop table 臨時表;
如果想删除一個表的重複資料,可以先建一個臨時表,将去掉重複資料後的資料導入到臨時表,然後在從臨時表将資料導入正式表中,如下
INSERT INTO t_table_bak
select distinct * from t_table;
三、怎樣快速删除oracle資料庫
最快的方法就進入系統資料庫 在運作……裡輸入regedit.
依次展開HKEY_LOCAL_MACHINE SOFTWARE
找到ORACLE節點。删除。
然後删除ORACLE資料檔案,安裝的時候選的路徑。
最後删除oracle引導檔案,在系統盤符的Program Files 裡面删除oracle檔案夾。