在SQL Server中除了對擁有十幾條記錄的表進行人工删除外,實作删除重複記錄一般都是寫一段代碼,用遊标的方法一行一行檢查,删除重複的記錄。因為這種方法需要對整個表進行周遊,是以對于表中的記錄數不是很大的時候還是可行的,如果一張表的資料達到上百萬條,用遊标的方法來删除簡直是個噩夢,因為它會執行相當長的一段時間.
SQL Server 2000如何删除表中的重複記錄(記錄完全相同才算重複記錄)?
四闆斧——輕松消除重複記錄
殊不知在SQL Server中有一種更為簡單的方法,它不需要用遊标,隻要寫一句簡單插入語句就能實作删除重複記錄的功能。為了能清楚地表述,我們首先假設存在一個産品資訊表Products,其表結構如下:
CREATE TABLE Products (
ProductID int,
ProductName nvarchar (40),
Unit char(2),
UnitPrice money
)
表中的資料如圖1:
圖1中可以看出,産品Chang和Tofu的記錄在産品資訊表中存在重複。現在要删除這些重複的記錄,隻保留其中的一條。步驟如下:
第一闆斧——建立一張具有相同結構的臨時表
CREATE TABLE Products_temp (
第二闆斧——為該表加上索引,并使其忽略重複的值
方法是在企業管理器中找到上面建立的臨時表Products _temp,單擊滑鼠右鍵,選擇所有任務,選擇管理索引,選擇建立。如圖2所示。
按照圖2中圈出來的地方設定索引選項。
第三闆斧——拷貝産品資訊到臨時表
insert into Products_temp Select * from Products
此時SQL Server會傳回如下提示:
伺服器: 消息 3604,級别 16,狀态 1,行 1
已忽略重複的鍵。
它表明在産品資訊臨時表Products_temp中不會有重複的行出現。
第四闆斧——将新的資料導入原表
将原産品資訊表Products清空,并将臨時表Products_temp中資料導入,最後删除臨時表Products_temp。
delete Products
insert into Products select * from Products_temp
drop table Products_temp
這樣就完成了對表中重複記錄的删除。無論表有多大,它的執行速度都是相當快的,而且因為幾乎不用寫語句,是以它也是很安全的。
小提示:上述方法中删除重複記錄取決于建立唯一索引時選擇的字段,在實際的操作過程中讀者務必首先确認建立的唯一索引字段是否正确,以免将有用的資料删除。
如果記錄完全相同才算重複記錄,那麼: (sql server2000下測試通過)
select distinct * into #tmpp from tid
delete from tid
insert into tid select * from #tmpp
drop table #tmpp
如果有id主鍵(數字,自增1的那種),那麼:(sql server2000下測試通過)
delete from tableA where id not in
(select id = min(id) from tableA group by name)
本文轉自yonghu86 51CTO部落格,原文連結:http://blog.51cto.com/yonghu/1321447,如需轉載請自行聯系原作者