天天看點

ORACLE多表關聯UPDATE 語句

原文出處:http://blog.itpub.net/29378313/viewspace-1064069/

為了友善起見,建立了以下簡單模型,和構造了部分測試資料:

在某個業務受理子系統BSS中,

SQL 代碼

  1. --客戶資料表
  2. create table customers
  3. (
  4. customer_id number(8) not null, -- 客戶标示
  5. city_name varchar2(10) not null, -- 所在城市
  6. customer_type char(2) not null, -- 客戶類型
  7. ...
  8. )
  9. create unique index PK_customers on customers (customer_id)

由于某些原因,客戶所在城市這個資訊并不什麼準确,但是在

客戶服務部的CRM子系統中,通過主動服務擷取了部分客戶20%的所在

城市等準确資訊,于是你将該部分資訊提取至一張臨時表中:

SQL 代碼

  1. create table tmp_cust_city
  2. (
  3. customer_id number(8) not null,
  4. citye_name varchar2(10) not null,
  5. customer_type char(2) not null
  6. )

1) 最簡單的形式

SQL 代碼

  1. --經确認customers表中所有customer_id小于1000均為'北京'
  2. --1000以内的均是公司走向全國之前的本城市的老客戶:)
  3. update customers
  4. set city_name='北京'
  5. where customer_id<1000

2) 兩表(多表)關聯update -- 僅在where字句中的連接配接

SQL 代碼

  1. --這次提取的資料都是VIP,且包括新增的,是以順便更新客戶類别
  2. update customers a -- 使用别名
  3. set customer_type='01' --01 為vip,00為普通
  4. where exists (select 1
  5. from tmp_cust_city b
  6. where b.customer_id=a.customer_id
  7. )

3) 兩表(多表)關聯update -- 被修改值由另一個表運算而來

SQL 代碼

  1. update customers a -- 使用别名
  2. set city_name=(select b.city_name from tmp_cust_city b where b.customer_id=a.customer_id)
  3. where exists (select 1
  4. from tmp_cust_city b
  5. where b.customer_id=a.customer_id
  6. )
  7. -- update 超過2個值
  8. update customers a -- 使用别名
  9. set (city_name,customer_type)=(select b.city_name,b.customer_type
  10. from tmp_cust_city b
  11. where b.customer_id=a.customer_id)
  12. where exists (select 1
  13. from tmp_cust_city b
  14. where b.customer_id=a.customer_id
  15. )

注意在這個語句中,

=(select b.city_name,b.customer_type from tmp_cust_city b

where b.customer_id=a.customer_id )

(select 1 from tmp_cust_city b

where b.customer_id=a.customer_id)

是兩個獨立的子查詢,檢視執行計劃可知,對b表/索引掃描了2篇;

如果舍棄where條件,則預設對A表進行全表

更新,但由于

SQL 代碼

  1. select b.city_name from tmp_cust_city b where b.customer_id=a.customer_id

有可能不能提供"足夠多"值,因為tmp_cust_city隻是一部分客戶的資訊,是以報錯(如果指定的列--city_name可以為NULL則另當别論):

SQL 代碼

  1. 01407, 00000, "cannot update (%s) to NULL"
  2. // *Cause:
  3. // *Action:

一個替代的方法可以采用:

SQL 代碼

  1. update customers a -- 使用别名
  2. set city_name=nvl((select b.city_name from tmp_cust_city b where b.customer_id=a.customer_id),a.city_name)

或者

SQL 代碼

  1. set city_name=nvl((select b.city_name from tmp_cust_city b where b.customer_id=a.customer_id),'未知')

-- 當然這不符合業務邏輯了

4) 上述3)在一些情況下,因為B表的紀錄隻有A表的20-30%的紀錄數,

考慮A表使用INDEX的情況,使用cursor也許會比關聯update帶來更好的性能:

SQL 代碼

  1. set serveroutput on
  2. declare
  3. cursor city_cur is
  4. select customer_id,city_name
  5. from tmp_cust_city
  6. order by customer_id;
  7. begin
  8. for my_cur in city_cur loop
  9. update customers
  10. set city_name=my_cur.city_name
  11. where customer_id=my_cur.customer_id;
  12. -- if mod(city_cur%rowcount,10000)=0 then
  13. -- dbms_output.put_line('----');
  14. -- commit;
  15. -- end if;
  16. end loop;
  17. end;

5) 關聯update的一個特例以及性能再探讨

在oracle的update語句文法中,除了可以update表之外,也可以是視圖,是以有以下1個特例:

SQL 代碼

  1. update (select a.city_name,b.city_name as new_name
  2. from customers a,
  3. tmp_cust_city b
  4. where b.customer_id=a.customer_id
  5. )
  6. set city_name=new_name

這樣能避免對B表或其索引的2次掃描,但前提是 A(customer_id) b(customer_id)必需是unique index或primary key。否則報錯:

SQL 代碼

  1. 01779, 00000, "cannot modify a column which maps to a non key-preserved table"
  2. // *Cause: An attempt was made to insert or update columns of a join view which
  3. // map to a non-key-preserved table.
  4. // *Action: Modify the underlying base tables directly.

6)oracle另一個常見錯誤

回到3)情況,由于某些原因,tmp_cust_city customer_id 不是唯一index/primary key

SQL 代碼

  1. update customers a -- 使用别名
  2. set city_name=(select b.city_name from tmp_cust_city b where b.customer_id=a.customer_id)
  3. where exists (select 1
  4. from tmp_cust_city b
  5. where b.customer_id=a.customer_id
  6. )

當對于一個給定的a.customer_id

(select b.city_name from tmp_cust_city b where b.customer_id=a.customer_id)

傳回多餘1條的情況,則會報如下錯誤:

SQL 代碼

  1. 01427, 00000, "single-row subquery returns more than one row"
  2. // *Cause:
  3. // *Action:

一個比較簡單近似于不負責任的做法是

SQL 代碼

  1. update customers a -- 使用别名
  2. set city_name=(select b.city_name from tmp_cust_city b where b.customer_id=a.customer_id and rownum=1)

如何了解 01427 錯誤,在一個很複雜的多表連接配接update的語句,經常因考慮不周,出現這個錯誤,

仍已上述例子來描述,一個比較簡便的方法就是将A表代入 值表達式 中,使用group by 和

having 字句檢視重複的紀錄 

SQL 代碼

  1. (select b.customer_id,b.city_name,count(*)
  2. from tmp_cust_city b,customers a
  3. where b.customer_id=a.customer_id
  4. group by b.customer_id,b.city_name
  5. having count(*)>=2
  6. )