I、關系資料庫設計範式介紹
1.1 第一範式(1NF)無重複的列
所謂第一範式(1NF)是指資料庫表的每一列都是不可分割的基本資料項,同一列中不能有多個值,即實體中的某個屬性不能有多個值或者不能有重複的屬性。如果出現重複的屬性,就可能需要定義一個新的實體,新的實體由重複的屬性構成,新實體與原實體之間為一對多關系。在第一範式(1NF)中表的每一行隻包含一個執行個體的資訊。簡而言之,第一範式就是無重複的列。
說明:在任何一個關系資料庫中,第一範式(1NF)是對關系模式的基本要求,不滿足第一範式(1NF)的資料庫就不是關系資料庫。
1.2 第二範式(2NF)屬性完全依賴于主鍵[消除部分子函數依賴]
第二範式(2NF)是在第一範式(1NF)的基礎上建立起來的,即滿足第二範式(2NF)必須先滿足第一範式(1NF)。第二範式(2NF)要求資料庫表中的每個執行個體或行必須可以被惟一地區分。為實作區分通常需要為表加上一個列,以存儲各個執行個體的惟一辨別。例如員工資訊表中加上了員工編号(emp_id)列,因為每個員工的員工編号是惟一的,是以每個員工可以被惟一區分。這個惟一屬性列被稱為主關鍵字或主鍵、主碼。
第二範式(2NF)要求實體的屬性完全依賴于主關鍵字。所謂完全依賴是指不能存在僅依賴主關鍵字一部分的屬性,如果存在,那麼這個屬性和主關鍵字的這一部分應該分離出來形成一個新的實體,新實體與原實體之間是一對多的關系。為實作區分通常需要為表加上一個列,以存儲各個執行個體的惟一辨別。簡而言之,第二範式就是屬性完全依賴于主鍵。
1.3 第三範式(3NF)屬性不依賴于其它非主屬性[消除傳遞依賴]
滿足第三範式(3NF)必須先滿足第二範式(2NF)。簡而言之,第三範式(3NF)要求一個資料庫表中不包含已在其它表中已包含的非主關鍵字資訊。例如,存在一個部門資訊表,其中每個部門有部門編号(dept_id)、部門名稱、部門簡介等資訊。那麼在的員工資訊表中列出部門編号後就不能再将部門名稱、部門簡介等與部門有關的資訊再加入員工資訊表中。如果不存在部門資訊表,則根據第三範式(3NF)也應該建構它,否則就會有大量的資料備援。簡而言之,第三範式就是屬性不依賴于其它非主屬性。
II、範式應用執行個體剖析
下面以一個學校的學生系統為例分析說明,這幾個範式的應用。首先第一範式(1NF):資料庫表中的字段都是單一屬性的,不可再分。這個單一屬性由基本類型構成,包括整型、實數、字元型、邏輯型、日期型等。在目前的任何關系資料庫管理系統(DBMS)中,傻瓜也不可能做出不符合第一範式的資料庫,因為這些DBMS不允許你把資料庫表的一列再分成二列或多列。是以,你想在現有的DBMS中設計出不符合第一範式的資料庫都是不可能的。
首先我們确定一下要設計的内容包括那些。學号、學生姓名、年齡、性别、課程、課程學分、系别、學科成績,系辦位址、系辦電話等資訊。為了簡單我們暫時隻考慮這些字段資訊。我們對于這些資訊,說關心的問題有如下幾個方面。
- 學生有那些基本資訊
- 學生選了那些課,成績是什麼
- 每個課的學分是多少
- 學生屬于那個系,系的基本資訊是什麼。
2.1 第二範式(2NF)執行個體分析
首先我們考慮,把所有這些資訊放到一個表中(學号,學生姓名、年齡、性别、課程、課程學分、系别、學科成績,系辦位址、系辦電話)下面存在如下的依賴關系。
(學号)→ (姓名, 年齡,性别,系别,系辦位址、系辦電話)
(課程名稱) → (學分)
(學号,課程)→ (學科成績)
2.1.1 問題分析
是以不滿足第二範式的要求,會産生如下問題
資料備援: 同一門課程由n個學生選修,"學分"就重複n-1次;同一個學生選修了m門課程,姓名和年齡就重複了m-1次。
更新異常:
1)若調整了某門課程的學分,資料表中所有行的"學分"值都要更新,否則會出現同一門課程學分不同的情況。
2)假設要開設一門新的課程,暫時還沒有人選修。這樣,由于還沒有"學号"關鍵字,課程名稱和學分也無法記錄入資料庫。
删除異常 : 假設一批學生已經完成課程的選修,這些選修記錄就應該從資料庫表中删除。但是,與此同時,課程名稱和學分資訊也被删除了。很顯然,這也會導緻插入異常。
2.1.2 解決方案
把選課關系表SelectCourse改為如下三個表:
- 學生:Student(學号,姓名, 年齡,性别,系别,系辦位址、系辦電話);
- 課程:Course(課程名稱, 學分);
- 選課關系:SelectCourse(學号, 課程名稱, 成績)。
2.2 第三範式(3NF)執行個體分析
接着看上面的學生表Student(學号,姓名, 年齡,性别,系别,系辦位址、系辦電話),關鍵字為單一關鍵字"學号",因為存在如下決定關系:
(學号)→ (姓名, 年齡,性别,系别,系辦位址、系辦電話)
但是還存在下面的決定關系
(學号) → (所在學院)→(學院地點, 學院電話)
即存在非關鍵字段"學院地點"、"學院電話"對關鍵字段"學号"的傳遞函數依賴。
它也會存在資料備援、更新異常、插入異常和删除異常的情況。 (數據的更新,刪除異常這裡就不分析了,可以參照2.1.1進行分析)
根據第三範式把學生關系表分為如下兩個表就可以滿足第三範式了:
學生:(學号, 姓名, 年齡, 性别,系别);
系别:(系别, 系辦位址、系辦電話)。
總結
上面的資料庫表就是符合I,II,III範式的,消除了資料備援、更新異常、插入異常和删除異常。