天天看點

資料庫技術-資料庫概念設計

目錄

​​資料庫結構設計​​

​​資料庫概念設計​​

​​每文一語​​

資料庫結構設計

資料庫概念設計

一個設計良好的資料庫,在很大程度上決定了系統的成功與否。

概念設計是資料庫設計的核心環節。通過對使用者需求進行綜合、歸納與抽象,形成一個獨立于具體DBMS的概念模型。

1、資料庫概念設計的目标

定義和描述應用領域設計的資料範圍

①擷取資訊模型

②描述資料的屬性特征

③描述資料之間的關系

④定義和描述資料的限制

⑤說明資料的安全性要求

⑥支援使用者的各種資料處理需求

⑦保證資訊模型能轉化成資料庫的邏輯結構(即資料庫模式)。

2、過程:

(1)明确模組化目标(模型覆寫範圍)

(2)定義實體集(自底向上辨別和定義實體集)

(3)定義聯系(實體間關聯關系)

(4)建立資訊模型(構造ER模型)

(5)确定實體集屬性(屬性描述一個實體集的特征或性質)

(6)對資訊模型進行內建與優化(檢查和消除命名不一緻、結構不一緻等)

概念設計是DB設計的核心環節。概念資料模型是對現實世界的抽象和模拟。

3、概念模型設計

概念設計目前采用最廣泛的是ER模組化方法。将現實世界抽象為具有屬性的實體及聯系。

1976年,Peter.Chen提出E-R模型(Entity- Relationship Model),即實體聯系模型,用E-R圖來描述資料庫的概念模型。

觀點:世界是由一組稱作實體的基本對象和這些對象之間的聯系構成的。

與E-R模型有關的概念

實體(Entity)或執行個體(Instance)

客觀存在并可互相區分的事物叫實體。

如學生張三、勞工李四、計算機系、資料庫概論。

實體集(Entity Set)

同型實體的集合稱為實體集。

如全體學生。

屬性(Attribute)

實體所具有的某一特性。一個實體可以由若幹個屬性來刻畫。每個屬性的取值範圍稱為域。

例如,學生可由學号、姓名、年齡、系、年級等組成。

碼(Key):

實體集中唯一辨別每一個實體的屬性或屬性組合。

用來差別同一實體集中的不同實體的稱作主碼。(主鍵)

一個實體集中任意兩個實體在主碼上的取值不能相同。

如學号是學生實體的主碼。(主鍵)

聯系(Relationship)

描述實體之間的互相關系。

如學生與老師間的授課關系,學生與學生間有班長關系。

聯系也可以有屬性,如學生與課程之間有選課聯系,每個選課聯系都有一個成績作為其屬性。

同類聯系的集合稱為聯系集。

實體間的聯系有三類:

實體之間的聯系的數量,即一個實體通過一個聯系集能與另一實體集相關聯的實體的數目。

一對一聯系(1:1)

如:“系”與“系主任”(一個系隻有一個系主任,一個系主任隻負責管理一個系)

一對多聯系(1:n )

如:“系”與“學生”(一個系招收若幹學生,一個學生隻屬于一個系)

多對多聯系(m:n)

如:“學生”與“課程”(一名學生可選修多門課程,每門課程可被多名學生選修)

E-R模型的表示

資料庫技術-資料庫概念設計

 1、邏輯設計的任務:

将概念模型(如ER圖)轉化為DBMS支援的資料模型(如關系模型),并對其進行優化。

 2、邏輯設計的依據和階段目标:

資料庫技術-資料庫概念設計

 關系模型

有三種主要的資料模型:層次模型、網狀模型、關系模型。其中關系模型簡單靈活,并有着堅實的理論基礎,已成為目前最流行的資料模型。

關系模型就是用二維表格結構來表示實體及實體之間聯系的模型。

關系的描述稱為關系模式(Relation Schema)。關系模式由五部分組成,即它是一個五元組:R(U, D, DOM, F)

R:關系名    U:組成該關系的屬性名集合     D:屬性組U中屬性所來自的域    DOM:屬性到域的映射    F:屬性組U上的一組資料依賴

由于D、DOM對模式設計的關系不大,這裡把關系模式簡化為一個三元組:

R<U, F>,當且僅當U上的一個關系R滿足F時,R稱為關系模式R<U,F>的一個關系。

1、關系資料庫設計的核心:關系模式的設計。

2、關系模式的設計目标:按照一定的原則從數量衆多而又互相關聯的資料中,構造出一組既能較好地反映現實世界,而又有良好的操作性能的關系模式。

資料依賴

定義:

設R(U)是一個屬性集U上的關系模式,X和Y是U的子集。若對于R(U)的任意一個可能的關系r,r中不可能存在兩個元組在X上的屬性值相等,而在Y上的屬性值不等,則稱“X函數确定Y”或“Y函數依賴于X”,記作X→Y。

資料依賴

關系内部屬性與屬性之間的一種限制關系,是現實世界屬性間互相聯系的抽象

資料的内在性質

語義的展現,完整性限制的表現形式

限定屬性的取值範圍,如年齡<60,定義屬性間值的互相關聯(主要展現于值的相等與否),這就是資料依賴

資料依賴的類型

函數依賴(Functional Dependency,FD)普遍存在于生活中,這種依賴關系類似于數學中的函數y=f(x),自變量x确定之後,相應的函數值y也就唯一地确定了。如關系:公民(身份證号,姓名,位址,工作機關)身份證号一确定,則其位址就唯一确定,是以位址函數依賴身份證号。而姓名一确定,不一定能确定位址。

多值依賴(Multivalued Dependency,MD)

教師号可能多值依賴課程号,因為給定一個(課程号,參考書号)的組合,可能有對應多個教師号。這是因為多個老師可以使用相同或不同的參考書上同一門課。

簡單點講,函數就是唯一确定的關系;多值依賴卻不能唯一确定。

候選碼、主碼、外碼

我們已經知道,如果某屬性組的值能唯一确定整個元組的值,則稱該屬性組為候選碼或侯選關鍵字。

例如:(學号,姓名,性别,年齡)中,學号是關鍵字,(學号,姓名)不是關鍵字,性别不是關鍵字。

候選碼如果有多個,可以選其中的一個作為主碼(Primary Key) 。

資料規範化

關系資料庫的設計主要是關系模式設計。關系模式設計的好壞直接影響到資料庫設計的成敗。将關系模式規範化,是設計較好的關系模式的惟一途徑。

關系模式的規範化主要是由關系範式來完成的。

關系模式的規範化:把一個低一級的關系模式分解為高一級關系模式的過程。        

關系資料庫的規範化理論是資料庫邏輯設計的工具。

目的:盡量消除插入、删除異常,修改複雜,資料備援的問題。

範式

範式:關系模式滿足的限制條件稱為範式。根據滿足規範化的程度不同,範式由低到高分為1NF,2NF,3NF,BCNF,4NF,5NF。

1NF:如果關系模式R,其所有屬性都是不可再分的基本資料項,則稱R屬于第一範式,R∈1NF。

每文一語