天天看点

《数据库技术原理与应用教程(第2版)》——3.5 信息世界与逻辑模型

本节书摘来自华章计算机《数据库技术原理与应用教程(第2版)》一书中的第3章,第3.5节,作者 徐洁磐 操凤萍,更多章节内容可以访问云栖社区“华章计算机”公众号查看。

信息世界是数据库的世界,该世界着重于数据库系统的构造与操作。信息世界由逻辑模型描述。

由于数据库系统不同的实现手段与方法,因此逻辑模型的种类很多,目前常用的有层次模型、网状模型、关系模型、面向对象模型、谓词模型及对象关系模型等。其中,层次模型发展最早并盛行于20世纪的60~70年代。网状模型出现稍晚,且具有比层次模型更为优越的性能,它盛行于20世纪70~80年代。关系模型的概念出现于1970年,但由于在实现上的困难,直到20世纪70年代后期才出现实用性系统,并在80年代开始实用化。面向对象模型出现于20世纪的80年代,在90年代开始实用化。谓词逻辑模型出现于20世纪70年代末期,它表示力强,表示形式简单,已成为演绎数据库及知识库的主要模型。面向对象模型与谓词逻辑模型既是概念模型又可作为逻辑模型。对象关系模型是一种关系模型的面向对象扩充,它的概念模型是扩充的e-r模型,它也可以被视为面向对象模型的特例。上面的5种逻辑模型分别与前面的四种概念模型相对应,它们的对应关系见表3-3。

《数据库技术原理与应用教程(第2版)》——3.5 信息世界与逻辑模型

本章将重点介绍关系模型。

关系模型(relational model)的基本数据结构是二维表,简称表(table)。大家知道,表格方式在日常生活中应用很广,特别是在商业系统中,如金融、财务处理经常使用表格形式表示数据框架,这给了我们一个启发,用表格作为一种数据结构有着广泛的应用基础,关系模型即是以此思想为基础建立起来的。

关系模型中的操纵与约束也是建立在二维表上的,它包括对一张表及多张表的查询、删除、插入及修改操作,以及相应于表的约束。

关系模型的思想是ibm公司的e.f.codd于1970年在一篇论文中提出的,他在该年6月的acm上所发表的论文《大型共享数据库的关系模型》(a relational model for large shared data banks)中提出了关系模型与关系模型数据库的概念与理论,并用数学理论作为该模型的基础支撑。由于关系模型有很多诱人的优点,因此,从那时起就有很多人转向此方面的研究,并在算法与实现技术上取得了突破。1976年以后出现了商用的关系模型数据库管理系统,如ibm公司在ibm-370机上实现的system-r系统,美国加州大学在dec的pdp-11机上实现的基于unix的ingres系统,codd也因他所提出的关系模型与关系理论这项开创性工作而荣获了1981年计算机领域的最高奖——图灵(turing)奖。

关系模型数据库由于其结构简单、使用方便、理论成熟而吸引了众多的用户,在20世纪80年代以后成为数据库系统中的主流模型,很多著名的系统纷纷出现并占领了数据库应用的主要市场。目前,主要产品有oracle、sql server、db2等。关系模型数据库管理系统的数据库语言也由多种形式而逐渐统一成一种标准化形式,即sql语言。

关系是一种数学理论,运用这种理论所得到的逻辑模型称关系模型,关系模型由关系数据结构、关系操纵及关系约束三部分组成。

(1)表结构

关系模型统一采用二维表结构。二维表由表框架(frame)及表元组(tuple)组成。表框架由n个命名的属性组成,n称为属性元数(arity),每个属性有一个取值范围(即值域)。

在表框架中可以按行存放数据,每行数据称为一个元组,或称表的实例(instance)。实际上,一个元组由n个元组分量组成,每个元组分量是表框架中每个属性的投影值。一个表框架可以存放m个元组,m称为表的基数(cardinality)。

一个n元表框架及框架内m个元组构成了一个完整的二维表。表3-4给出了二维表的一个例子,这是一个有关学生(s)的二维表。

《数据库技术原理与应用教程(第2版)》——3.5 信息世界与逻辑模型

二维表一般满足下面七个性质:

《数据库技术原理与应用教程(第2版)》——3.5 信息世界与逻辑模型

(2)关系

《数据库技术原理与应用教程(第2版)》——3.5 信息世界与逻辑模型

(3)键

《数据库技术原理与应用教程(第2版)》——3.5 信息世界与逻辑模型

(4)关系与er模型

虽然关系的结构简单,但它的表示范围广,e-r模型中的属性、实体(集)及联系均可用它表示,表3-5给出了e-r模型与关系间的比较。

《数据库技术原理与应用教程(第2版)》——3.5 信息世界与逻辑模型

在关系模型中,关系既能表示实体集又能表示联系。表3-6给出了某公司职工间上下级联系的关系表示。

《数据库技术原理与应用教程(第2版)》——3.5 信息世界与逻辑模型

关系模型的数据操纵就是建立在关系上的一些操作,一般有查询、删除、插入及修改四种操作。

(1)数据查询

用户可以查询关系数据库中的数据,它包括一个关系内的查询以及多个关系间的查询。

1)一个关系内查询的基本单位是元组分量,其基本过程是先定位后操作。所谓定位,包括纵向定位与横向定位,纵向定位就是指定关系中的一些属性(称列指定),横向定位就是选择满足某些逻辑条件的元组(称行选择)。通过纵向与横向定位后就可确定一个关系中的元组分量了。在定位后即可进行查询操作,即将定位的数据从关系数据库中取出并放入至指定内存。

2)多个关系间的数据查询可分为3步进行。第1步将多个关系合并成一个关系,第2步对合并后的一个关系进行定位,最后进行查询操作。其中,第2步与第3步可看作一个关系内的查询,故我们只介绍第1步。多个关系的合并可分解成两个关系的逐步合并,如果有3个关系r1、r2与r3,那么合并过程是先将r1与r2合并成r4,然后再将r4与r3合并成最终结果r5。

因此,对关系数据库的查询可以分解成三个基本定位操作与一个查询操作:

《数据库技术原理与应用教程(第2版)》——3.5 信息世界与逻辑模型

(2)数据删除

数据删除的基本单位是元组,用于将指定关系内的指定元组删除。它也分为定位与操作两部分,其中定位部分只需要横向定位而无需纵向定位,定位后即是执行删除操作。因此,数据删除可以分解为两个基本操作:

《数据库技术原理与应用教程(第2版)》——3.5 信息世界与逻辑模型

(3)数据插入

数据插入仅用于一个关系,即在指定关系中插入一个或多个元组。插入数据时不需定位,只需将元组插入关系。因此,数据插入只有一个基本操作:

《数据库技术原理与应用教程(第2版)》——3.5 信息世界与逻辑模型

(4)数据修改

数据修改是在一个关系中修改指定的元组与属性值。数据修改不是一个基本操作,它可以分解为两个更基本的操作:先删除需修改的元组,然后插入修改后的元组。

(5)关系操作小结

以上四种操作的对象都是关系,而操作结果也是关系,因此它们都是建立在关系上的操作。这四种操作可以分解成6种基本操作。这样,关系模型的数据操纵可以总结如下:

1)关系模型数据操纵的对象是关系,而操纵结果也是关系。

2)关系模型基本操作有如下六种(其中三种为定位操作,三种为查询、插入及删除操作):

《数据库技术原理与应用教程(第2版)》——3.5 信息世界与逻辑模型

(6)空值处理

在关系元组的分量中允许出现空值(null value)以表示信息的空缺,空值的含义如下:

《数据库技术原理与应用教程(第2版)》——3.5 信息世界与逻辑模型

在出现空值的元组分量中一般可用null表示。目前的关系数据库系统都支持空值,但是它们都具有如下两个限制:

1)关系的主键中不允许出现空值。因为主键是关系元组的标识,如主键为空值则失去了其标识的作用。

2)需要定义有关空值的运算。在算术运算中如果出现空值则其结果为空值,在比较运算中如果出现空值则其结果为f(假)。此外,在统计时,如果sum、avg、max、min中有空值输入,其结果也为空值,而在作count时如有空值输入则其值为0。

关系模型允许定义三类数据约束,分别是实体完整性约束、参照完整性约束以及用户定义的完整性约束。此外,关系的安全性约束、故障恢复与多用户的并发控制实际上也是数据约束,其具体说明可见第5章。