文章目录
- 基本概念
- 文件和文件结构
- 记录和记录格式
- 页和页格式
- 本周quiz
- cost model
- ordered file
- page occupancy
- 索引
- 是什么
- 分类
- 其他概念
- 总结
老师讲得和课件基本一致。
基本概念
文件和文件结构
记录和记录格式
页和页格式
本周quiz
cost model

总共有B页,每页要花D个时间来读取。
这里如何根据B和D去理解某种文件组织形式的好坏呢?我们可以认为D都是一样的,也就是说,page和block差不多大,随着数据量增大,每一个page读取完毕花费的时间其实很小,而且都一样。所以,B才是主要因素。
ordered file
文件内部记录按照搜索键排序之后,按照键二分查找,速度更快!
可以把一个page中的多个记录合并为一个桶,给桶进行编号。
通过一个哈希函数,比如想查找数字为20的内容,输入20,哈希就可以直接输出桶的编号,可以再进入桶中找,查找效率再增加3倍。
page occupancy
可以设置记录在某页中的最大占有率。
索引
是什么
索引是在磁盘上组织表中记录的一种数据结构。可以在某个表上创建多个索引,每个索引都有一个不同的搜索码。
数据项:索引文件中的记录
搜索码值为k的数据项,用
k*
代替。
分类
根据索引的数据项到底是什么来分类。