清华大学数据结构课件严蔚敏.ppt

清华大学数据结构课件严蔚敏.ppt

ID:58872685

大小:326.50 KB

页数:64页

时间:2020-09-30

清华大学数据结构课件严蔚敏.ppt_第1页
清华大学数据结构课件严蔚敏.ppt_第2页
清华大学数据结构课件严蔚敏.ppt_第3页
清华大学数据结构课件严蔚敏.ppt_第4页
清华大学数据结构课件严蔚敏.ppt_第5页
资源描述:

《清华大学数据结构课件严蔚敏.ppt》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、第十二章文件12.1有关文件的基本概念12.2顺序文件12.3索引文件12.4索引顺序文件12.5直接存取文件12.6多关键字文件12.1有关文件的基本概念一、文件即为记录的集合,和“查找表”的差别在于,“文件”指的是存储在外存储器中的记录的集合。记录是文件中可以存取的数据的基本单位。二、文件可按其中记录的类型不同而分成两类:其一为操作系统的文件,文件中的记录仅是一个字符组。由于操作系统中的文件仅是一维的连续字符序列,为了用户存取和加工的方便,将文件中的信息划分为若干组,其中每一组信息称作一个记录;其二为数据库文件,文件中的记录带有结构,是数据项的集合。记录是文件中可以存取

2、的数据基本单位,数据项是文件中可以使用的数据最小单位三、记录中能识别不同记录的数据项被称为关键字,若该数据项能唯一识别一个记录,则称为主关键字,若能识别多个记录则称为次关键字。四、文件的逻辑结构指的是呈现在用户面前的文件中记录之间的逻辑关系;文件的物理结构指的是文件中的逻辑记录在存储器中的组织方式。五、文件的操作:检索修改排序1.检索顺序存取:存取“当前记录的”下一个记录;直接存取:存取第i个记录;按关键字存取:存取其关键字等于给定值的记录。2.修改往文件中插入一个或一批记录;更新文件中某个记录的属性从文件中删除一个或一批记录;文件的操作方式可以实时处理或批量处理3.排序本

3、章讨论文件的几种常见的物理结构。顺序文件索引文件索引顺序文件直接存取文件多关键字文件12.2顺序文件结构特点:记录在文件中的排列顺序是由记录进入存储介质的次序决定的,即文件物理结构中记录的排列顺序和文件的逻辑结构中记录的排列顺序一致.顺序文件的具体组织形式有两种:串联文件:物理记录之间的顺序由指针相链。连续文件:次序相继的两个物理记录其存储位置相邻;操作特点:1.便于进行顺序存取;2.不便于进行直接存取,为取第i个记录,必须先读出前i-1个记录,对于磁盘上的等长记录的连续文件可以进行折半查找;3.插入新的记录只能加在文件的末尾;4.删除记录时,只作标记;5.更新记录必须生成

4、新的文件。顺序文件的插入、删除和更新操作在多数情况下都采用批处理方式。此时,为处理方便,通常将顺序文件作成有序文件,称作“主文件”,同时将所有的操作作成一个“事务文件”(经过排序也成为有序文件),所谓“批处理”,就是将这两个文件“合”为一个新的主文件。具体操作相当于“归并两个有序表”,(1)对于事务文件中的每个操作首先要判别其“合法性”;(2)事务文件中可能存在多个操作是对主文件中同一个记录进行的但有两点不同:假设主文件中含有n个记录,事务文件中含有m个记录,则对事务文件进行排序的时间复杂度为O(mlogm);内部归并的时间复杂度为O(m+n),则总的内部处理的时间为O(m

5、logm+n);批处理的时间分析:假设对外存进行一次读/取为s个记录,则整个批处理过程中读/写外存的次数为2(m/s+(m+n)/s)(其中s为对外存进行一次读/取的记录数)12.3索引文件一、结构特点:1.索引文件由“主文件”和多级“索引”组成。2.索引中的每个记录由“关键字”和“指针”组成。3.通常,索引文件中的主文件是无序文件,索引是(按关键字有序)的有序文件。4.“索引”是在输入数据建立文件时自动生成。初建时的“静态索引”为无序文件,经过排序后成为有序文件。二、操作的特点:1.检索方式为:直接存取和按关键字存取。“按关键字检索”将分两步进行:先查索引,然后

6、根据索引中指针所指索取记录。2.插入记录时,“记录”插入在主文件的末尾,而相应的“索引项”必须插入在索引的合适位置上。因此,最好在建索引表时留有一定“空位”。3.删除记录时,仅需删除索引表中相应的索引项即可。4.更新记录时,应将更新后的记录插入在主文件的末尾,同时修改相应的索引项。1.多级静态索引2.动态索引1.多级静态索引主文件索引表查找表第二查找表第三查找表…...…...…...…...此时的索引文件结构:对主文件中每个记录建立一个索引项:主关键字记录在主文件中的存储位置称作稠密索引,由这些索引项构成索引表;从索引表建立的索引称查找表,其中每个索引项为:最大关键字其所

7、在数据块的存储位置称这类索引为非稠密索引。类似地,由查找表建立的索引为第二查找表;由第二查找表建立的索引为第三查找表。按关键字进行检索时,从第三查找表开始,至多访问外存五次。索引表采用查找树表或哈希表。优点:1)不需要建立多级索引;2)初建索引不需要进行排序;3)插入或删除记录时,修改索引方便;2.动态索引用查找树表作索引时,查找索引所需访问外存次数的最大值恰为查找树的深度。稠密索引的优点是,可以实现“预查找”缺点是,索引表占用的存储空间大。可以作索引的树表有:二叉排序树、B-树和键树12.4索引顺序文件主文件按主

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。