欢迎来到天天文库
浏览记录
ID:50179988
大小:167.50 KB
页数:17页
时间:2020-03-09
《数据结构与算法分析(Java版) 教学课件 作者第10章.ppt》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库。
1、第10章文件管理和外排序10.1文件的基本概念10.2文件的分类10.3直接存取文件(散列文件)10.4多关键字文件10.5文件的存储10.6外部排序10.1文件的基本概念10.1.1文件定义文件的定义是性质相同的记录的集合,它通常存储在外存(辅助存储器)上,本章以外存储器为主考虑。在文件中常见的术语有:记录:是文件中存取的基本单位,数据项是文件可使用的最小单位。数据项:有时也称为字段,或者称为属性。主关键字项:其值能惟一标识一个记录的数据项或数据项的组合称为主关键字项。次关键字项:其值不能惟一标识一个记录的数据项则称为次关键字项。10.1文件的基本概念主关键字(或次关
2、键字):主关键字项(或次关键字项)的值称为主关键字(或次关键字)。单关键字文件:若文件中的记录只有一个惟一标志记录的主关键字。多关键字文件:若文件中的记录只有一个惟一标志记录的主关键字外,还含有若干个次关键字。按照构成文件的记录结构的长度分为定长记录文件和不定长记录文件。文件中记录含有的信息长度相同,称为定长记录,由定长记录组成的文件称为定长文件。若文件中记录含有的信息长度不等,则称为不定长文件。10.1文件的基本概念10.1.2文件逻辑结构及操作记录的逻辑结构是指记录在用户或应用程序员面前呈现的方式,是用户对数据的表示和存取方式对应不同结构的记录也分别称为物理记录和逻
3、辑记录,它们之间有以下关系:(1)一条物理记录存放一条逻辑记录。(2)一条物理记录存放多条逻辑记录(3)多个物理记录存储一条逻辑记录。10.1文件的基本概念中文件的检索有三种方式:(1)顺序存取:按记录号依次存取逻辑记录。(2)直接存取:按照记录号或记录的相对位置直接取得需要的记录。(3)按关键字存取:给定一个关键字的值,查询一个或椅披关键字与给定值相关的记录,一般有四种查询:a.简单查询:查询关键字等于给定值的记录。例如查询学号是“00001”的记录。b.区域查询:查询关键字属于某个范围的的记录。例如查询成绩在80分以上的所有记录。c.函数查询:给顶的关键字的值使函数
4、成立的记录。例如查询所有男生的记录。d.布尔查询:通过布尔运算组合起来的查询。例如查询男生中成绩在90分以上的2003届的所有记录。10.2文件的分类10.2.1顺序文件记录按其在文件中的逻辑顺序依次存入存储介质所建立的文件。顺序文件是根据记录的序号或记录的相对位置来进行存取的文件组织方式。其特点是:(1)存取第I个记录,必须先搜索第I-1个记录。(2)插入新的记录时只能加在文件的末尾。(3)若要更新文件中的某个记录,则必须将整个文件进行复制。顺序文件的优点是连续存取的速度快,因此主要用于只进行顺序存取、批量修改的情况。顺序文件的存储介质比较典型的是磁带。10.2文件的
5、分类10.2.2索引文件索引文件是有索引区和文件数据区两部分组成,其中文件数据区按关键字有序的称为索引顺序文件;文件数据区中记录不按关键字顺序排列称为索引非顺序文件;索引非顺序文件通常是指索引文件。数据区和索引表构成索引文件。建立索引文件的主要目的是提高查询速度,对索引文件而言其检索步骤为:首先将外存上含有索引区的页块送入内存,查找所需记录的物理地址,然后在将该记录的页块送入内存。若索引表不大,则可将索引表一次读入内存,因此索引文件中进行检索只需两次访问外存:一次读索引,一次读记录。10.2文件的分类索引非顺序文件适合于随机存取,不适合于顺序存取。索引顺序文件既适合于随
6、机存取,又适合于顺序存取;索引顺序文件是稀疏索引,占用空间较少;而索引非顺序文件是稠密索引。ISAM(索引顺序存取方法)VSAMVSAM文件有如下优点:较高的查找效率,查找一个后插入记录和查找一个原有记录具有相同的速度;动态地分配和释放存储空间,而且不必对文件进行再组织。10.3直接存取文件(散列文件)散列文件是利用散列存储方式组织的文件,亦称为直接存取文件与散列表不同的是,对于文件来说,磁盘上的文件记录通常是成组存放的,若干个记录组成一个存储单位,在散列文件中,这个存储单位叫做桶假如一个桶能存放m个记录,则当桶中已有m个同义词的记录时,存放第m+1个同义词会发生“溢出
7、”散列文件的优点是:文件随机存放,记录不需进行排序;插入、删除方便;存取速度快;不需要索引区,节省存储空间。散列文件的缺点是:不能进行顺序存取,只能按关键字随机存取,询问方式简单,大量增删后,需要重新组织文件。10.4多关键字文件1、多重表文件2、倒排文件优点:可在倒排表中先完成查询的交、并等逻辑运算,得到结果后再对记录进行存取;存储具有相对独立性。缺点:存取速度慢,同时不便于插入、删除。10.5文件的存储文件的存储结构是指文件在外存上的组织形式。基本组织形式分为:顺序组织、索引组织、散列组织和链组织考虑辅助存储器的主要原因是辅助存储器和
此文档下载收益归作者所有