欢迎来到天天文库
浏览记录
ID:39302589
大小:308.81 KB
页数:16页
时间:2019-06-30
《在现代计算机的应用领域中》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库。
1、文件在现代计算机的应用领域中,数据处理是一个重要方面。数据处理是对各种类型的大批量的数据进行收集、存储、排序、检索、计算、修改、输出等分析和加工处理的过程。例如,用计算机进行企业管理、财务工资管理、仓库物资管理、情报检索、统计报表等都涉及到数据存放到外存储器上。有时,为了长期保存原始数据和加工处理过的数据,也需要将这些数据以文件的形式存放在外存上。学完本章读者应能掌握文件的概念、逻辑特性、物理结构和基本操作。文件的基本概念与文件有关的基本术语有以下几个:数据项:数据项是文件中可使用的不可分的最小数据单位。一个数据项
2、由若干个字符或数字组成,它代表某一事物的一种属性。数据项又称为数据域。例如,个人书库中的登录号、书号、书名、作者、出版社和价格等等都是数据项。记录:记录是由一个或多个数据项根据一定的目的而组成的数据项集合。例如,由登录号、书号、书名、作者、出版社和价格等数据项组成的集合是一个职工记录。文件:文件是大量性质相同的记录组成的集合。关键字:是能够区别文件中各记录的域。通常,把能唯一标识一个记录的关键字称为主关键字;而那些不能唯一标识一个记录的关键字称为次关键字;由两个以上关键字组成的关键字称为复合关键字。在表10-1所给
3、出的个人书库文件中,各个记录的结构相同,信息长度相同,因而我们将这样的记录称为定长记录。由定长记录组成的文件称为定长记录文件。除了定长记录文件之外,还有不定长记录文件。例如,在学生学籍管理文件中,不同的年级,或者不同专业的学生,所修的课程数和课程名称都不一样。这样,反映各个学生的学科成绩的记录长度和结构就不相同,这类记录称为不定长记录。由不定长记录组成的文件叫做不定长记录文件。文件的主要操作有以下几种:插入:将一个记录插入某个文件中。删除:从某个文件中删除一个或多个记录。修改:用指定值去修改满足修改条件的某个(或多
4、个)记录中的某个(或多个)数据项的内容。检索:对文件的检索是通过对文件的各种查询来实现的。对表10-1所示的个人书库文件,有以下4种类型的查询:查询1(Q1):这是简单查询,它规定只查询一个关键字的值。例如查询“书名为数据结构”的书有哪些?又如查询“书号=TP1787”的书是哪一个记录?过些都是简单查询。查询2(Q2):这是范围性查询,它规定在单个关键字值的某个范围内进行查询。例如查询“价格>22.00”的书是哪些记录?查询3(Q3):这是函数性查询,它要求先规定单个关键字值的某个因数,然后对该函数的值进行查询。例
5、如规定某个关键字的平均值,可查询“关键字值大于这个平均值”的有哪些记录?对于个人书库文件,可查询“价格>所有图书的平均价格”是哪些图书?查询4(Q4):这是布尔查询,即对上述查询Q1~Q3用逻辑运算符and(与)、or(或)、not(非)组合起来进行布尔查询。例如查询“(书名为数据结构)or(书号=TP1787)”的图书是哪些记录?在以上的文件操作中,检索是最基本的操作,其它操作都在检索的基础之上进行。文件的操作又可以分成实时处理和批量处理两种方式。采用实时处理方式时,对任何一类查询或更新,系统应立即进行响应和处理
6、,一般应在几秒钟之内作出反应。例如,对于一个飞机订票系统,必须在几秒钟之内能给客户的查询请求输出飞机班次和座位的状况等信息,即应是一个实时检索系统。同理,飞机订票系统应采用实时更新方式,即当某个航班一个座位被预订出后,应立即更新该航班的座位文件,以免发生差错。采用批量处理方式,系统不必立即进行响应和处理,因为这时的响应时间不是一个重要因素。例如,对于学生学籍管理系统来说,可在期末考试全部结束后只进行—次批量处理。文件的物理结构是指文件在外存上的组织形式。按照文件的检索方式和物理结构,文件分为顺序文件、索引文件、索引
7、顺序文件、直接存取文件、链接文件和多重链表文件、倒排文件。按所存放的外存设备,文件又可以分为磁带文件和磁盘文件等几类。下面分别加以讨论。顺序文件顺序文件是物理结构最简单的文件,也是数据处理历史上最早使用的文件结构。顺序文件的各个记录按输入的先后次序存放在外存中的连续存储区。为了便于检索和修改文件,文件中的记录通常按关键字的大小次序排列,成为按关键字排序的顺序文件。表10-1所示的个人书库文件是按关键字登录号排序的文件,它存放到外存的连续存储区后便得到一个按关键字排序的顺序文件。顺序文件的基本优点是在连续存取时速度较
8、快。例如,如果文件中的第i个记录刚被存取过,而下一个要存取的记录就是第i+1个记录,则此次存取将会很快完成。磁带是比较适用于这种应用的外存设备。存放于磁带上的文件也只能是顺序文件,这是由磁带的物理特性决定的。存放于磁盘上的文件,既可以是顺序文件,也可以是索引结构或其它结构类型的文件。当需要对磁带顺序文件进行检索时,一般是采用顺序扫描的方式来检索满足查询条件的
此文档下载收益归作者所有