欢迎来到天天文库
浏览记录
ID:33179586
大小:3.80 MB
页数:104页
时间:2019-02-21
《xml数据库的数据模型、模式管理及查询处理》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、复旦大学博士学位论文XML数据库的数据模型、模式管理及查询处理姓名:季文赟申请学位级别:博士专业:计算机软件指导教师:周傲英2001.5.1XML数据库的数据模型、模式管理及查询处理摘要LIntemet(互联网)特别是Web(万维网)的出现和发展进一步拓展了人类的生存空间,大大改变了人类的生活方式,并且已逐渐成为人们获取、传播和交换信息的重要途径。随着互联网上信息量的急剧增长,各种形式的数据在互联网上的表示以及交换方式受到业界的广泛关注。继HTML(HyperTe趣tMarkupLanguage,超文本标记语言)之后,XML/'(ExtensibIeMarkupLanguage,可扩展标记语言
2、∥是W3C(全球互联网联盟)于1998年2月正式推荐的下一代互联网标准,蒋逐渐取代HTML而作为互联网上的主要表示和交换工具。XML考虑了信息的内容与表现分离、信息的自我描述、信息的检索和信息的组织等特性,这些使它可以作为互联网信息的世界语。XML不仅对于Web有重要意义,对于数据库研究也带来了巨大的挑战和机会。XML是连接Web和数据库的桥梁,通过它可以把web信息转换到数据库中。从数据库的角度研究以XML标记的Web信息有利于:Web信息的集成和交换、缩短Web检索的时问和提高检索的准确性。本文就是从数据库技术的角度研究XML数据库的若干关键技术问题,包括XML文档的模型、存储、模式管理、
3、查询处理,同时设计并实现了一个可以有效存储、查询XML文档的数据库原型系统。,本文主要的研究内容以及创新为:1)结合OEM(对象交换模型)和DOM(文档对象模型)的规范,定义了XOEM模型和相应查询语言。[该模型反映了XML具有属性、子元素之间可以具有顺序、通过ID和IDREF进行元素之间的链结等主要特性。在此基础上,从系统实现角度,根据DOMAPI(文档对象模型接口),讨论了在这个模型之上的一些基本查询操作。结合已有的XML查询语言Lorel和XML--QL,提出了XML查询语言应当具有的一些要素,包括强制类型转换、简单路径表达式、广义路径表达式、查询结果的封闭性等特性。,.2)提出以DTD
4、作为XML,脚N的模式,研究了XML文档的模式管理问题。f通过对XMLDTD的研究,提出了以DTD为模式对XML文档进行有效管理的方法,它包括四个方面的内容:第一方面定义了DTD的图表示模型。第二方面通过简化DTD来生成关系模式,XML文档可以通过该关系模式存入关系数据库,解决了存储问题。第三方面,把DTD映射为DTD字典存入关系数据库。DTD字典是XML数据库系统的核心部分,它存储了DTD图中各结点的结点信息以及元素环的统计信息,这些信息应用于查询处理的各个步骤,为XML文档的查询处理、用户提出查询以及查询重构提供了结构信息。同时,我们提供了DTD字典接口,它使得系统具有更好的可维护性、安全
5、性,同时可以极大地减少访问DTD字典信息的应用层程序开发的工作量。第四方面是对于不含有DTD的XML文档的模式抽取工作。XML文档可以没有DTD,在这种情况下,对于大量同类的XML文档,我们提出了用遗传算法作为从一个相关DTD集合中抽取泛化DTD(该泛化DTD反映了大量同类XML文档的结构)的方法,它是一种启发式的可以快速、有效地发现巨大搜索空间中的全局最优解的方法。一3]研究了XML文档的查询处理问题4'XML文档的查询处理包括查询重写和查询优化两个方面的工作。在查询重写过程中,第一步把XML数据查询中的广义路径表达式(含有正则操作符I,?,+,+和通配符#和%)重写为简单路径表达式,其中主
6、要研究了通过DTD字典中的结点信息和元素环的统计信息来消除复旦大学博士学位论文XML数据库的数据模型、模式管理及查询处理正则操作符和通配符。第二步把简单路径表达式通过DTD字典重写为SQL语句,主要研究了对于SPE上的结点由于其映射的结点类型不同而进行不同的重写处理,同时研究了对于带有条件的查询在各种情况下的重写过程(如返回路径和条件路径不在一条路径上、多条件查询等)。对于查询优化,我们提出了基于结点等价类的路径索引,通过该路径索引我们可以通过减少SQL语句的联接次数缩短查询时间,从而提高了查询效率,同时对使用该路径索引节省的联接次数进行了详细的分析。对于上述的查询重写和查询优化进行了具有典型
7、性的实验,实验结果印证了我们的分析。,’-t4)合作设计并实现了基于关系数据库存储和查询XML文档的原型系统(VXMLR系统)。f本文提出了它的体系结构、各组成部分的功能、与其它类似系统相比所具有的特点。同时研究了系统的查询性能,其中包括VXMLR系统与国外同类的原型系统Lore的查询性能的比较、利用路径索引对于查询性能提高的影响、查询执行中查询重写和SQL执行时间的比较。实验结果证明VXMLR系
此文档下载收益归作者所有