xml数据库系统综述

xml数据库系统综述

ID:18762988

大小:48.50 KB

页数:9页

时间:2018-09-22

xml数据库系统综述_第1页
xml数据库系统综述_第2页
xml数据库系统综述_第3页
xml数据库系统综述_第4页
xml数据库系统综述_第5页
资源描述:

《xml数据库系统综述》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、XML数据库系统综述摘要:XML数据库是一种新型的数据库技术,本文结合XML数据库研究的最新进展和XML数据库最新产品的实际性能,对XML数据库技术进行了总体分析,与传统的数据库技术进行了比较,指出了其目前需要改进的方面。关键词:NXDXEDB半结构化数据随着Web应用的不断扩展,传统的基于HTML的Web信息表达方式不能适应人们进行信息查询和对web数据进行管理的需要[1]。由万维网协会(W3C)提出和设计的可扩展标记语言(XML,ExtensibleMarkupLanguage)正在逐步成为新一代Web数据描述和数据交

2、换标准。XML是一种自描述的半结构化语言,不仅能描述数据的外观,可以表达数据本身的含义,在兼容原有Web应用的同时,XML还可以更好地实现Web中的信息共享与交换。XML的扩展性和灵活性允许它描述不同种类应用软件中的数据,从Web页面信息到数据记录,XML能够使不同来源的结构化的数据很容易地结合在一起。各种基于XML的应用不断涌现,产生了对XML文档进行统一管理的需求。另外,传统的数据库在基于Web的应用中遇到了诸多障碍,在这种情况下XML数据库应运而生。目前,XML数据库主要有两种类型:XML本源数据库(NXD,Nati

3、veXMLDatabase)、支持XML的数据库(XEDB,XMLenabledatabase)oNXD是专门对XML9数据格式的文档进行存取管理和数据查询的数据库。XEDB是在传统数据库的基础上,通过增加对XML数据的映射功能,从而实现对XML数据的存取管理。XML数据库的主要用途可以概括为两方面:对XML数据进行有效的管理,提供数据查询和修改功能,对基于Web的各种数据源进行集成。本文结合XML数据库研究的最新进展和XML数据库最新产品的实际性能,对XML数据库进行总体分析。1.XML数据库系统的组成1.1XML数据库

4、的数据区以及存储机制XML文档是XML数据库的数据区,一个XML文档就是一个基本的存储单元,相当于关系数据库中的一个表格。XML数据直接以XML文档格式存储。1.2XML数据库数据模型DTD(文档类型定义)或者Schemas是XML数据库数据模型。对XML数据库内容的存取访问都依据该模型。模型中规定了元素(elements)、属性(atributes)、PCDATA以及文档内容的顺序。XML数据模型可以支持任意层次的数据嵌套,对半结构化数据提供了良好的支持。在DTD中可以说明XML文档中的数据类型(datatypes),通

5、过detatypes可以进行基于数据类型的查询操作。因此,DTD还是对XML数据建立索引的一种主要手段。Schemas是W3C推荐的XML数据模型标准,它比DTD更加严格规范。目前大量使用的是DTD,未来XMLSchema有可能取而代之。1.3XML数据库查询和操作语言9XQuery、XPath、XQL、XML—QL都是数据库查询语言。XQuery是W3C提出的对XML文档进行信息查找的查询语言规范。其具体标准由XMLQuery工作组制订,其当前版本为XQuexy1.0。XPath是W3C提出的在XML文档内描述数据元素在

6、文档中的位置的规范。W3C在2OO2年4月30日推出的XPath2.0标准中,容纳了XQuery1.0的基本要求。因此XPath不仅用于确定数据在文档中的位置,还支持数据查询。目前的大多数XML数据库都采用它实现数据查询。XSLT是对XML数据进行操作的语言。XSLT与XML的关系,就好象SQL语言与关系数据库的关系一样。在对XML文档操作时,通常XPath与XSLT是协同工作的。1.4XML数据库处理工具DOM、SAX、JDOM是XML数据库处理工具。提供对XML文档的编辑、管理功能,以及与其它语言的编程接口。DOM(D

7、ocumentObjectModel),即文档对象模型。是W3C推荐的对XML数据进行组织管理的标准和编程接口规范。JDOM是采用JAVA语言实现的DOM。SAX(SimpleAPIforXML)是目前大多数XML数据库实际使用的开发标准,几乎所有的XML解析器都支持它。与DOM比较而言,SAX是一种轻量型的方法。2.XML文档类型XML文档可以分两大类:以数据为中心、以文档为中心。9以数据为中心的文档结构规范、数据粒度好(最小的独立数据单元是PCDATA、elements或者atributes)、很少或者没有混合内容。文

8、档中间层次的elements、PCDATA的之间的顺序不作严格要求,类似于关系表。数据为中心的文档主要用于数据存储或交换,便于机器理解和处理。以文档为中心的文档内部数据结构不规则,内容是混合的,其内部包含的信息自身的物理结构很重要。数据的粒度比较大。以文档为中心的文档便于人们的阅读,是典型的半结构化的文

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。