欢迎来到天天文库
浏览记录
ID:9777325
大小:55.00 KB
页数:4页
时间:2018-05-08
《native xml数据库存储研究与应用的论文》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、Native XML数据库存储研究与应用的论文[摘要]xml广泛应用于l数据的存储、处理对传统数据库提出了严峻的挑战,nativexml数据库应运而生,本文重点讨论了nxd数据库数据存储的几个方面,指出其有待进一步研究的问题。 [关键词]xmlnativexmldatabase数据库 随着inter进入社会生活的各个方面,电子商务等的广泛应用,关系型数据库在处理信息的复杂化,多样化,差异化,灵活性,可读性等方面的不足日益明显。特别是目前l越来越多地活跃在数据交换和存储领域,其数据量指数级的增长,要求更有效的数
2、据管理能力和更快、更精确的查询,而这是传统关系型数据库领域所没有涉及到的,可以说是数据库发展的一个分水岭。nxd(nativexmldatabase)技术的出现给数据库研究界带来了巨大的机会,如何高效存储管理xml数据也自然成为研究的热点。 一、xml和xml数据库 xml是theextensiblemarkuplanguage(可扩展标识语言)的简写,具有扩展性、自描述性、自相容性等优点,成为inter上数据表示和数据交换的标准。 对xml文档进行存取管理和查询的xml数据库分为两类:支持xml数据库管理系统
3、(xed)和纯xml数据库管理系统(nxd)。xed(xmlenableddatabase)是在原有关系数据库基础上扩展了xml支持模块,通过适当的xmlapi对xml文档进行查询和修改,完成xml数据和关系数据库之间的格式转换和传输。.nxd(nativexmldatabase)则出现在xml数据处理领域内,是专门设计用于存储和管理xml文档的数据库,它以xml文档作为数据库的存储单元进行操作和管理,保持xml文档的树形结构,省掉了xml文档和传统数据库的数据转换过程。 二、nxd的概述 1.nxd定义 ro
4、naldbourret在“xmlanddatabases”一文中给出有关nxd的定义。一个纯xml数据库是指:(1)相对于xml文档中的数据,定义了xml文档的逻辑模型,并且按照该模型来存储和检索文档。这样的模型至少应该包括元素、属性、pcdata以及文档顺序。(2)就像关系数据库以行作为表的逻辑存储基本单位一样,nxdbms以xml文档作为nxd的逻辑存储基本单位。(3)不要求有任何特殊的基本物理存储模型,它可以建立在关系的、层次的或面向对象数据库之上,或者使用诸如索引文件、压缩文件此类的专门存储格式。 但在很多
5、方面,xml应不同于关系模型和面向对象模型等数据模型,将xml映射到另一种数据模型常常引起“阻抗失配”,并导致功能和性能上的局限。因此,业界提出nxd必须直接存储和处理xml数据。 2.nxd特性 纯xml数据库的特性有:(1)文件集(documentcollections):支持集合(collection)的概念,集合级别上的查询,修改操作都会反映到集合内的每个文档中。(2)查询语言(querylanguages):目前主流的是xpath,但其存在不能分组,排序和连接等缺陷,因此xquery作为xpath的替代
6、品,有希望成为纯xml数据库的专用语言。(3)更新和删除(updatesanddeletes):nxd绝大多数产品在这方面仍是薄弱环节。(4)事务、锁定和并发(transactions,locking,andconcurrency);支持事务处理。锁定通常是对整个文档的,所以多用户并发性相对较低。(5)纯xml数据库提供良好的编程接口。(6)能够高效而精确的还原xml文档。 三、nxd数据存储结构 1.物理存储 将元数据、xml数据、索引和统计数据如何放置在物理磁盘上永远是一个挑战性的问题,因为底层的存储表达对
7、上层的查询处理和优化有着重要的性能影响。 纯xml数据库在物理上存储xml文档主要有三种方案: (1)字节流方式:即将xml数据转换为字节流,这种方式将文档转换为字节流,然后将其存储在文件系统的文本文件中或存储为数据库的blob字段中,然后在这些文件或字段上面加一些索引,通过这种方式来提供某些数据的功能,当存储和检索整个文档时,这种方式效率较高,并且能够精确地再现原来的xml文档,但缺点在于任何一次查询文档时都必须通过分析器处理后才能获得结构信息。 (2)元模型方式:即按照某种物理模型存储xml文档,这里模型的
8、不同,分为两种方案,一种是采用现有的关系数据库或面向对象数据库作为xml数据的存储库,在重组文档片段或不同文档时比较快,但在逻辑层和物理层的数据需要经过转换,因而会降低处理效率。另一种是为xml数据库设计专有的存储方案,如infonytedb采用的pdom方式就是首先将文档转化为dom结构,然将其映射到一些特殊的文件中。这种方案能够以一种比较自
此文档下载收益归作者所有