xml数据模型及相关技术综述

xml数据模型及相关技术综述

ID:21917256

大小:52.00 KB

页数:5页

时间:2018-10-25

xml数据模型及相关技术综述_第1页
xml数据模型及相关技术综述_第2页
xml数据模型及相关技术综述_第3页
xml数据模型及相关技术综述_第4页
xml数据模型及相关技术综述_第5页
资源描述:

《xml数据模型及相关技术综述》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、XML数据模型及相关技术综述:随着Inter的发展,XML成为在X络上用于数据描述和数据交换的新的标准。在介绍XML及其数据模型的同时,对几种查询技术和更新操作作简要的叙述。  关键词:XML;索引结构;编码;更新  :TP3:A:1671-7597(2011)0310038-01    0引言  随着Inter的发展,XML(eXtensiveMarkupLanguage)[1]于98年被L文档中的数据,几种查询语言,诸如Lorel,XML-QL,XML-GL,Quilt,XPath,andXQuery,已经被提出。本文简要介绍了XML语言及其数据模型,并对几种

2、查询技术和更新操作作了简要的叙述。  1XML数据模型  1.1扩展标记语言(XML)  XML是一种描述性的语言,作为SGML(标准通用标记语言StandardGeneralizedMarkupLanguage)的一个子集,XML保留了SGML的可扩展的功能,并将SGML的丰富功能和的易用性结合到L数据模型  定义XML数据模型是执行XML数据操作的前提和基础。由于XML文档的嵌套的,层次的结构,我们可以把一个XML文档定义为一个具有如下特点的结构,如图1:  1)是一个被标记节点的图(或者树)结构,其中的每一个节点用原文档中的元素的标签来标记;  2)边用来表

3、示文档中元素间的嵌套关系;  3)该结构中有一个明确的根节点。  2XML索引和查询技术  由于XML已经成为Inter上广为流行的标准,如何对XML数据进行索引和查询也就成为近些年来研究的热点。这些方法概括起来,可以分为两类:1)基于结构化索引的方法;2)基于结构化连接的方法,它们都是以树型结构为基础的。  2.1结构化索引  利用图的相似性的概念,我们把XML文档结构图中具有相似性的节点合并为一个被称为索引节点的节点,从而建立了一个索引结构图,可见该索引图的规模比原图小了很多,从而有利于进行快速的查询。  典型的索引结构为1-index[2](如图2),利用从

4、根节点开始的路径的信息,定义了一个索引结构图,它能够对查询作出精确的判断。然而,对一些较为复杂的,不规则的文档结构,l-index[2]结构图往往会变的很大,影响了查询的性能。局部相似性概念的提出,权衡了查询性能和查询精度,减小了索引结构图的规模,从总体上提高了查询效率。A(k)-index[3]是这一家族的一个很好的代表,通过调整k的值,它建立了一个索引序列,改善了1-index[2]中存在的问题。之后提出的D(k)-index[4],具有了动态的特性,通过对索引结构图的调整,很好的适应了不断变化的查询模式。  2.2结构化连接  不同于结构化索引,结构化连接采

5、用了另一种思想,即把找到XML数据中基本的结构关系作为XML查询处理的核心操作。它基于编码方式,利用节点间编码的关系来快速的决定XML文档结构中的节点间祖先后代关系和父子关系。编码方式以其良好的查询性能引起了人们的广泛的研究,目前的编码方式主要包括区域编码方式[6,7,8],前缀编码方式[9,10]和素数编码方式[11]。例如,利用元素在文档中开始和结束位置[6],构成了一种区域编码方式。树型结构中的两个节点a和b,a是b的祖先节点的充要条件是a的开始位置小于b的开始位置,并且a的结束位置大于b的结束位置。假设a编码为(1,7),b的编码为(3,4),因为14,所

6、以a一定是b的祖先节点。前缀编码则是通过与节点的前缀进行比较来判断节点间的关系。素数编码[11]方式是利用了素数的独特的性质来决定节点间的关系。  3更新  更新通常包括边(或节点)的插入和删除,以及子树的插入和删除,这两类基本操作分别对应了在XML文档中对一个标签和一个子文档的操作。有关更新的研究,大致分为两类,它伴随着不同的查询技术,即前面提到的索引方式和编码方式。  针对1-index[2],R.kaushik[12]等人首先提出了一套更新算法,包括边的插入和删除,以及子树的插入和删除。它避免了更新操作发生时,对索引图的重构。之后,[13]对以上算法进行了改

7、进,进一步减小了更新后的索引图的规模,并针对A(k)-index[3]提出了更新算法。  基于编码模式的更新,往往依赖于具体的编码技术,对更新的操作,也就是编码的过程。  4小结  XML数据是一种半结构化数据的实例。随着XML的逐渐流行,关于XML的相关技术的研究,特别是如何快速的对结构化的XML文档进行查询,也已经成为人们关注的焦点,也是以后XML数据研究人员工作的重点。

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。