正则路径表达式的xml查询优化技术研究

正则路径表达式的xml查询优化技术研究

ID:34508407

大小:486.59 KB

页数:5页

时间:2019-03-07

正则路径表达式的xml查询优化技术研究_第1页
正则路径表达式的xml查询优化技术研究_第2页
正则路径表达式的xml查询优化技术研究_第3页
正则路径表达式的xml查询优化技术研究_第4页
正则路径表达式的xml查询优化技术研究_第5页
资源描述:

《正则路径表达式的xml查询优化技术研究》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、万方数据计算机科学2007Vol。34No。2基于正则路径表达式的XML查询优化技术研究*)陈继朗1’2鞠时光1潘金贵2(江苏大学计算机稃学与通信工程学院镇江212013)1(南京大学计算机软件新技术国家重点实验窒南京210093)2摘要史持正则路径表迭式的查询技术,被认为是半结构化数据模式下的XML查询研究领域中一种颇具有研究价值的XMI。查询计算方法。本文对基于正则路径表达式的XML查询计算方法及英特点进行了分析,在此蕊础上详尽地介绍了目前所提出的各种整询优化技术,最后讨论了XML查询优化技术研究中存在的问题以及今后的研究方向

2、。关键词半结构化数据,XML,正则路径表达式,查询优化ResearchforXMLQueryOptimizationTechnologyBasedonRegularPathExpressionCHE.NJi—Min91”JUShi~Guan91PANJin-Gui2(SchoolofComputerScienceandTelecommunicationsEngineering,JiangsuUniversity,Zhenjiang212013)1(StateKeyLabforNovelSoftwareTechnology,Nanj

3、ingUniversity,Nanjing210093)2AbstractNowadays,thequerytechniquesthatsupportregularpathexpressiongainwideattentionintheresearchareaofXMLqueryinsemi—structureddatamode.FollowedbyanalysisofthecharacteristicofregularpathexpressionbasedXMLquerytechniques,thispaperintroduce

4、sseveralexistingqueryoptimizationtechniquesindetails,discussestheproblemswhichneedtobeimprovedandpointsoutthefutureresearchattheend.KeywordsSemi-structureddata,XMI。,Regularpathexpression,Queryoptimization1引富随着因特网技术及应用的发展,XML(extensiblemarkuplanguage)改其标准、简洁、结构严谨、可高度扩展

5、的特点获得广泛的应用,并迅速成为因特网上数据表示和数据交换一种静薪标准。X溉吴裔自我播述酶特性,罴一种半结梅纯数据,与传统数据库的结构化数据在数据模式上有所不同,不能j耋接使耀传统鼢数据簿查诲技本进纷查谗计算,嚣茂研究翻探讨如何有效地查询XML数据变褥尤为重要。数据酶查游技术与存赭方式存着密切鳇关系。XML数据的存储方式主要分为两类:第一类通过映射关系将XML存蜡在传统的数据库系统孛,魏关系罄数据库或嚣向对象数据库;第二类存储方式则根据XML数据的特点,使用对象的概念来处理XML阶腠性数据,如NXD(NativeXMLData-b

6、ase)[¨。对予第一类存储方式,在碴询时可直接采用传统数据库查询及其优化技术,但在存储时利用了指针或关联的方式来体现XML的数据阶层关系,因此在查询时也必须葳复使用join的机制,来完成阶层性数据的查询对应。第二类更符合XM乙数据的存储特点,将XML数据露作一种半结构化数据,利用基于正则路径表达式的查询方式如Xpath[6

7、、XMI。QLE朝送行查诲计算。警运黑第二类查诲方妓,无论是在技术的使用以及效率的体现,其效果都更为突出,近来越来越受妥耩究者憋关注。2XML查询计算2.1X1ML的描述及查询方式XMI。文件由攒述文件结构的

8、DTD和XMI,中所包含的数据两部分缀成,由于其其有模式的可变动性,数据未赋予严格的类型等特点,被认为是一种具有良好结构的半结构化数据。目前对于半结构亿数据模式的描述大多采用带称记的有向网,最典型的是OEM(ObjectExchangeModel)图[2]。数据在oEM下使用带标记的有向黼来表承,其中每一个对象都由一个标识和一个值构成。文[33中描述了一种建立XML与0EM圈之间映射关系及其相关规粥酶方法,郄使用0EM图中的节点表示XMI。数据中的元素、子元素以及元素的属性,丽它们之阉酶关系在OEM圈中刘使耀带标签静遍迸符表达(如

9、图I所示)。另外,文E4]中则提跬5一种基于OEM的X溉DTD模式定义和形式描述黪方法,获舔蜜现XM0与OEM图之间的“无缝”转换。隧着越来越多的信怠鼷XMI。存储、交换莘爨表示,餐能笼查询XML数据源的能力变得越来越重要。存在大量的关于XML查诲

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。