xml文档检索的索引结构研究

xml文档检索的索引结构研究

ID:33191132

大小:1.72 MB

页数:79页

时间:2019-02-21

xml文档检索的索引结构研究_第1页
xml文档检索的索引结构研究_第2页
xml文档检索的索引结构研究_第3页
xml文档检索的索引结构研究_第4页
xml文档检索的索引结构研究_第5页
资源描述:

《xml文档检索的索引结构研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、北京交通大学硕士学位论文XML文档检索的索引结构研究姓名:郝雪峰申请学位级别:硕士专业:计算机应用技术指导教师:须德20050301摘要提出一种对XML文档建立索引的新方法。浚方法支持分支查询和带有通配符的查询。同时设计了一种通过一次遍历xML文档就可以建立索引的算法。按照我们设计的线模型,XML文档被看作一条线,文档中各个元素被看作这条线的线段。查询xML文档就相当于指定相应的线段。使用一种基于区间的动态树标记模式,每个线段都被给予一个区间。然后把XML文档中所有的路径插入到一个trie结构中,并使用B+树管理这些区间。定义了三种运算,这些运算使不同B+树上的区间集合

2、可以相互运算。三种运算对应算法的最差情况时间复杂度是0(m+n)。分支查询最后的结果可以通过这些运算直接得到。这种索引方法的创新处体现在如下几个方面:提出了用于查询XML文档的线模型;定义了三种运算,并给出了相应的算法:在线模型和三种运算的基础上,我们使这种索引方法支持分支查询:最可能匹配的点在索引结构里有聚集效果,这种特性大大减少了磁盘I/O,并同时使磁盘优化成为可能:提出一种动态的树标记算法,使我们的索引结构支持数据插入和删除;并给出了通过一次扫描建立索引结构的算法。通过实验,我们把该索引方法和时下流行的技术进行比较。实验证明该方法的查询处理开销和磁盘I/O与查询表

3、达式的复杂度和查询结果集的大小线性相关。实验结果表明了我们索引方法的显著性能优势。根据本文主要研究成果撰写的论文,LMIX:ADynamicXMLIndexMethodUsingLineModel,已经被LectureNotesinComputerScience收录出版发行,并被SCI检索。关键词:XML索引,NativeXML数据库,数据管理,数据检索AbsttactAbstractAnewwayofindexingXMLdocumentiSproposed.whichsupportstwigqueriesandquerieswi出wildcards.Anonce-o

4、verindexconstructionalgorithmiSalSOgiven.AccordingtotheLineModelwedesign,veeCOnsiderXMLdocumentasaline,andeveryelementsofthedocumentastheline’Ssegments.ToqueryanXMLdocumentiStoidentifythecorrespondingsegments.Usingarange—baseddynamictreelabelingscheme,eachsegmentofthelineisgivenarange.We

5、putallthepathsofXMLdocumentintoatde,andorganizetherangesetswithB+-treesgroupingbythenodesonthetrie.Threeoperationsaledefined,whichenabletherangesetsontheB+-treescorrespondingtodifferentnodesinthetrietooperatewitheachother.n心worst—casetimecomplexityofthealgorithmwedesignedfortheoperations

6、is0(m+n).Thefinalresultsoftwigqueriescanbegotthroughtheseoperationsdirectlyataspeedsimilartothesimplepathquery.Throughextensiveexperiments,wecompareourmethodwi血otherpopulartechniques.Inparticular,weshowthattheprocessingcostanddiskI,Oofourindexmethodislinearlyproportionaltothecomplexityof

7、queryandthesizeofqueryresults.ExperimentalresulIsdemostratethegreatperformancebenefitsofourproposedteclmiqlies.PaperLMIX.'ADynamicXMLIndexMe伪odUsingLineModel,whichiswroteaccordingtothemainresearchmsultsofthisthesis,hasbeenacceptedbyLectureNotesinComputerScienceandindexedb

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。