欢迎来到天天文库
浏览记录
ID:36799825
大小:2.25 MB
页数:60页
时间:2019-05-15
《基于LazyDFA的XML数据流查询优化技术研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、内蒙古科技大学硕士学位论文摘要随着互联网的广泛使用,一些新的密集型数据的应用己经得到了广泛的认同,使得流数据的处理技术引起了研究界的广泛兴趣,比如,金融分析、传感器网络、网络监控和安全、位置搜寻、电信数据管理、Web日志、生产制造、在线拍卖等这类数据。它们的特征是:数据以大量、快速、实时的数据流形式持续在线到达,数据到达的顺序不可控制、无法存储、而查询持久存储。在这些应用中,如果利用传统数据库管理系统的方式管理,把数据存储,在某一刻执行稳定的查询计划给出精确的回答,显然是不可能的,不切合实际的,因为它并不支持连续查询,而连续查询正是数据流的典型特征。因此,这类数据不宜用持久
2、稳定关系建模,适宜用数据流建模,由此产生了一些新的研究问题,因此,XML数据流查询和管理技术成为目前数据流领域研究的热点。XML数据流处理系统运行在Intemet环境中,该环境下存在海量用户,这些用户利用XPath语句描述其需求,因此,XML流的查询问题主要归结到XPath查询,如何利用XPath表达式高效的查询XML数据流是数据流查询中需要解决的关键问题。将自动机技术引入到XPath查询领域,是XML数据流查询的主要方向,这是本文的主要研究内容。本文结合自动机技术和索引技术,实现了XPath表达式对数据流的查询处理。根据XPath的语法规则,将XPath表达式转化成Laz
3、yDFA自动机,分析影响自动机LazyDFA查询性能的主要因素,从而提出给XML数据流建立索引SIX的优化算法。然后利用流索引技术对基于LazyDFA的增量查询算法进行了研究,从理论上分析,该算法能够提高XML数据流的查询效率。最后对自动机查询处理的流索引SIX的优化算法进行了性能测试,实验结果表明,优化算法可以有效地提高自动机的查询效率。关键词;xML;数据流;LazyDFA;流索引内蒙古科技大学硕士学位论文AbstractWiththewideapplicationof111temet,somenewconcentrateddatahaveapproved,Whichh
4、asmadethatstreamdataprocessingcauseswideinterest.Suchasfinancialanalysis,sensornetwork,networkmonitorandwebusagelogere,thosedatastreamprocessingandrelatedtechnologyhavecometolaJighattentionrecently,whosefeatureisthatdataisreachingquicklyintheformofacontinuousdatastreaminuncontrollableorder
5、onlineandCannotbestored,butqueriesarestoredlastingly.Thistypeofdatastreamapplicationhasproducedsomenewproblems.SothetheoryandtechnologyabouttheXMLdatastreammanagementandqueryhavebecomethehotresearchinthefieldofdatastreamcurrently.XMLdatastreamprocessingsystemisrunningontheIntemet.Theusersa
6、remassiveinthisenvironment.1heyuseXPathexpressiontodescribetheirqueriesneeds.HowtoprocessalargenumberofXPathqueriesontheXMLdatastreamisanurgentproblemneedtoberesolvedintheapplicationofdatastream.Thisistheemphasisofthispaper.Thispaperadoptsautomationandindextechnologytoresolvedatastreamproc
7、essingbasedXPathquery.XPathexpressionscanbechangedintoautomationmachineaccordingtoXPathsyntaxrulesandautomationmachinetheory.DatastructureofNFAandLazyDFAisdesignedtorealizethequeryprocessingonXMLdatastream.Afteranalyzingandresearchingthecurrentmethodsandmechan
此文档下载收益归作者所有