欢迎来到天天文库
浏览记录
ID:33790619
大小:3.05 MB
页数:116页
时间:2019-03-01
《xml内容路由关键技术研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、分类号:——UDC:工学博士学位论文密级:——编号:——XML内容路由关键技术研究博士研究生:指导教师:学位级别:学科、专业:所在单位:论文提交日期:论文答辩日期:学位授予单位:王桐刘大昕教授工学博士计算机应用技术计算机科学与技术学院2006年7月2006年9月哈尔滨工程大学哈尔滨工程大学博士学位论文摘要随着信息高速公路的发展,互联网上出现了大量采用事件.驱动模式的应用,如主动服务中的发布订阅系统、基于内容的XML路由、XML文档分发以及新闻传递等。这类应用中,信息以XML流的形式由一系列生产者经过事件代理传递到另一些消费者手中;消费者通过过滤引擎进行订阅。由于仅与XML的内容本身有关,而与
2、信息在何处发布无关,这种路由方式常被称作内容路由。然而,现有的内容路由技术在高效匹配算法、对异构事件处理等方面尚存一些问题。扩展标记语言)a也作为一种数据表示和交换的标准,具有自描述性、可扩展性、利于异构数据交换等诸多优点。本文以)@几为事件模型、XPath作为多用户订阅模型来研究内容路由的若干关键技术。本文提出了一种基于hedge文法的HXFA机来处理XML发布流事件,并给出了}c妤A机的过滤优化算法及算法正确性分析。最后,将多个}D(FA机合并作为系统的过滤引擎。从算法的效率和可扩展性方面进行实验分析,提出的方法优于著名的内容过滤引擎YFiltcr。分析了现有XML相似性模型的优缺点,针
3、对这些模型的不足,扩展了向量空间模型,提出了基于语义和支持度的层次路径模型,并给出其生成算法及复杂度分析。模型首先挖掘文档集中频繁出现的路径,通过文档中的语义信息来合并重复节点、路径,同时对文档特征向量进行维数规约。最后给出基于语义和支持度的距离测度方法。该方法兼顾了XML文档的结构信息和语义信息两个方面的相似性。与树编辑距离模型相比,不但每个文档具有“类原型”描述,而且在时问开销上有较大优势。根据H模型,提出一种基于改进粒子群优化的文档聚类方.pathXML法。首先将文档集欧射到粒子群模型问题空间,然后利用粒子群聚类方法进行聚类,最终权衡了时间和准确性两方面因素,进一步提出混合的粒子群聚类
4、方法,增强了聚类收敛程度和准确程度。尽管提出的模型在提取时已进行了数据归约,然而对于冗余的、异构的)。江L文档恧言,高维灾难问题仍然存在。针对此问题,提出~种独立分量分析的预分类方法。该方法首先对文档矩阵进行维数归约,随后在独立分量1X札内容路由关键技术研究张成的空间中进行聚类分析。采用本方法有两个优点:第一,去除相关冗余,挖掘更具有区分能力的特性并尽量刻画潜在的数据分布,从而增加聚类准确性。第二,通过有效降低向量空间的维数,大大压缩了搜索空间规模,减小开销。最后,提出了一个支持异构事件处理的Ⅺ咀,发布,订阅系统体系结构。该系统反应了本研究中提出的内容路由技术是如何应用的。关键词:Ⅺ皿。;内
5、容路由;发布I订阅:粒子群优化;森林自动机Ⅱ哈尔滨工程大学博士学位论文AbstractWiththedeve
6、opmentoftheIntemetteetmiques.there勰lotsofEvent-drivenApplieatiomsuchasContent-basedpublish/subscribesystem,selectivedisseminationofinformation,content-basedXMLroutingandnewsdistribution.Intheseapplications,astreamofXMLdocumentsisselltfremaSetof
7、dataproducerstoa文盹ofdataconsumer's.Consumerssubscribetothedatabymefl.nsoffilters,andthenrcceiveacopyofallcontentsthatsatisfytlaefilters.Thisstyleofroutingiscalledcontent-basedrouting,becausethecont衄tsa地routedbasedOiltheircontents,andnotbasedOnanydestinationaddress.I'tOWeVel',theexistingcontent-base
8、dteelmologiessuffermanyproblemsOnthee自fieientfilteringmethodandthesupporttotheheterogeneityevents.XMLhasbecomethedefactostandardofdataexdlmlgeovertheIntemet,duetothatⅪ儿isch扰lct捌byself-described,scalableandc
此文档下载收益归作者所有