xml模式匹配算法的研究

xml模式匹配算法的研究

ID:33532002

大小:1.57 MB

页数:71页

时间:2019-02-26

xml模式匹配算法的研究_第1页
xml模式匹配算法的研究_第2页
xml模式匹配算法的研究_第3页
xml模式匹配算法的研究_第4页
xml模式匹配算法的研究_第5页
资源描述:

《xml模式匹配算法的研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、代号10701学号0921421388分类号TP301.6密级公开题(中、英文)目XML模式匹配算法的研究TheResearchofXMLSchemaMatchingAlgorithms作者姓名高培指导教师姓名、职称霍红卫教授学科门类工学学科、专业计算机软件与理论提交论文日期二○一二年二月西安电子科技大学学位论文创新性声明秉承学校严谨的学风和优良的科学道德,本人声明所呈交的论文是我个人在导师指导下进行的研究工作及取得的研究成果。尽我所知,除了文中特别加以标注和致谢中所罗列的内容以外,论文中不包含其他人已经发表或撰写过的研究成果;也不包含为获得西安电子科

2、技大学或其它教育机构的学位或证书而使用过的材料。与我一同工作的同志对本研究所做的任何贡献均已在论文中做了明确的说明并表示了谢意。申请学位论文与资料若有不实之处,本人承担一切的法律责任。本人签名:日期西安电子科技大学关于论文使用授权的说明本人完全了解西安电子科技大学有关保留和使用学位论文的规定,即:研究生在校攻读学位期间论文工作的知识产权单位属西安电子科技大学。学校有权保留送交论文的复印件,允许查阅和借阅论文;学校可以公布论文的全部或部分内容,可以允许采用影印、缩印或其它复制手段保存论文。同时本人保证,毕业后结合学位论文研究课题再撰写的文章一律署名单位为

3、西安电子科技大学。(保密的论文在解密后遵守此规定)本学位论文属于保密,在年解密后适用本授权书。本人签名:日期导师签名:日期摘要XML逐渐成为了网络中数据表示、数据分析和数据交换的标准。但由于XML数据描述的灵活性,以及XML文档数量和规模的日益增大,如何高效的管理大规模XML数据以及集成大量的XML数据资源变得十分重要。因此用于识别XML模式之间的一致性元素的自动XML模式匹配技术成为许多领域亟待解决的问题。本文在分析研究现有模式匹配方法的基础上,结合XML模式中元素的信息特征,综合考虑匹配质量和匹配效率,提出了一种新的XML模式匹配算法。它主要包括模

4、式的预处理和匹配算法两个部分。首先,模式经过简化处理表示为一种序列结构CPS(ConsolidatedPrüferSequence)。然后用综合语言匹配和结构匹配的混合匹配算法对模式进行匹配。语言匹配充分利用模式元素的特征信息,包括名称匹配、数据类型匹配和基数约束匹配,其中名称匹配采用决策树的原理合并多种字符串匹配算法。结构匹配算法中,首先用孩子元素、叶子元素、祖先元素和兄弟元素的信息计算所有复杂元素对的结构相似值,得到匹配的复杂元素对。然后仅把结构匹配算法应用到匹配复杂元素对下的原子元素,而不是计算所有原子元素的结构相似值,这种结构匹配方法易于发现复

5、杂匹配。最后为了进一步改善效率本文设计了几种并行策略,提出了并行语言匹配算法和并行非复杂节点的结构匹配算法。通过大量实验,验证了本文的模式匹配算法具有高效性,并行改进的算法也具有可行性。关键字:XML模式模式匹配相似值CPS决策树AbstractXMLhasemergedasastandardfordatarepresentation,dataanalysisanddataexchangeontheWeb.However,duetotheflexibilityofdatadescriptionandtheincreaseinthenumberandth

6、esizeofXMLdocuments,howtoefficientlymanagelargeXMLdataandintegratelotsofXMLdatasourceshavebecomevital.ThereforeanautomaticXMLschemamatchingusedtoidentifysemanticcorrespondencesamongXMLschemasisanurgentprobleminmanydomains.Analyzingtheexistingmethodsofschemamatchingandcombiningwi

7、ththeinformationcharactersofelementinXMLschema,thispaperproposesanewapproachofXMLschemamatchingwhichconsidersbothmatchingqualityandmatchingefficiency.Itconsistsmainlyoftwoparts-schemapre-processingandmatchingalgorithm.FirsteachsimplifiedXMLschemaisrepresentedasasequencecalledCPS

8、(ConsolidatedPrüferSequence).Thenmatchingalgori

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。