欢迎来到天天文库
浏览记录
ID:46227930
大小:134.19 KB
页数:71页
时间:2019-11-21
《查询接口整体模式匹配技术的研究》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库。
1、摘要查询接口模式匹配是深网数据集成和关技术研究的难点和突破点,整体模式匹配技术已经成为查询接口模式匹配领域的热点课题。查询接口整体模式匹配技术可以同时匹配同一领域的所有模式,从而大大提高匹配效率。本文在综合分析国内外有关整体模式匹配技术研究现状的基础上,对查询接口整体模式匹配技术进行了更深入的研究。首先,针对属性预处理阶段中的属性字符兀配问题,提出了改进的WPrimeAtt算法,该算法引入主题数据集属性权值到属性素数化过程中,使改进的算法不在依赖阈值并且可以确保属性集合的稳定性,并给出算法的理论证明和实例分析。其次,针对整体模式匹配阶段中的组属性挖掘和同义词匹配问题,提岀了改进的GroupA
2、ttMining算法和Discoverysynonym算法,该算法基于属性正关联关系和负关联关系公式实现属性间的复杂模式匹配和简单模式匹配,并给出算法的理论证明和实例分析。再次,针对整体模式匹配中的概念划分建立问题,提出了概念划分问题的优化版本及最优模式模型的概念,并证明概念划分是NP完全的定理和整体模式匹配是NP完全的定理,在此基础上提出了Concept-partition算法和HSM算法来实现概念划分建立和整体模式匹配,并给出算法的理论证明和实例分析。最后,对上述算法进行了实验验证,给出实验结果图表,并对实验的结果进行了分析和比较,验证了算法的正确性。尖键词深网;数据集成;数据集;查询接
3、口;概念划分;NP完全;权值AbstractSchemamatchingonwebqueryinterfacesisadifficultresearchandbreakthroughpointofthedeepwebdatabasesintegration,andthetechnologyofholisticschemamatchinghasbecomeahotsubjectofschemamatchingonwebqueryinterfaces.Thetechnologyofholisticschemamatchingcanmatchalltheschemasinthesamedomain
4、atthesametime.Therefore,itcangreatlyimprovetheefficiencyofmatching.Inthispaper,basedontheresearchoftheexistingsituationaboutholisticschemamatchingathomeandabroad,thedepthstudyiscarriedonthetechnologyofqueryinterfaceholisticschemamatching.Firstly,forthecharactermatchingprobleminpre-processingstagefo
5、rtheattributes,animprovedAPrimcAttalgorithmisproposed.Thisalgorithmintroducestheattributeweightofthematicdatasettotheprocessofprimedattribute,sothatalgorithmisnotdependentonthethresholdandcanensuretheattributesetstability.Inaddition,thealgorithmisprovedintheoryandinstance.Secondly,forthegroupattrib
6、utesminingandsynonymmatchingdiscoveryprobleminschemamatchingstage,animprovedGroupAttMiningalgorithmandanimprovedDiscoverysynonymalgorithmareproposed・Thesealgorithmsarebasedontheformulasofattributesofpositiveassociationandnegativeassociationtoachievethecomplexschemamatchingandsimpleschemamatching.In
7、addition,thesealgorithmsareprovedintheoryandinstance.Thirdly,forconceptpartitionbuildingprobleminholisticschemamatching,theconceptoftheoptimizedversionofconceptpartitionandtheoptimalmodeofmodelareproposed,a
此文档下载收益归作者所有