deep+web查询接口匹配技术研究

deep+web查询接口匹配技术研究

ID:34139125

大小:4.07 MB

页数:73页

时间:2019-03-03

deep+web查询接口匹配技术研究_第1页
deep+web查询接口匹配技术研究_第2页
deep+web查询接口匹配技术研究_第3页
deep+web查询接口匹配技术研究_第4页
deep+web查询接口匹配技术研究_第5页
资源描述:

《deep+web查询接口匹配技术研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、江苏大学硕士学位论文摘要Internet技术的飞速发展使得web数据库得到了广泛应用,这些数据库隐藏在查询接口之后,用户只能通过本地查询接口提交请求才能获得其中信息。这些信息无法被搜索引擎通过超链接检索到,称为DeepWeb信息。由于DeepW曲海量的信息,构建一个DeepW曲信息集成系统显得尤为重要。在DeepWeb信息集成系统中,将Web数据库按领域分类,为每个领域建立一个统一查询接口。通过对统一查询接口提交查询,就可以同时向多个本地查询接口发送请求。将统一查询接口的请求映射到各个本地查询接口,需要解决查询接口匹配问题。查询接口

2、匹配是DeepW曲信息集成系统的基础。针对现有方法不能有效处理查询接口复杂匹配问题,本文提出一种新的匹配方法,利用正相关关联挖掘发现潜在的成组属性组,并将成组属性作为单个属性,对具有相同语义的属性进行语义聚类,达到匹配目的。最后实现一个面向图书检索领域的DeepWeb信息集成系统。主要研究工作包括:(1)提出一种利用关联挖掘思想生成成组属性的方法。针对属性相关度计算不精确问题,设计了一种基于互信息的属性相关度度量标准,该标准能够体现成组属性的特点,并能解决属性稀疏性问题和高频率属性问题。另外,为了提高算法效率,提出“属性矩阵"概念,

3、所有的计算都在仅含有0和1的矩阵上进行,复杂的概率计算转为简江苏大学硕士学位论文单的与运算,有效提高效率。.(2)提出一种采用语义聚类思想生成同义属性的方法。借助语义网计算属性间的语义相似度,同时为了弥补部分属性语义信息不足问题,在计算属性相似度时,加入数据域相似度。通过语义相似度和数据域相似度的加权计算,提高属性相似度计算的精度。(3)设计并实现一个面向图书检索领域的DeepW曲信息集成系统,并将匹配技术在系统中的应用作了分析。另外所有领域相关的信息都存放在配置文件中,通过改变配置文件能够快速搭建一个面向新领域的信息集成系统。关键

4、词:复杂匹配,DeepW曲,关联挖掘,聚类,语义网,互信息玎江苏大学硕士学位论文ABSTRACTWiththerapiddevelopmentofIntemettechnology,webdatabaseshavebeenusedwidely.Thesedatabasesarehiddeninthelocalqueryinterfaces.Usermustusethelocalqueryinterfacetosubmitrequesttogetinformation.DeepWebmeanstheinformationindatab

5、asewhichcan’tbeindexedbytheSearchEngineer.Recently,DeepWebDataIntegrationSystemhasbeenpaidmoreandmoreattentionbecauseofitshugecapabilityofinformation,highdataqualityandwellformattedstructure.DeepWebDataIntegrationSystemdividesthewebdatabasesbydomain,andestablishesauniq

6、uequeryinterfaceforeverydomain.Usercansubmitrequestthroughtheuniquequeryinterfacetosendrequesttoeverylocalqueryinterfaceatthesametime.Thereexistsaqueryinterfacematchingproblemwhilemappingrequestbetweentheuniquequeryinterfaceandlocalqueryinterface.Queryinterfacematching

7、isprerequisitetodataintegration.Thispaperfirstfocusesontechnologyofqueryinterfacematching,andproposedanewmatchingmethodwhichusesassociationminingminespositivelycorrelatedattributestoformpotentialgroupattributes,andfindssynonymattributesbyclusteringonthebaseofexistedmet

8、hods,thenimplementsaDeepWebDataIntegrationSysteminthefieldofbook.ThemainworkiSsummarizedasfollows:III江苏大学硕士学位论文(1)Des

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。