基于实例聚类的数据库模式匹配方法研究

基于实例聚类的数据库模式匹配方法研究

ID:21882022

大小:3.60 MB

页数:75页

时间:2018-10-25

基于实例聚类的数据库模式匹配方法研究_第1页
基于实例聚类的数据库模式匹配方法研究_第2页
基于实例聚类的数据库模式匹配方法研究_第3页
基于实例聚类的数据库模式匹配方法研究_第4页
基于实例聚类的数据库模式匹配方法研究_第5页
资源描述:

《基于实例聚类的数据库模式匹配方法研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、分类号:密级:UDC:编号:工学硕士学位论文基于实例聚类的数据库模式匹配方法研究硕士研究生:张媛新指导教师:刘杰教授学科、专业:计算机应用技术论文主审人:张健沛教授哈尔滨工程大学2013年3月分类号:密级:UDC:编号:工学硕士学位论文基于实例聚类的数据库模式匹配方法研究硕士研究生:张媛新指导教师:刘杰教授学位级别:工学硕士学科、专业:计算机应用技术所在单位:计算机科学与技术学院论文提交日期:2013年3月论文答辩日期:2013年3月学位授予单位:哈尔滨工程大学ClassifiedIndex:U.D.C:ADisser

2、tationfortheDegreeofM.EngResearchonDatabaseSchemaMatchingBasedonInstancesClusteringCandidate:ZhangYuanxinSupervisor:Prof.LiuJieAcademicDegreeAppliedfor:MasterofEngineeringSpeciality:ComputerAppliedTechnologyDateofSubmission:March.2013DateofOralExamination:March.

3、2013University:HarbinEngineeringUniversity哈尔滨工程大学学位论文原创性声明本人郑重声明:本论文的所有工作,是在导师的指导下,由作者本人独立完成的。有关观点、方法、数据和文献的引用已在文中指出,并与参考文献相对应。除文中已注明引用的内容外,本论文不包含任何其他个人或集体已经公开发表的作品成果。对本文的研究做出重要贡献的个人和集体,均已在文中以明确方式标明。本人完全意识到本声明的法律结果由本人承担。作者(签字):日期:年月日哈尔滨工程大学学位论文授权使用声明本人完全了解学校保护知识

4、产权的有关规定,即研究生在校攻读学位期间论文工作的知识产权属于哈尔滨工程大学。哈尔滨工程大学有权保留并向国家有关部门或机构送交论文的复印件。本人允许哈尔滨工程大学将论文的部分或全部内容编入有关数据库进行检索,可采用影印、缩印或扫描等复制手段保存和汇编本学位论文,可以公布论文的全部内容。同时本人保证毕业后结合学位论文研究课题再撰写的论文一律注明作者第一署名单位为哈尔滨工程大学。涉密学位论文待解密后适用本声明。本论文(□在授予学位后即可□在授予学位12个月后□解密后)由哈尔滨工程大学送交有关部门进行保存、汇编等。作者(签字

5、):导师(签字):日期:年月日年月日基于实例聚类的数据库模式匹配方法研究摘要随着近些年信息技术的飞速发展使得数据库成为数据管理的重要工具,但由于不同行业和不同部门间描述数据的方式和方法不同,要实现这些大量的异构的数据共享成为了当今数据集成领域广泛研究的热点。数据集成的首要步骤就是要实现模式匹配,即数据模式元素之间的语义对应关系,因此本课题研究模式匹配对于数据挖掘具有重要意义。已提出的模式匹配方法多数是基于模式信息来实现的,但从评估结果来看任何方法都远远达不到100%的准确率,并且在模式信息不明确或者有冲突的情况下这些方

6、法经常受到限制。通过对现有方法的分析本文提出一种利用模式信息辅助实例信息聚类的数据库模式匹配方法—DSMIC(DatabaseSchemaMatchingbasedonInstancesClustering),该方法分为三大模块,即预处理模块、聚类处理模块、映射生成模块。其中,在预处理模块中利用经典的遗传算法对模式信息进行处理生成候选匹配集合;在聚类处理模块中提出一种改进的K-Means聚类算法将候选匹配集合中模式元素的实例数据进行聚类,根据聚类结果计算出模式元素间的相似度;映射生成模块根据模式元素间的相似度生成图论中

7、的完全加权二分图,利用最大权匹配算法提炼出模式元素的最终结果。最后,本文通过实验验证了基于实例聚类的模式匹配方法的可行性,并以此表明该方法在一定程度上提高了模式匹配的准确率、召回率和全面性等技术指标。关键词:模式匹配,遗传算法,实例聚类,映射生成基于实例聚类的数据库模式匹配方法研究AbstractWiththerapiddevelopmentoftheinformationtechnology,thedatabasehasbecomeanimportanttoolfordatabasemanagement.Duetot

8、hedifferentwaysofdescribingthedataindifferentindustriesanddifferentsectors,achievingtheseheterogeneousdatasharinghasbecometoday`shotextensiveresearchtopicinthedataint

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。