异构数据库本体的构建与映射地地研究

异构数据库本体的构建与映射地地研究

ID:33379792

大小:2.89 MB

页数:58页

时间:2019-02-25

异构数据库本体的构建与映射地地研究_第1页
异构数据库本体的构建与映射地地研究_第2页
异构数据库本体的构建与映射地地研究_第3页
异构数据库本体的构建与映射地地研究_第4页
异构数据库本体的构建与映射地地研究_第5页
资源描述:

《异构数据库本体的构建与映射地地研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、摘要异构数据库的本体构建与映射的研究农业机械化工程专业硕士研究生吴玲丽指导教师余建桥教授摘要随着互联网的产生与发展,各个行业与部门之间的信息交换和共享已成为可能,但是随着社会的发展,人们对信息共享提出了更高要求,希望能消除异构数据库之间的数据冲突和异常,进行信息的集成。异构数据库的信息集成的重点与难点是解决语义的异构。本体能够明确表示一定领域的概念和概念之间的关系,利用这一特点,基于本体的数据集成能够很好的解决这个问题。基于本体的异构数据库的语义集成,首先就是要对本体进行构建。本体构建质量的高低直接影响了进一步的应用和研究效果。目前本体大都由领域专家手工编辑而成,存在工程复杂、过分依赖专

2、家、构建速度慢等缺点。异构数据库的本体构建,是利用已有的信息资源对本体进行构建,本文主要对关系数据库的本体构建方法进行深入研究。本文通过对关系数据库的关系模式进行分析,建立了一系列从关系模式信息中获取本体构建元素的规则。并提出了基于以上规则的关系数据库本体构建框架,该框架首先从关系数据库中提出关系模式,并对所得的关系模式中丢失的外键信息进行恢复,再使用本体构建规则提取出本体构建的基本元素,最后通过JellaAPI构建局部本体。本体映射是本体集成过程中至关重要的一步,多个应用本体间不可避免地会出现语义的冲突,本体映射的研究内容就是怎样更好的解决这些冲突,本文第四章就本体的映射发现过程进行了

3、详细研究,建构了一个多策略发现本体映射的框架。本体元素的名称、结构、实例等都在一定程度上体现了本体元素间的关系,但现有的很多映射方法在计算概念相似度时并没有考虑概念属性的关系,因此在映射框架中本文提出采用计算概念的名称、结构、属性、实例相似度相综合发现概念问的映射,计算属性名称、结构、实例、约束相似度相综合发现属性间的映射的算法。框架中还建立了映射相关词库,存储映射对以及映射过程中出现过的词汇相似度值。对两个本体进行映射发现运算时,首先对候选映射对进行范化,再查找映射相关词库,对不存在该概念对的名称相似度值的情况,通过采用wordNet计算单词语义相似度与采用查询统计词库计算统计相似性相

4、结合的方法,或计算语义距离的方法计算概念名称语义相似度;在此基础上再对概念对的属性、结构、实例及属性对的结构、实例、约束的相似度值进行计算;对于不同规则计算出来的相似度赋予不同的权值,生成综合相似度,相似度足够大的映射对则认为映射成立。最后由专家对构建的本体进行优化,发现错误映射,寻两南大学硕十学位论文找潜在映射,最终完成局部本体的映射发现。映射相关词库的采用可以对相似度的计算产生积极的影响,并且可以减少候选映射对名称相似度计算的时间,提高映射速度。文章最后提取了学校两个不同部门关系数据库的关系模式信息,经过分析后使用本文提出的本体构建方法构建了两个实验本体,并对实验本体的映射过程做了详

5、细说明与计算,指出了影响映射过程的关键问题。对多个实验的映射结果的分析表明,增加概念属性的计算可以提高映射的查准率和查全率,特别是在概念名称存在大量简写缩写时,效果更为突出,此外在计算时增加语义半径,对查准率和查全率的提高也有帮助。关键字:异构数据库本体构建语义映射综合相似度AbstractWitht11eemergence柚ddeVel叩m%toft11ehtemet,itispossiblefort11cexchanging锄dsh撕ngofinfomlationbe锕eenindustries强dd印ar咖ents.Howevef,w池也edevelopn增ntofsociet),

6、,illfomationsharingneedtobeimpr0Vetoahigller1eveltomeet’pe叩le’sneed,toelirnjnatet11econfliction如dabnomlit)rofdatainheterogeneousdatab笛e,witIlwhichmei墒册ationiIltegrationc卸beacllieved.nekeyanddi侬cultyofinfo锄ationintegrationforheterogeneousdatabaSearehowtoresolVemes锄anticheterogeneousprobleIIls.onto

7、logyc锄expresstheconc印tofcenainareasandmerelationshipbe铆eentllemcleany,sointegratiIlginfbm斌ionb2Lsedonont0109yc卸solVemisproblemverywell.The凰tst叩ofontology.basedseTIlanticintegmtionofheterogeneousdatabaSeistobuild0ntolog

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。