一种改进的本体概念语义相似度计算方法.pdf

一种改进的本体概念语义相似度计算方法.pdf

ID:52474899

大小:1.01 MB

页数:4页

时间:2020-03-28

一种改进的本体概念语义相似度计算方法.pdf_第1页
一种改进的本体概念语义相似度计算方法.pdf_第2页
一种改进的本体概念语义相似度计算方法.pdf_第3页
一种改进的本体概念语义相似度计算方法.pdf_第4页
资源描述:

《一种改进的本体概念语义相似度计算方法.pdf》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库

1、学术探讨基金项目2015年第1-2期一种改进的本体概念语义相似度计算方法吴星同翁燕朱婷陈中育(浙江师范大学数理与信息工程学院,浙江金华321004)[摘要]本文分析了几种概念相似度的运算方法,对概念相似度计算模型进行了改进,该计算模型在计算初始主流概念相似度的基础上,不仅引入了深度、密度因子,还考虑了有向边类型权重因子在计算相似度中所起的作用,完善了计算方法。通过试验结果可以看出,该方法对概念相似度的计算更准确地体现出了概念间的相似程度。[关键词]语义距离;概念相似度;深度及密度因子;有向边中图分类号:TP391.1文献标识码:A1.引言目

2、前,语义相似度的计算被广泛的应用于信息检索、语义Web、自然语言处理等领域。本体在语义相似度的计算中发挥着非常重要的作用。传统的基于本体的概念相似度的计算方法有3种[1-3]:一种是基于语义距离的方法,该方法的基本思想是利用本体结构层次的特点,通过概念之间的距离来量化,这种相似度计算方法比较简单、直观,但是它十分依赖本体的层次结构,本体层次结构构建的好坏直接影响到概念相似度的准确性[4];另外一种是基于信息论的方法,该方法是利用两个概念间最近的共同概念祖先的信息量来衡量语义相似度,在理论上更具有说服力一些,但是这个方法只能粗略地量化概念之间

3、的语义相似度,不能更加细致地区分各个概念语义相似度值[5];最后一种方法是基于属性的方法,该方图1一个简单的本体图法就是通过判断两个概念之间的属性集来计算概念相似度的,并且要求对每个概念的属性进行详细而全面的描述,但图1中的每个小圆圈代表的就是一个节点概念,每两个是这样做的难度相当大。本文综合考虑了上述三种方法的小圆圈节点之间的连线就代表着语义关系。自顶向下,概念优缺点,并且结合了本体所具有的特质,提出了一种改进的的划分从大到小,每一层都是对上一层详细的划分,越往下,本体概念相似度计算方法,该计算方法在本体层次树结构的节点之间的相似度越大。

4、基础上,不仅考虑了语义距离、节点深度和节点密度,而且还3.概念相似度的描述把概念的有向边类型权重因素考虑进去,使得本体概念之间概念相似度一般来说有着两层意思,一种意思是代表概的语义相似度更加全面,计算结果也更加精确。念之间的相关性,另外一种意思是代表了概念之间具有相似2.本体概述的性质。例如,概念“人工智能”与概念“机器人”的相似性非本体(Ontology)最先是在描述事物的本质的时候出现常高,但是“计算机软件”和“编程语言”,它们虽然没有很高的,但是随着计算机在人工智能领域的不断发展,就被赋予的相似度,相关性却很高。概念相似性反映了概念之

5、间的聚了一个新的意义。在1998年Studer对本体的定义反映了本合的特点,而概念相关性反映了概念之间的组合特点[7]。在体的本质,并且得到了广泛的认可:共享概念模型的明确的1998年,lin在信息学的基础上,详细地阐述了广泛意义上的形式化规范说明[6]。概念相似性的定义,提出了四个相似性直觉,具体描述为:第一个简单的本体可以使用层次结构表示如图1:一,两个概念之间的相似性与他们的共同点有关,如果它们——————————————作者简介:吴星同,男,江苏靖江人,硕士研究生,研究方向:软件工程。基金项目:国家自然科学基金,项目编号:61272

6、007;浙江省自然科学基金,项目编号:LY12F02009。-20-基金项目学术探讨2015年第1-2期具有较多的共同点,它们就具有较大的相似度;第二,如果两在本体的层次结构中,概念的分类一般是从粗到细,从大个概念之间显示出很大的差异性的话,那么就表明它们之间到小的过程,越往下层本体树中的概念分类则越来越细。节具有较小的相似性;第三,如果两个概念不存在差异点,换句点密度指的是两个概念公共节点的所有子节点的个数(包括话说就是如果两个概念相同的话,则具有最大的相似性;最孩子节点和孙子节点),一般来说,某个节点的直接子节点的后,两个概念之间也有可

7、能只存在差异点,而不存在共同点,数目越多,密度就越大,表明了概念被细化得越具体,其相似这样就表示两个概念属于互斥的概念,它们之间的相似性也度越大,反之亦然。概念的节点密度对语义相似度的影响为:比较小。degree(Aanc)Den(a,b)=(4)degree(o)3.1语义相似度的定义其中,degree(Aanc)为2个概念节点最近祖先节点的度,当两个概念元素具有某些共同特征时,则定义它们是相即最近祖先节点的直接子节点的数量;degree(O)为本体树O似的,用sim(x,y)表示概念x,y之间的相似度,在形式上,相似[8]的度,即本体树

8、O中各节点度的最大值。度计算满足:3.2.4有向边的关系类型(1)相似度的值为[0,1]区间中的一个实数,即sim(x,y)∈在本体中,概念之间不是只有一种类型的关系,关系具[0

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。