欢迎来到天天文库
浏览记录
ID:5338890
大小:369.16 KB
页数:4页
时间:2017-12-08
《一种计算组合词汇语义相似度的方法》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库。
1、第27卷第8期计算机应用与软件Vol
2、27No.82010年8月ComputerApplicationsandSoftwareAug.2010一种计算组合词汇语义相似度的方法吴学军何丰(北方民族大学计算机科学与工程学院宁夏银川750021)摘要对语义相似度的研究,已产生了许多计算模型和计算方法。这些模型和方法大多集中于简单词汇之间的相似度计算,很少有涉及两个或多个词汇组合的相似度计算。在本体匹配与服务发现的过程中,与本体有关的概念不可避免的会出现由两个或多个词汇组合成的组合词汇。在WordNet相似
3、度计算基础上,综合考虑了词汇间的各类相似度,提出了一种计算组合词汇的语义相似度的方法。实验表明,该方法能有效提升相似度计算的有效性和准确性。关键词本体组合词汇语义相似度WordNetAMETHoDFoRCOMPUTINGSEMANTICSIMILARITYoFCOMBINATIoNWoRDSWuXuejunHeFeng(CollegeofComputersc8weandEngineering,TheNorthUniversityforEthnics,Yinchuan750021,Ningxia,Ch
4、ina)AbstractTherealealotofcomputingmodelsandmethodswithregardtotheresearchesaboutsemanticsimilarity.Mostofthesemodelsandmethodsfocusoncomputingsimilarityamongsimplewords,butfewinvolvethesimilaritycomputationoftwoormorelexicalcombinations.Intheprocessof
5、ontologymatchingandservicediscovery,theconceptswhichrelatedtoontologymightformcombinationwordsinevitably,whichconsistsoftwoormorewords.BasedontheWordNetsimilaritycomputation,inthispaperweconsidercomprehensivelyallkindsofsimi—lalityamongwords,andpropose
6、amethodtocomputethesemanticsimilarityofcombinationwords.Experimentalresultsshowthatthismethodcanimprovevalidityandaccuracyofsimilaritycomputationeficiently.KeywordsOntologyCombinationwordsSemanticsimilarityWordNet模型,该模型在集合理论的基础上,通过属性集的相似程度计算0引言相似度,因此对属
7、性集的要求较高;基于距离的语义相似度计算模型,该模型通过预先定义好的语义网络计算相似度,网络结构本体在自然语言处理、人工智能、语义Web、数据集成等领对相似度的计算有很大影响;基于信息内容的相似度计算模型,域获得了广泛的重视。语义相似度研究了概念问的语义关系,这种方法充分利用了信息理论和概率统计理论的相关知识,能主要考虑了两个概念的相似程度。语义相似度计算是许多领域够粗略地估量概念之间的语义相似度。如语言学、心理学、计算机的协作过程。目前的语义相似度计算1.1基于特征匹配的方法技术主要是针对同一个本
8、体中的两个概念,或者是两个异构本基于特征匹配的模型通过比较事物之间具有的属性来衡量体问的概念进行计算,这些计算技术大多只考虑一些由单个词相似度。该模型可以很好地模拟人们平时对现实世界中事物之汇构成的简单词汇间的相似度”J。在本体匹配和服务匹配过间的认识和辨别,但要求对客观事物的每一个属性进行详细和程中,不可避免的会有两个或两个以上的词汇组合成的复杂概全面的描述。Tversky模型是典型的特征匹配模型,他指出相似念,在此我们称之为组合词汇。组合词汇的相似度计算不同于度不仅由两个概念的相同属性决定,而且
9、由它们的不同属性决简单词汇的相似度计算,这些词在已有的语义词典中很少有定定。这样,通过判断两个概念对应的属性集的相似程度来计算义,而且这种组合带有很大的随意性,词汇间的次序也缺乏统一相似度。的定义。这类词汇由于是词汇与词汇、或者是多个词汇之间的组合,其中包含的词义将与各个词汇相关,因此我们不能使用现1.2基于编辑距离的模型-5J有的相似度计算方法去计算这类词汇的相似度。基于编辑距离的模型根据两个概念在层次网络中的几何距本文提出了在WordNet的基础上来计算组合词汇相
此文档下载收益归作者所有