基于HowNet句子相似度的计算

基于HowNet句子相似度的计算

ID:38201907

大小:1.13 MB

页数:6页

时间:2019-05-25

基于HowNet句子相似度的计算_第1页
基于HowNet句子相似度的计算_第2页
基于HowNet句子相似度的计算_第3页
基于HowNet句子相似度的计算_第4页
基于HowNet句子相似度的计算_第5页
资源描述:

《基于HowNet句子相似度的计算》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库

1、Vol.4No.8/Aug.2010基于HowNet句子相似度的计算周云朱定局柏佳宁朱怡蔓摘要针对目前词语相似度计算中词语的反义关系、对义关系、符号义元”^”和”~”体现的不明显问题,本文提出基于HowNet计算句子相似度,在《知网》的词语相似度计算的基础上,加入了词语定义的义原间的反义、对义关系、单义元的否定和符号义元”^”和”~”定义信息来计算词语的相似度,并在词语定义词典的存储方式做了改进,利用汉字的编码来组织词典。计算句子相似度前加入词语的消歧,在计算句子相似度时考虑了词语定义的关系义元与待比较的词定义的某个义元相等的

2、情况,并加大了关系义元的比重。实验表明:本文的方法计算词语相似度更加合理准确,进而提高句子的相似度计算精度,且由于存储方式的改进,提高了词语查找速度。关键词知网;词语相似度;义原相似度;字典结构;句子相似度1引言相似度的计算是中文信息处理中最为基础和重度,并在词语定义词典的存储方式做了改进,利用汉要的工作,它直接决定着某些领域的研究和发展。如字的编码来组织词典。实验表明:一些区别词的相似机器翻译、信息检索、自动文摘、自动问答系统等领度更加合理,且提高了词语的查找速度。本文在计算域。句子相似度是一个关键的问题,一直以来都是人句子

3、相似度时考虑了词语定义的关系义元与具体义元们研究的热点和难点。本文句子相似度的研究主要以相关的情况。如果词语定义的关系义元与待比较的词人工智能心理咨询系统为应用背景,在人工智能心理的定义的某个义元相等时,说明两个词语之间存在一咨询系统句子相似度的计算中起着决定性的作用。人定程度上的同义,可以相互替换机率比较大,必然词工智能心理咨询系统主要是计算咨询者提出的问题与语的相似度也很高。所以,本文认为关系义元比重应问题库问题之间的相似度,把相似度高的问题的答案该和其他义元的比重一样。返回给咨询者。词语的相似度计算对句子相似度计算本文第

4、2节对相似度进行简单介绍;第3节介绍基的处理起着至关重要的作用,如果只从关键词上进行于HowNet的词语相似度的计算;第4节对字典的设计匹配处理却没有深入到词语的语义层次,词语相似度的改进进行讨论;第5节介绍句子相似度的计算;第6计算的结果也不会合理准确,句子的匹配结果也不会节实验结果与分析;第7节对全文进行总结与展望。准确。词语的语义相似度的计算,目前主要有两类计算方法:一类是基于语义字典的相似度计算方法(如2相似度简介同义词词林、知网、WordNet等);另一类是基于统计的相似度计算方法(如TF-IDF等)。目前国内,以《

5、知2.1词语语义相似度网》为基础的词语相似度计算是当前较好的方法之一DekangLin认为任何两个事物的相似度取决于[1]。《知网》是我国著名机器翻译专家董振东先生几它们的共性(Commonality)和个性(Diferentces)[3],十年工夫创建的一个知识系统,它含有丰富的词汇语然后从信息理论的角度给出任意两个事物相似度的通义知识和世界知识,内部结构复杂。用公式(公式1):log(pcommonAB(,))[2]中科院刘群的基于《知网》的词语相似度计算SimAB(,)=log(pdescriptionAB(,))(1)

6、是利用义原的上下位关系计算义原相似度,进而得到其中分子描述A、B共性所需要的信息量的大小;分母词语的相似度。对词语的反义关系、对义关系、符号完整的描述出A、B所需信息量大小。SimWW(1,2)=±maxSimSS(1i,2j)义元”^”和”~”体现的不是很明显,在测试发现i=1..,nj=1...m一些存在对义或反义的词语与同义、近义词语一样具文献[2]研究主要基于实例的机器翻译,词语相α有较高的相似度。本文在文献[2]的基础上,加入了词似度是两个词语在不同的上下文中可以互相替换使Simpp(,12)=d+α语定义的义原间的

7、反义、对义关系、单义元的否定和用而不改变文本的句法语义结构的程度,用其开发符号义元”^”和”~”定义信息来计算词语的相似的WordSimilarity软件进行实验发现:一些词义相反Sim(p,p)12=α×(depth(p)+depth(p))/12α×(depth(p)+depth(p))+dist(p,p)+12depth(p)depth(p)−3212p,p12depth(p)dist(p,p)112αSimpp(,)=±12,(d+d)+α,d=dpr(,)+dpq(,)p,p1212αSimpp(,)=−12,(d+

8、d)+ααSimpp(,)=−,12(d+d,)+αd4iSim(S1,S2)=∑βi∏Simj(S1,S2)i=1j=1s=(,,......,sss)kkk,,,.....,k01m123niiirrr,,,.....,r,,.......123mkk12krimax(,

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。