一种基于本体的词汇语义倾向计算

一种基于本体的词汇语义倾向计算

ID:24127072

大小:48.00 KB

页数:3页

时间:2018-11-12

一种基于本体的词汇语义倾向计算_第1页
一种基于本体的词汇语义倾向计算_第2页
一种基于本体的词汇语义倾向计算_第3页
资源描述:

《一种基于本体的词汇语义倾向计算》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库

1、一种基于本体的词汇语义倾向计算:词汇倾向性计算是自然语言处理研究领域的一个新的热点。词语倾向性的判定是意见挖掘的基础和重要环节。本文基于本体概念提出了一种词汇语义倾向性计算的方法。实验表明,本文的方法在汉语常用词中的效果较好,词频加权后的判别率更高,具有一定的实用价值。  关键词:本体语义倾向中文信息处理  0引言  词汇语义倾向性是近年来中文信息抽取领域研究中一个新的研究方向,它是一门交叉学科,涉及到信息检索与计算语言学的领域,所产生的研究点来自意见挖掘。意见挖掘并不是针对文档所谈及的话题进行研究,而是对文档表达的倾向性观

2、点,即肯定或否定的意见进行研究。  意见挖掘任务分为以下几步:一是对文档中的主观性词语或短语进行识别,二是对其进行倾向性的判定。三是结合其倾向性与句子结构来分析,获得句子的对倾向性。四是获得段落或篇章的倾向性。  词汇倾向性是意见挖掘的基础环节,目前已经受到研究人员的广泛关注。  基于Ho表示贬义基准词,V(ilarity(k_l,ilarity(k_m,ilarity(k,w)的计算是检测词与基准词之间的倾向值。  3实验  实验采用的测试集100个随机从X络文章中抽取的含有主观评价性的文本。文章通过本校中文系同学手工获取

3、,包括经济、政治、体育、娱乐等各个类型,相关度小是选取时注意的要点,从而保证了测试集的覆盖范围,测试结果也会更准确,更能体现实验方法的普遍性。  挑选出测试并人工标注其中的主观性词语,将文本依次输入系统,自己计算并标注其中的主观词,将两者进行比较,比较结果如表1所示  实验结果显示,部分贬义词被判定为褒义,造成贬义词的词语判定召回率较低。  例如:我觉得自己的行为太单纯幼稚,女孩儿的眼神清澈又单纯。而一个单纯为贬义词,第二个单纯为褒义词。因此,在不同的语言环境下,他们的褒贬不同就造成了上面方法的计算偏差。同样,这也是本文后续

4、的一个研究重点。  4结论  本文采用了基于基准词和本体词库的方法来进行语义倾向性的计算。该方法扩充了基准词判定的范围,并使用具体数值来表示词汇语义的倾向程度。在对词汇语义进行倾向性计算时,并没有考虑到词语所在的语言环境,这也是导致判定结果的一个重要原因。因此,考虑词汇语言环境的倾向性分析将是本文下一步考虑的工作和研究点。

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。