中文文本倾向性的分析的研究论文

中文文本倾向性的分析的研究论文

ID:34385883

大小:5.39 MB

页数:61页

时间:2019-03-05

中文文本倾向性的分析的研究论文_第1页
中文文本倾向性的分析的研究论文_第2页
中文文本倾向性的分析的研究论文_第3页
中文文本倾向性的分析的研究论文_第4页
中文文本倾向性的分析的研究论文_第5页
资源描述:

《中文文本倾向性的分析的研究论文》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、安徽大学硕士学位论文中文文本倾向性分析研究姓名:赵志伟申请学位级别:硕士专业:计算机软件与理论指导教师:赵鹏201204摘要随着互联网的迅速普及,互联网应用越来越简易,使得上网人数与同俱增。互联网生活呈现出多元化,复杂化的趋势,越来越多的人们开始关注互联网,开始通过互联网来发出自己的声音,而且形式不一,比如,微博,论坛,博客,BBS等。人们通过这些媒体发表自己对其他的人或事件的评价,看法,这些评价看法常常带有明显的倾向性信息,如何让计算机自动准确提取这些有用的倾向性信息,这个问题吸引了大量的研究学者,逐渐就演化成了文本的倾向性分析课题。文本倾向性分析研究目前已经成为自然语言处理

2、领域的研究热点之一。文本倾向性分析具有重要研究意义,在学术领域,商业领域,管理领域等都有着巨大的使用价值。中文文本的情感倾向性研究相对于英文的情感倾向性研究起步较晚,很多问题还需要全方位的研究,中文情感倾向性分析有很多子课题,本文在研究了大量的基础资料后,分别选择了两个子课题,中文句子的情感倾向性识别和中文文本的主客观分类,并且进行了一系列的实验研究。本文的主要工作是:1.研究了中文句子的情感倾向性识别课题中文句子的情感倾向性识别课题的主要研究内容是让计算机可以有效的判断给出的中文句子是褒义还是贬义的,并且给出其倾向性程度。文本倾向性识别的一个重要的基础性工作是句子倾向性识别,

3、从目前的研究论文可以看出,提取实体间关联难度很大,这个问题在主观性文本信息的提取上表现的更加严重。而有针对性的提取倾向性信息的研究,目前进行的还比较少。基于这个问题,本文在综合大量资料的基础上,提出了一种基于情感词语义加权的句子情感倾向性识别方法。本文通过实验验证了该算法的可行性以及有效性。2.研究了中文文本的主客观分类课题人们在买一种产品或者选择一项服务之前,都想在互联网上获得该项产品或者服务的用户评价,以便参考,从而决定是否购买。因此文本的主客观分析是一个非常重要的,具有可观的研究价值的基础性课题。中文文本的主客观分析的主中文文奉倾向性分析研究要目的是让计算机可以自动的准确

4、的识别出待分析的中文文本是属于主观文本还是客观文本。只有主观性的文本才能体现出某种情感倾向信息。该课题也可以看做是一个特殊的分类问题,分类的依据是文本是否包含情感倾向。由于中文语言的多样性,语义的丰富性,主客观句的特征并不明显,基于统计的分析方法难以很好的反映中文的语义内涵,而基于语义的分析方法需要大量的专家知识,并且存在着主客观区分知识难以抽取,难以表示的问题。基于这个问题,本文提出了一种基于语义的乃j助s模式的中文文本主客观分析的方法。本文通过实验验证了该算法的可行性以及有效性。本文的主要创新点是:1.提出了一种基于情感词语义加权的句子情感倾向性识别方法该方法采用遗传学基因

5、的思想,把情感词看做基因,在不同的上下文环境中呈现出不同的情感倾向性,首先确定情感词的静态显性,界定情感词的辖域,构建情感词分析器,在情感词辖域内针对可以影响情感词情感倾向性的各种类型的因素进行分析,得出最终的情感词情感倾向,进而采用相应句式的分析方法得出整个句子的情感倾向性。从实验的结果来看,本文提出的基于情感词语义加权的句子情感倾向性识别方法在褒义和贬义句子的倾向性识别上分别取得了不错的判全率和判准率,并且F值能达到O.95以上,充分说明本文提出的算法的有效性。2.提出了一种基于语义的TriPos模式的中文文本主客观分析的方法该方法通过语义和规则相结合的处理方式对文本进行处

6、理。首先通过对大量的标注语料的分析,使用卡方统计方法,获取一个TriPos的语义模式库,然后利用这个语义模式库对待分析文本进行模式匹配,从而计算得到文本的主观性强度,为了进一步提高分析结果的准确性,本文在模式匹配之后,使用制定好的易于应用的主客观特征分析的规则对前一步计算的结果进行二次处理,最后通过加权计算得到文本的最终主观性程度,然后按照设定的阈值,通过比较得到的主观性程度与阈值的关系,确定待分析文本是否为主观性文本。实验显示,在相同的语料下,把该算法得到的实验数据与同行提出的算法得到的数据进行了对比,从而有力的证明了该方法是可行的。关键词:文本倾向性识别、语义倾向、情感词、

7、主客观分析、卡方统计AbstractWiththerapidpopularizationoftheIntemet,Internetapplicationsbecomessimplerandsimpler,andmakingthegrowingnumberofusers.Thereisadiversified,complextrendinIntemetlife.MoreandmorepeoplestarttopayattentiontotheInternet,andmaketheirvoice

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。