欢迎来到天天文库
浏览记录
ID:32533775
大小:3.24 MB
页数:59页
时间:2019-02-11
《文本倾向性的分析技术相关的研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、安徽大学硕士学位论文文本倾向性分析技术的相关研究姓名:董晶晶申请学位级别:硕士专业:计算机软件与理论指导教师:李龙澍201204安徽大学硕士学位论文摘要近年来,随着Internet和互联网技术的发展以及博客、论坛、客户服务平台、电子商务平台等诸多应用的提出,将人们的现实生活带入一个全新的电子信息时代。网络上存在大量的富含感情色彩的文字,而且这些文字的表现形式不单单只是文字上的表述,会有图片、动画等这种非结构化的表现形式,因此仅仅是靠人工梳理将会面临处理周期长、费用高等问题。在如此大规模的评价文本中,人们急切的找到一种方法能够进行情感倾向性分析,并提取出人们所感兴
2、趣的情感信息,正在这样的需求背景下产生了文本倾向性分析研究。随着新领域的不断涌现、各个领域的信息量急速增加,由于在训练域里显示有强烈倾向性的词在测试域里不再有强烈倾向性,在这种研究背景下产生了跨领域倾向性分析问题。跨领域倾向性分析相对而言是一个全新的研究领域,对此目前的研究工作还比较少。本文的重点就是在构建跨领域词典算法的基础上,以跨领域文本倾向性分析技术为目标,重点对以下几个方面进行深入的研究:首先,介绍了文本倾向性分析研究的背景与意义,并在分析目前国内外情感倾向性分析研究现状的基础上,分析了情感词典的构建与文本倾向性分析所面临的挑战,最后进一步明确了跨领域文
3、本倾向性分析研究的意义和必要性。然后,主要对文本倾向性分析做了概述性的介绍。文本倾向性分析过程是首先通过中文分词技术得到能够体现文档情感的关键词语,然后根据词典构建算法来构建词典,本文分别介绍了通用词典构建技术和领域词典的构建技术。通用词典构建技术中包括基于知网的通用词典构建,基于函数优化的方法和基于Modularity优化的方法;领域词典的构建技术主要介绍基于改进的信息瓶颈算法,本文从理论与实验两个角度分别分析了方法的收敛性和有效性等特性。最后介绍了文本倾向性度量方法,主要是先利用计算词语相似度的方法获得词语的倾向性,根据累加原则,再得到语句的倾向性继而得到文
4、本的倾向性。第三,重点分析了跨领域文本倾向性分析技术。针对跨领域情感倾向性分析研究,主要介绍了文本倾向性分析应用技术的领域移植技术。通过分析源领域与目的领域的特征空间之间的共性与差异,为了消除特征空间差异对分类器性能造安徽大学硕士学位论文文本倾向性分析技术的相-芙研究成的负面影响,本文提出了基于监督学习的倾向性分析方法的领域移植模型:为了平衡源领域数据并获得目标领域信息,提出了基于贝叶斯学习的情感移植模型;基于图排序模型的跨领域倾向性分析算法的主题思想就是在图排序算法的基础上,利用源领域的训练文本中已标注的准确标签和目标领域的测试文本的由计算所得初始化的伪标签来
5、迭代进行倾向性分析。第四章,介绍了本文实验所用的数据集和对实验结果的评价标准以及文本情感倾向性分析开发的平台。基于开发平台设计并实现了一个跨领域文本倾向性分析系统。在跨领域文本情感倾向性分析系统中,系统在跨领域情感词典构建的基础上,利用图排序模型来实现跨领域倾向性分析。关键词:情感词典;倾向性分析:跨领域:图排序:信息瓶颈:安徽大学硕上学位论文AbstractAbstractInrecentyears,withthedevelopmentoftheIntemettechnologyandthepropositionandapplicationofmanynewi
6、deas,suchastheblogs,forums,customerserviceflatform,e—commerceplatform,wearemarchingintoaneweraofinformation.Networkwhichcontinuouslychangespeople’straditionallife,workandstudystylehasbecomeacloselypartofthedevelopmentofalltradesandprofessionsandaffectionofpeople’Slife.Foralargenumber
7、ofinformationtextenrichingemotionalcolor'butthemanifestationsofthesewordsisnotonlythetextualrepresentation,therewillbepictures,animations,andothermanifestationsofthisunstructured.wefaceprocessingcyclesandhighercostifonlybyartificial.ThereisallurgentneedforpeopletolookforamethodtOdraw
8、requiredemot
此文档下载收益归作者所有