面向网络舆情的文本语义倾向性分类算法研究

面向网络舆情的文本语义倾向性分类算法研究

ID:35102276

大小:2.89 MB

页数:60页

时间:2019-03-17

面向网络舆情的文本语义倾向性分类算法研究_第1页
面向网络舆情的文本语义倾向性分类算法研究_第2页
面向网络舆情的文本语义倾向性分类算法研究_第3页
面向网络舆情的文本语义倾向性分类算法研究_第4页
面向网络舆情的文本语义倾向性分类算法研究_第5页
资源描述:

《面向网络舆情的文本语义倾向性分类算法研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、@钉^义巧夫争HebeiUniversityofEngineering硕±学位论文题目:面向网络舆情的文本语义倾向性分类算法研究作者姓名:王巧指导教师:汤永新讲师学科专业:软件工程所在学院:信息与电气工程学院I2016年5月提交论文日期:11日独创性声明:,本人郑重声明所呈交的学位论文是本人在导师的指导下,独立进行研究工作所取得的成果。除义中己经注明引用的内容外,本文不含任何其他个人或集体已经发表或撰写过的研究成果,化不巧含为巧得河北工程大学或其化教育化构的学位或证书而使用过的材料。对本文的研究做出重要贡献的个人

2、和集体,均己在论文中作了明确的说明并表示了谢意。本人完全意识到本声明的法律结果由本人承担。 ̄学位论文作者签名);王签字日期:谷年i月日;学位论文版权使用授权书本学位论文作者完全了解河北王程大学有关保留、使用学位论文的规定。恃授权河北王捏大学可W将举份论义的令部或部分内巧编入有关微据廣进行检索,并采用影印、缩印或扫描等复制手段保存、汇编供查阅和借阅。同意学校向国家有关部口或机构送交论文的复印件和电子文档。(保密的学位论文在解密后适用本授权说明)^/^学位论文作者签名:签字日期;可/年r月若日导师签名:签字日期;月^日工学硕士学位论文面向网络舆情

3、的文本语义倾向性分类算法研究河北工程大学2015年5月分类号:TU311密级:UDC:单位代码:10076工学硕士学位论文面向网络舆情的文本语义倾向性分类算法研究作者姓名:王炜指导教师:汤永新申请学位级别:工学硕士学科专业:软件工程所在单位:信息与电气学院授予学位单位:河北工程大学ADissertationSubmittedtoHebeiUniversityofEngineeringFortheAcademicDegreeofMasterofEngineeringTextsemanticorientationclassificationalgorithmsfornetworkpublicop

4、inionCandidate:WangWeiSupervisor:TangYongxinAcademicDegreeAppliedfor:MasterofEngineeringSpecialty:SoftwareEngineeringCollege/Department:CollegeofInformationandElectricEngineeringHebeiUniversityofEngineeringMay,2016摘要舆情指的是作为社会主体的民众,在一定范围的社会空间内,围绕各种类型社会事件或问题的发生、发展与变化对于社会管理者所产生和持有的情感及态度。近年来,网页已成为反映社会舆

5、情的主要载体之一,又由于互联网网页呈指数级方式的增长,网络舆情在已逐渐成为政府与企业重点关注的强大舆论平台。抓住网络舆情的导向则可以及时地了解民众对于某条政策或某个事件的倾向性态度,及时需求做出改进。因此分析网络舆情倾向性是现今自然语言处理的热点问题。网络舆情的倾向性分析需要借助计算机自然语言处理技术高效、准确地甄别网页所涵盖的信息,并快速有效地对舆情进行分析与分类。传统的语义倾向性分析算法需要依靠网络用户选择赞同、反对等简单的投票形式来体现对事件或产品的态度与倾向性。然而,这对于如今的网络媒体已经远远不够,民众的评论等以微博等形式呈现,其语义间细微差别与上下文的信息内容分析成为一个判断倾向

6、性的关键问题。本文试图面向网络舆情建立文本语义倾向性分析模型,以提高语义倾向性分类的准确性。主要研究成果如下:(1)构建了基于HowNet与中文情感词汇本体库的情感词词典。该词典采用了HowNet情感词典的正负情感词汇库,并借鉴了中文情感词汇本体的极性标注方式,再经过人工添加网络常用词汇,形成了小型的情感词典用于文本的预处理。(2)提出了一种面向网络舆情的特征词权重计算方法。该方法由传统的TF-IDF(TermFrequency-InverseDocumentFrequency)权重算法添加位置权重、情感权重以及均衡性变量,使权重更适用于情感倾向性分析。在本文实验中,改进的计算方法取得了良好

7、的分类效果。(3)应用了一种基于隐含马尔科夫(HiddenMarkovModel,HMM)模型的舆情倾向性分析算法。通过将文本特征词序列作为HMM模型的观察序列,利用其解码算法得到该观察序列所对应的最优状态序列,从而计算出最终的情感倾向性。该方法相较于经典的NaiveByes和SVM分类算法在性能上有一定的提高。关键词:网络舆情;倾向性分析;情感词典;特征词选取;隐马尔可夫模型IAbstractPublico

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。