基于网络文本的评论挖掘分析

基于网络文本的评论挖掘分析

ID:33473408

大小:458.07 KB

页数:54页

时间:2019-02-26

基于网络文本的评论挖掘分析_第1页
基于网络文本的评论挖掘分析_第2页
基于网络文本的评论挖掘分析_第3页
基于网络文本的评论挖掘分析_第4页
基于网络文本的评论挖掘分析_第5页
资源描述:

《基于网络文本的评论挖掘分析》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、分类号学校代码10487学号M200971704密级硕士学位论文基于网络文本的评论挖掘分析学位申请人:学科专业:指导教师:答辩日期:王超通信与信息系统余鑫2012-01-09AThesisSubmittedinPartialFulfillmentoftheRequirementsfortheMaster’sDegreeofEngineeringOpinionMiningbasedonNetworkTextCandidate:WangChaoMajor:CommunicationandInformationSystemSuper

2、visor:YuXinHuazhongUniversityofScience&TechnologyWuhan430074,P.R.ChinaJan,2012独创性声明本人声明所呈交的学位论文是我个人在导师指导下进行的研究工作及取得的研究成果。尽我所知,除文中已经标明引用的内容外,本论文不包含任何其他个人或集体已经发表或撰写过的研究成果。对本文的研究做出贡献的个人和集体,均已在文中以明确方式标明。本人完全意识到本声明的法律结果由本人承担。学位论文作者签名:日期:年月日学位论文版权使用授权书本学位论文作者完全了解学校有关保留、使用

3、学位论文的规定,即:学校有权保留并向国家有关部门或机构送交论文的复印件和电子版,允许论文被查阅和借阅。本人授权华中科技大学可以将本学位论文的全部或部分内容编入有关数据库进行检索,可以采用影印、缩印或扫描等复制手段保存和汇编本学位论文。保密£,在年解密后适用本授权书。本论文属于不保密£。(请在以上方框内打“√”)学位论文作者签名:指导教师签名:日期:年月日日期:年月日华中科技大学硕士学位论文摘要目前,互联网上信息与日剧增,蕴藏着巨大的信息量。在网络上,人们可以获取到相对以前更多的信息,在这些网络信息中,评论类型的

4、信息占有十分巨大的比例。由网络本身特点所限,这些评论信息十分繁杂,大量有效信息与无效信息往往混杂在一起。人们想要在短时间内从针对诸如人物、事件、传媒、产品等的评价信息中获取有价值信息往往十分困难。因此针对评论信息的挖掘分析,有用信息提取已是一个日益重要的任务。在评论信息的挖掘分析,有用信息提取方面,本文主要关注于评论文本过滤以及对评论信息的主题属性提取与情感分析上。在评论文本过滤主要实现了对网路评论文本中的无用语的过滤,并通过分析评论文本与主题文本的相关度来过滤其中相关度较低的无关评论信息。在评论信息的主题提取方面则进行了对针对特定

5、主题的评论集合中关注的主题属性词进行了识别,在感情分析方面则进行了针对具体每条评论以及整个评论集合在感情倾向性方面的判断。针对评论文本过滤,本研究先对中文文本利用成熟的分词工具进行了分词划分以及词性标识,结合无用语字典树实现了无用语的过滤,同时利用文本间距离分析实现了主题不相关文本的过滤。对于评论信息的主题提取,本研究在汉语文本的名词以及名词短语的挖掘基础上,利用针对中文的词性组合规律,结合文本训练集与中文伴生词匹配进行数据筛选,完成了对评论信息中关注的主题属性的挖掘分析。在评论感情倾向性分析步骤中,从底层至上层逐次进行分析,在最重

6、要的感情极性词挖掘部分,利用一种基于极性词字典的无监督学习方式进行词汇扩容,实现了极性词的自动获取与定量评估,在此基础上,实现针对中文短句,中文评论以及整体评论集的感情倾向性分析。关键词:评论;网络文本;过滤;主题提取;感情倾向I华中科技大学硕士学位论文AbstractAtpresent,informationontheinternetisincreasingrapidly.Ontheinternet,peoplecangetmoreinformationthattheyhaveainterestthanever.Meanwhile

7、,theinformationofreviewsoccupiesaverylargeproportion.Basedonthecharacteristicsoftheinternet,thoseinformationisverycomplex,thoseusefulinformationandinvalidinformationisoftenmixedtogether.Itisoftenverydifficultforpeopletoobtainvaluableinformationfromreviewsaboutcertainpe

8、rsons,events,media,productsinashorttime.Therefore,dataminingfromthereviewssuchasusefulinformationextractionhasbecomea

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。