欢迎来到天天文库
浏览记录
ID:35082801
大小:4.24 MB
页数:51页
时间:2019-03-17
《数据挖掘方法在评论分类中的应用研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、Vf\■心vyv广东工业大学硕古学位论文(工程硕±)片'-■f.一,-矣V,-'-二--■、数据挖掘方法在评论分类中的应用研究李杰骇''义'之.y.■;'.’皆i.?’中''.''/fW‘-’..-f.I',.."、.-.、、/-.■'占V...一‘?'?矿■、..、..■?1,.二一I’.--、J,;,,。气、■'-八'-媒^’’V、‘巧却'.,'卢片..與\Y
2、.A,:媒*'一一"气-■;■:;一?'..-.?一.'■,.v,.—一、:^>,--.. ̄j..。—二0,—-六年五月.*-...?一P'、b;批,.\;-知I‘鸣吝.,‘V'若令,讀4'一‘产■如钟■节’■占.、■’????Vf?.‘■、’'.■-:T、1845分类号;学校代号:1UDC学号:密级;:2111305088广东工业大学硕±学位论文(工程硕±)数据挖掘方法在评论分类中的应用研究李杰骇校内导师姓名
3、、职称:左亚尧副教授校外导师姓名、职称;纪友庆工程师学科(专业)或领域名称:计算机技术’学生所属学院:计算机学院论文答辩日期二0—六年五月:,ADissertationforMast:ersDegreeofGuangdongUniversitofyTechnology(MasterofEnineering)ApplicationStudyonReviewClassificationbasedonDataMiningApproachCandidate:LiJieunj
4、Supervisor:Prof.ZuoYayaoMay2016SchoolofComputerScienceandTechnologyGuangdo打gUniversityofTechnologyGuanzhouGuandonP.R.China510006g,gg,,摘要.摘要随着互联网的快速发展和普及一,网络已经成为人们生活不可或缺的部分。人们通过互联网看书、视频、学习、讨论、购物时常常会在相关页面上留下关于该页面主题的评论。特别地,消费者在电商网站上进行网购之后都会留下关于购买产品
5、的评论信息。目前,随着网络上的评论信息剧増,评论数据的有效利用问题己经越来越收到人们的关注。面对大量的评论数据,如何从中挖掘到有用的信息对网站用户、服务商、生产商都有着重要的意义。然而页面上的评论信息属于非结构他数据,一个预定义的数据模型也就是代表评论数据本身并没有。由于评论数据的不规则性和不明确性、,使得其相对于按字段存储在数据库的数据难W用传统的程序进行分析统计或归纳。如何从海量的评论数据中提取有用的信息W方便用户、服务商和生产商有效、快捷地利用是本文主要探讨的问题。本文的主要任务包括对评论数据进行的情感分类和进行基
6、于价值分类。对于f一论的情感分类,文本提出种基于情感词抽取和点互信息的非监督学习方法。其中,、。对句子进行分词词性识别并从中抽取情感词,减少了分类时噪声的引入通过计算情感词和范例词的一PMI值得出个评论文档的情感倾向。对于用户而言,评论数据情感倾向并不能满足评论阅读者的需求一,因此提出种基于引入指向特征的最大赌模型方法对评论数据进行价值分类。该方法认为评论数据中有价值的信息除了与文本长度、是否存在描述性词语等特征相关还与评论文本量否指向主题相关。提出一种基于IP树的文本指向识别方法,,对识别结果作为特征引入到模型训练中实验
7、证明该方法构造的分类器具有较好的分类效果。关键词:情感分类;价值分类;语义倾向;点互信息;最大滴模型;指代识别IABSTRACTABSTRACTWiththerapiddevelopmentandpopularizationoftheI打ternet,the打etworkhas'becomea打indisensableartofeoleslives.PeoplereadbooksviatheI打temetvideopp,,ppleamdiscussofte打leave
8、aaeo打the.topiccomme打to打thereleva打taewhen,,
此文档下载收益归作者所有