欢迎来到天天文库
浏览记录
ID:35090547
大小:4.07 MB
页数:70页
时间:2019-03-17
《点评类社区高效评论挖掘研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、Sou化ChinaUniversitofTechnoloygyI黎硕±学位论文点评类社区高效评论挖掘硏究rn^m-^PlF巧者姓名^^学科专业管理掉学与工提指嘗巧师谷斌教授所在学院经巧与贸畏学院论文巧巧日期2016年4月StudyonHighUtilityReviewMiningofReviewCommunityADissertationSubmittedfortheDegreeofMasterCandidate:XuJingSupervi
2、sor:Prof.GuBinSouthChinaUniversityofTechnologyGuangzhou,China分类号:C93学校代号:10561学号:201320134950华南理工大学硕士学位论文点评类社区高效评论挖掘研究作者姓名:徐菁指导教师姓名、职称:谷斌教授申请学位级别:管理学硕士学科专业名称:管理科学与工程研究方向:知识管理与技术创新论文提交日期:2016年4月20日论文答辩日期:2016年5月26日学位授予单位:华南理工大学学位授予日期:年月日答辩委员会成员:主席:吴应良(教授)
3、委员:余以胜(副教授)、王和勇(副教授)、周朴雄(副教授)、廖俊峰(副教授)华南理工大学学位论文原创性声明本人郑重声明:所呈交的论文是本人在导师的指导下独立进行研究所取得的研究成果。除了文中特别加标注引用的内容外,本论文不包含任何其他个人或集体己经发表或撰写的成果作品。对本文的研究做出重要贡献的个人和集体,均已在文中W明确方式标明。本人完全意识到本声明的法律后果由本人承担。作者签名:曰期:年6月徐气:^V曰学位论文版权使用授权书良本学位论文作者完全了解学校有关保留、
4、使用学位论文的规定,P;研究生在校攻读学位期间论文工作的知识产权单位属华南理工大学。学校有权保存并向国家有关部口或机构送交论文的复印件和电子版,允许学位论文被查阅(除在保密期内的保密论文外);学校可公布学位论文的全部或部分内容,可允许采用影印、缩印或其它复制手段保存、汇编学位论文一。本人电子文档的内容和纸质论文的内容相致。本学位论文属于;□保密,在年解密后适用本授权书。过不保密,同意在校园网上发布,供校内师生和与学校有共享协议的单位浏览;同意将本人学位论文提交中国学
5、术期刊(光盘版)电子杂志化全文出版和编入CNKK中国知识资源总库》,传播学位论文的全部或部分内容。"”请在上相应方框内打V()作者签名:日期:V:,指导教师签名日期:>06.名.义/;电子;作者联电话邮箱系编联含邮)系地址(摘要近年来,互联网的发展达到了新的高度,尤其随着大数据时代的到来,大数据已逐步深入到互联网的各方面应用,人们已不满足于简单的从网络上获取信息,而是更关注互联网能否带来更准确、纯净、高效的体验。web2.0的发展使用户既能生成内容又消费内容,这为点评类社
6、区的发展提供了大好的机会,每个用户都可以跨越时间和空间的限制在点评类社区上发表评论,也可以及时获取所需要的信息。然而,用户数据、评论数据爆发式增长带来越来越多的问题:在线评论数量巨大,有效信息被淹没其中,评论质量参差不齐,信息过载的问题越来越严峻。因此,如何挖掘出高效评论,减少用户的信息搜寻成本,提高在线评论的质量,完善点评类社区的评论环境成为本文的研究重点。本文以点评类社区的在线评论为研究对象,研究目的是通过在线评论分类、排序等方法挖掘高效评论,给点评类社区的用户一个纯净的评论环境并使用户阅读少量的评
7、论就能获取最全面的信息。本文的主要贡献有三点:首先,根据已有的理论研究基础建立了一套完整的高效评论挖掘指标体系,具体分为分类指标、排序指标和排序评估指标三部分。其二,设计了挖掘高效评论的二层模型。第一层为在线评论分类模型,通过分类模型将评论分为四类即高价值评论、潜力评论、可疑评论和无价值评论并着重分析潜力评论和可疑评论的特征,提出有效的措施。其中高价值评论和潜力评论作为高效评论保留,作为下一层模型的研究对象,而剩余的低效评论将进行过滤处理。第二层为高效评论排序模型。本文采用基于主题建模的排序算法和基于词
8、向量相似度的排序算法两种方法分别对上一层分类模型得到的高效评论进行排序,抽取出前k条评论利用评估指标进行对比分析,选择最优排序模型。其三,以大众点评网上某餐馆的评论数据进行实验分析,验证了模型的有效性。通过实践,最终选择基于主题建模的排序算法为最佳排序模型并提出可行的建议与措施。此外,本文还得到两点结论:第一,分类模型能够发现问题,对症下药,准确过滤;第二,排序模型能够提取信息,精简冗余,完善体验。本文的理论创新体现在研究对象、研究角度、研
此文档下载收益归作者所有