欢迎来到天天文库
浏览记录
ID:28031681
大小:47.04 KB
页数:3页
时间:2018-12-07
《基于评价搭配的产品情感倾向聚类方法研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、易发www.yif3biao.net论文发志右家基于评价搭配的产品情感倾向聚类方法研究【摘要L随着计算机技术和互联网的迅速发展,网络评论的数量正在日益增加。人们既可以在商业网站,也可以在博客、微博、论坛等网络媒体上发表对产品的价格、性能和售后服务等方面的看法、建议以及意见。对于某一个流行的产品,若用户采用浏览方式获取大量的自己感兴趣的评论信息,显得力不从心。因此,自动、有效地对带有情感色彩的主观性文本进行分析处理,并对其进行归纳与总结,对于普通消费者、电了商务、网络监管等具有重要的理论意义和实用价值。本文重点研究基于Web汽车评论的情感聚类问题,在对Web评论文
2、本数据的建立与评价搭配抽的基础上,分别针对文本的情感倾向和方面的情感倾向开展聚类研究。主要内容如下:(1)建立Web评论数据库本文首先获取相关的评论文本,并对评论文本数据进行分类统计和整理,建立评论文本数据库。结合领域本体知识,对评论文本中评价对象和评价词进行了定义和分析,并对评价对象间的共指关系进行了相应的分类。(2)基于评论文本的情感倾向聚类本文首先对文本进行特征向量化表示,并将评价别的情感倾向与句子的倾向结合,提出了线性带权的特征权重计算,最终采用K-Means方法,实现了文本的情感聚类。为了验证该方法的有效性,在真实汽车评论文本数据上进行实验,实验结果表
3、明,特征进行情感倾向表示,相对于用布尔权重表示和LDA的特征权重表示,在聚类的纯度和F值上都有明显提高,说明本文提出的表示方法是可行且有效的。在情感倾向评价级别上,采用了差、较差、一易发www.yif3biao.net论文发志右家般、较好、好五个评级,有利于人们更好的对相关数据的分析和应用。(3)基于方面的产品情感聚类为了对评价产品在更细粒度上进行研究,针对汽车领域的评论文本,从安全性、操控性、动力性、经济性、舒适性和服务性六个方面对汽车产品进行了情感聚类,给出汽车产品各个方面的特性和评价,不仅可以更加准确的、全面的了解观点持有者表达的真正意图,同时还可帮助决策
4、者做出正确的决策。针对一篇评论文本中涉及多个评价产品的问题,本文结合汽车产品的领域信息,加入语义特征,在命名体识别的基础上,采用基于木体的方法对观点<lj进行了识别。观点句-评价对象/方面关联关系的融入,使基于方面的情感聚类的效果得到进一步改善。【关键词】:特征表示情感倾向方面评价搭配聚类方法【学位授予单位L山西大学【学位级别L硕士【学位授予年份】:2013【分类号】:TP391.1【目录】:中文摘要8-10ABSTRACT10-12笫一章绪论12-161.1研究背景、0的及意义121.2国内外研究现状12-131.3本文主要研究内容13-141.4论文的组织结
5、构14-16第二章Web评论文本数据的建立与特征抽取16-242.1评论文本数据的建立16-182.1.1评论文本的采集16-172.1.2评论文本数据库的建立172.1.3实验数据分布17-182.2砰价搭配18-222.2.1评价对象18-192.2.2评价词192.2.3评价对象间的共指关系19-202.2.4基于本体的特征抽取20-222.3Kmeans聚类方法222.4评价指标22-232.4.1纯度22-232.4.2F值232.5本章小结23-24第三章基丁•线性特征权重的文本情感倾向聚类24-303.1文本聚类的向量空间模型243.2布尔表示模型
6、243.3LDA表示模型24-253.4文本的特征情感倾向表示25-273.4.1句子的情感倾向位253.4.2特征词自身的倾向25-263.4.3特征权重表示26-273.5实验结果与分析27-283.6本章小结28-30策四章基于方面的产品情感倾向聚类30-384.1产品方面特征的抽取30-324.1.1方面30-314.1.2汽车领域方面特征抽取31-324.2基于方面的产品情感聚类32-334.2.1权重计算324.2.2缺失数据补充32-334.3观点句-评价对象/方面之间的关联关系33-344.3.1关联关系的描述334.3.2基于本体的关联关系识别
7、33-344.4实验结果和分析34-364.5本章小结36-38第五章结论与展望38-405.1结论38-395.2展望39-40参考文献40-46攻读学位期f⑷取得的研究成果46-47致谢47-48个人简况及联系方式48-50本论文购买请联系页眉网站。
此文档下载收益归作者所有