基于属性集合产品评论挖掘的研究

基于属性集合产品评论挖掘的研究

ID:32793333

大小:3.16 MB

页数:54页

时间:2019-02-15

基于属性集合产品评论挖掘的研究_第1页
基于属性集合产品评论挖掘的研究_第2页
基于属性集合产品评论挖掘的研究_第3页
基于属性集合产品评论挖掘的研究_第4页
基于属性集合产品评论挖掘的研究_第5页
资源描述:

《基于属性集合产品评论挖掘的研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、华中科技大学硕士学位论文摘要随着Web2.0的兴起与普及,以及电子商务的快速发展,越来越多的消费者选择网络购物,并发表产品评论。这些产品评论成为了潜在消费者了解产品信息的一个重要的来源,并且在一定程度上影响着消费者的潜在消费行为。针对这些非结构化的、离散分布的产品评论,产品评论挖掘采用自然语言处理技术,以自动化的方式分析这些资源,帮助企业和个人方便、有效地获取这些信息。本文主要围绕基于属性的产品评论挖掘问题展开研究。在分析现有产品属性识别方法不足的基础上,提出建立产品属性集合的方法,从而更好的挖掘和汇总评论信息。首先,手工提取产品说明书和少

2、量评论文本中的产品属性词语,利用产品属性集合的建立思想建立针对该产品类别的属性集合。并利用点互信息(PMI)的方法识别新评论文本中出现的新的产品属性词语,动态地扩展产品属性集合。其次,利用HowNet(知网)中的正、负面评价词组成种子情感词集合,并利用WordNet的同义词、反义词集合预测评论中观点词的情感倾向,对种子情感词集合进行扩展。然后,根据评论句中属性词语、情感词语和否定词语的数量,利用连接词以及就近原则计算产品属性的情感分值,并利用产品属性集合的层次结构将属性分值由最底层逐层向上汇总,获得产品各个层次上的意见分值。最后,本文以ww

3、w.Amazon.com上Canon(佳能)品牌下PowershotSD780IS相机的所有用户评论为样本,基于以上研究,获得基于该款相机的意见挖掘结果,并利用产品属性集合以及产品评价指标对结果进行局部和整体两方面的展示。关键词:评论挖掘;产品属性集合;属性识别;点互信息I华中科技大学硕士学位论文AbstractAlongwiththefastdevelopmentofE-commerceandthepopulationofWeb2.0,moreandmoreconsumersgoshoppingonlineandpostreviewsof

4、products.Thosecustomerreviewsareexcellentsourcesforpotentialcustomerstogainmoreinformationofproducts,andmayhavesomeimpactsonpotentialconsumers'behavior.Tothoseunstructuredandscatteredopinions,productopinionminingisbeingdevelopedtoexploitthesesourcestohelpcompaniesandindivi

5、dualstogainsuchinformationeffectivelyandeasily,usingNLPtechniquesautomated.Westudytheproblemofopinionminingatthefeature-basedlevel.Afteranalyzingthelimitationoftheexistingmethodsofproductfeatureidentification,weproposeamethodbasedonproductfeaturessystemtobetterminingandsum

6、marizingcustomerreviews.Firstly,wemanuallycomeupproductfeaturesfromuserguideofproductandasmallamountofproductreviewstext,andestablishaproductfeaturessystemoftheproductcategory,accordingtothetheoryofestablishingproductfeaturessystem.Then,weidentifynewproductfeaturesintheadd

7、itionalopinionsbyusingpointwiseMutualInformation(PMI),inordertoimproveproductfeaturessystemdynamically.Secondly,weutilizethesepositiveandnegativewordsinHowNetastheopinionseedlist.AndweexpandtheseedlistbyutilizingtheadjectivesynonymsetandantonymsetinWordNettopredicttheseman

8、ticorientationsofadjectives.Thirdly,accordingtothenumberoffeaturewords,opinionwordsandneg

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。