在线用户评论的主题发现研究

在线用户评论的主题发现研究

ID:46439777

大小:83.00 KB

页数:14页

时间:2019-11-23

在线用户评论的主题发现研究_第1页
在线用户评论的主题发现研究_第2页
在线用户评论的主题发现研究_第3页
在线用户评论的主题发现研究_第4页
在线用户评论的主题发现研究_第5页
资源描述:

《在线用户评论的主题发现研究》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库

1、在线用户评论的主题发现研究〔摘要)在线用户评论是电子商务网站中的一个重要板块,找出在线用户评论的关注点有利于网站、商家及时有效地查看用户的反馈信息。本文在对在线用户评论进行分词的基础上,分别使用拉普拉斯评分(LS,LaplacianScore)及信息增益(IG,InformationGain)对所得到的分词结果进行文本主题挖掘,并使用支持向量机(SVM,SupportVectorMachine)进行分类精度的检验。实证结果表明,主题选择的结果是有效的,分类的效果与选择的关键词个数和核函数有关〔关键

2、词〕中文分词;主题发现;拉普拉斯评分;信息增益;支持向量机D0I:10.3969/j.issn.1008-0821.2015.09.0121中图分类号)〔文献标识码〕A(文章编号)1008-0821(2015)09-0063-07(Abstract〕Onlineusersreviewsareimportantfore-businesswebsite,andfindingthetopicofthesereviewscanhelpbothwebsitesandbusinessespaycloseatt

3、entiontousersfeedbacks.Basedonwordsegmentation,thispaperseparatelyusedlaplacianscore(LS)andinformationgain(IG)tofindtexttopic,andthensupportvectormachine(SVM)methodwasusedtoverifytheclassificationaccuracy.Theresultsshowedthatitiseffectivetoselectthete

4、xttopicandtheaccuracyisre1a.tedtothenumberoftopicandthecorefunctionused.〔Keywords)wordsegmentation;topicdiscovery;LS;IG;SVM我国电子商务市场起步较晚但发展迅速。根据2014年5月由中国互联网协会与中国互联网络信息信息中心(CNNIC)联合编纂发布的《中国互联网发展报告》(2014)显示,2013年,我国互联网用户已达到618亿,其中电子商务用户达到302亿,相比2012年增长5

5、987万人,4890%的网民使用网络渠道进行购物消费,电子商务的市场规模也达到了99万亿。蕴藏巨大潜力的市场使得各大网站不断完善自身建设,而在线用户评论模块则是网站建设中不可忽视的一环。DoubleClickInc研究了美国旅游业、计算机硬件业、运动健身行业以及服装业的网络用户行为,发现将近一半的用户会在购买前在网络中搜索产品的相关信息及用户评价等[1]目前学者们对在线用户评论的研究主要集中在主题发现研究(商品或用户的特征发现)[2-8].评论质量检测[9-12]、情感倾向识别[13-15]及相关

6、内容推荐[16-17]等方面,其中,主题发现研究是后续研究中较基础的部分,也引起了很多学者的关注APons-Pottata[2]利用将层次聚类和划分聚类相结合的方式进行主题发现;Blei[3]对LDA(latentDirichletallocation)模型进行全面的解释后,由于概率主题模型出色的文档建模和维度削减能力,主题模型在文本挖掘领域得到了迅速的发展;阮光册[4]针对网络在线用户评论信息内容短、信息量少的特征,提出了基于LDA主题发现模型,结合HowNet知识库进行信息分析的方法,实现了对

7、在线用户评论信息主题的挖掘;李慧、张舒等[5]为准确挖掘用户评论中的有用信息,提出了采用页面分块与信息癇的迭代计算技术的用户评论抽取算法,实现了评论块的自动发现与抽取;陈友、程学旗等[6]提出了一种利用特征抽取技术提取内容特征,利用结构特征去发现高质量主题的框架,并提出了一种基于遗传算法、禁忌搜索与机器学习的特征选择算法,用来评价被抽取特征的重要性;吕韶华、张亮等[7]主要针对餐馆评论提出了一种基于LDA的排序方法,通过抽取、过滤、计算评分、回归等步骤确定排序模型;罗辉停[8]为克服应用LDA模型

8、挖掘在线用户评论热点方法不能自动确定热点话题的数目的问题,提出了应用中餐馆模型来挖掘在线用户评论热点以上学者对在线用户评论主题挖掘的研究,主要集中在使用LDA及其改进模型以及针对评论特征的算法实现等方面的研究。本文利用图像特征选择的LS方法和IG方法,应用到在线用户评论文本的主题发现上,并对主题发现结果通过SVM分类方法进行比较分析,发现IG对在线用户评论效果比LS方法效果好1相关理论11中文分词与英文天然分开的单词不同,中文的词语之间没有明显的分割标识,并且中文的语言环境更加复杂

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。