欢迎来到天天文库
浏览记录
ID:35065058
大小:5.55 MB
页数:49页
时间:2019-03-17
《基于意见挖掘的商品推荐问题的研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、畏卑善--.-:,辕1006016-0325中图分类号TP391与论义编号"?学科分类号206099V:5..密级.*义涛嗦乂净—’.'TIANJINUNIVERSITYOFTECHNOLOGY硕±专业学位论文基于意见挖掘的商品推荐问题的硏究ResearchonCommodityRecommendationBasedonOpinionMining.‘.-1L為雜一@,!3B!v編£1^^^-':'-说‘’:肖;,:;;V;W如':名鑛,,,.'
2、震寒度,.;:;畔:.巧;':.'巧:.;':.:y:y監结萬T.苗苦舌背打薄讓早.;讓与\;囊議蠢薦1::'''y:巧式養繫養養亨連簿写V鴻巧資;:;苦巧;;;;門,n巧:;岛吉,轉寒^;!.屬識議蠻茲迫iii麵圍議謂議^齡.'::酵i*r:顆瞻漏1獅±H回I踐巧測B|固眶BiitI抽计算觀术■■皮=M造柴晓瑞■王晓哗副教授H:[|[^纖3"****^*******早—*一义-天津理工大学研究生院二0—六年H月分类号:TP391520.6099密级:天津理工大
3、学研究生学位论文基于意见挖掘的商品推荐问题的研究(申请硕士学位)学科专业:计算机技术研究方向:数据挖掘作者姓名:柴晓瑞指导教师:王晓晔副教授2016年3月ThesisSubmittedtoTianjinUniversityofTechnologyfortheMaster’sDegreeResearchonCommodityRecommendationBasedonOpinionMiningByXiaoruiChaiSupervisorXiaoyeWangMarch,2016独刮牲采巧本人声明所呈交的学位论文是本人在导师指导下进行的硏巧工作和取
4、得的研究成果,,隐了文中特别加标注和致谢之处外论文中不包含其他人已经发表或撰写过的研究成果,也不包含为获得天津理工大学或其他教育机构的学位或证书而使用过的材料一同工作的同志对本研。与我究所做的任何贡献均已在论文中作了明确的说明并表示了谢意。学么备丈作老签名;聲就碍签拿巧期;三〇《年3月日个学佐文软权使巧摸权书本学位论文作者完全了解义津理工大学有关保留、使用学位论文的规定。特授权义津理工大学可W将学位论文的全部或部分内容编入有关数据库进行检索,并采用影印、缩印或扫描等复制手段保存、汇编,切供查阅和借阅。同意学校
5、向国家有关部口或机构送交论文的复本和电子文件。(保密的学位论文在解密后适用本授权说明)学么冷文作者签為;聲喊导师签《;签拿g瑚:边《年5月争日签李可期;年J月手曰摘要现在网上购物日渐流行,网购时用户为了真实地了解商品信息,会查看别的用户的评论内容,但商品评论多达几千万条,用户很难逐条查看,而且评论中的信息并非都具有参考价值,这样的查看过程很容易降低用户的购买欲望。所以,对网上评论进行挖掘以提取出有用的信息供用户查看就势在必行了。对网上评论挖掘有用信息,主要是抽取评论信息所描述的商品属性(即评价对象)和描述属性的修饰词(即评价词
6、),然后针对每一个属性,将其修饰词以好中差性质分类,统计每个类别的比例,将这些结果显示给用户,用户就可以很直观的看出商品每一属性的评价情况,而不需要逐条查看评论来获取这些信息。如果将商品属性提供给用户,用户选择自己偏好的属性,那么可以根据这些偏好属性得出商品排名,进而为用户推荐商品,这就是基于意见挖掘的商品推荐,为了实现这一目的,本文所做的工作如下:1)首先基于名词词组模式抽取评价对象和评价词,但有些评价对象是与商品属性无关的冗余词,有些不同的评价对象描述的是商品的同一属性,所以本文先对评价对象修剪和聚类,利用BIRCH算法对评价对象聚类时自学习聚
7、类数目的特点,删除BIRCH聚类后所含对象少的簇,即达到修剪评价对象的目的,再使用K-Means聚类算法对剩余的簇进行全局聚类,得出最终商品属性。实验使用京东商城上笔记本电脑的评论信息作为测试数据,分别将本文的修剪和聚类方法与两种经典的修剪和聚类方法进行实验对比分析,验证了本文方法的有效性。2)修剪聚类评价对象后,开始进行评价词极性判断。判断评价词的极性时,本文首先基于情感词库进行判断,对于情感词库不存在的评价词,使用word2vec与HowNet线性叠合的方法来计算词语与情感种子词的相似度,进而确定评价词的极性值,最后使用K-Means聚类算法对
8、评价词进行类别划分,本文将评价词分为五类:很好、好、中、差、很差。通过与以往的两种极性判断方法进行正确率比较,验证了本文方
此文档下载收益归作者所有