欢迎来到天天文库
浏览记录
ID:35187396
大小:6.60 MB
页数:75页
时间:2019-03-21
《网站商品评论挖掘技术的研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、I学校代码0004密级;公开:1如系、交道义爹BEIJINGJIAOTONGUNIVERSITY硕±学位论文网站商品评论挖掘技术的研究作者姓名李军伟学科专业计算机科学与技术指导教师李向前副教授胃i培养院系计算机与信息技术学院;-售巧:ff扁如'交4乂攀硕±学位论文网站商品评论挖掘技术的研究ResearchonOpinionMiningTechnologyforProduct民eviewsonWebshes作者:李军伟导师
2、:李向前北京交通大学2016年3月学位论文版权使用授权书本学位论文作者完全了解北京交通大学有关保留、使用学位论文的规定。恃授权北京交通大学可W将学位论文的全部或部分内容编入有关数据库进行检索,提供阅览服务,并采用影印、缩印或扫描等复制手段保存、汇编W供查阅和借阅。同意学校向国家有关部口或机构送交论文的复印件和磁盘。学校可W为存在馆际合作关系的兄弟高校用户提供文献传递服务和交换服务。(保密的学位论文在解密后适用本授权说明)学位论文作者签名:导师签名:签字日期:年^月日签字日期
3、;年^月/日/1:学校代码:0004密级公开北京交通大学硕±学位论文网站商品评论挖掘技术的研究ResearchonOinionMininTechnolopggyforProductReviewsonWebsi化s作者姓名:李军伟学号:13120403导师姓名:李向前职称:副教授学位类别:工学学位级别:硕±学科专业:计算机科学与技术研究方向:机器学习与认知计算北京交通大学2016年3月i致谢本论文是在我的导师李向前老师的悉如指导下完
4、成的,李向前老师科学的工、作方法和严谨的教学态度给了我很大帮助,使我受益匪浅感谢李向前。在此衷也老师H年W来对我的关瓜和指导。在实验语料选取过程中,徐金安老师给了我很大帮助。在论文撰写过程中,霍有利老师提出了宝贵意见,对两位老师表示由衷的感谢。。在此在课题研究期间,与杨健、李越川、刘华西、商荣柱等同学的讨论,使得我的研究工作更加顺利,在,得到的实验结果也更加理想此向他们表达我的感激之情。感谢我的女朋友陈佳芳不辞劳苦,帮我做了许多语料标注工作。此外,也感谢我的家人,他们的理解和支持使我能够
5、在学校专也完成我的学业。北京交通大学硕±学位论文摘要摘要,购物网站随着互联网应用的迅速发展、点评网站tu及各种论坛上不断积累了越来越多的商品评论文本,基于方面的情感分析备。在商品评论挖掘的研究中受关注。从消费者的角度来看,不同消费者看重的方面会有所区别,基于方面的情感分析结果可W帮助他们选择更适合自己的产品。从商家的角度来看,基于方面的情感分析结果可让商家知道其产品有哪些方面存在问题,可帮助他们对产品进行改进。本文利用CRFs模型,对评论文本进行基于方面的情感分析研究,主要包括
6、方面与评价词抽取-、情感极性及强度分析、基于主题方面的情感极性及强度分析结果总结H部分。关于方面与评价词的抽取,本文提出了基于LDA和CRFs的半监督方面词与评价词同步抽取方法。初始方面词与评价词集合从LDA主题模型的训练结果W及知网的情感词典中获取。在CRFs模型中,融合了统计特征(从LDA主题模型的训练结果中得到)、语义特征(词、词性、语气词、程度词、词之间的前后关系)W及方面与评价词的共现等特征.7%,,最终得到方面词抽取的F1值为71评价词抽取的F1值为55,.3%。和有监督学习
7、相比本文的半监督方法能很大程度上减少方面词和评价词标注的工作量一。因为是半监督,该方法还具有定的跨领域性,,需要做的额外工作很少如果应用到其他领域。关于情感极性分类及强度分析,本文利用层叠CRFs模型,融合词、词性、语,在情感句识别气词、程度词、方面和评价词的共现等特征、情感极性分类和情感强度分析上得到的F1值分别为86.3%、77.2%、70.7%。基于主题-关于意见总结,本文提出了方面的情感极性及强度分析结果总结方一,个评论挖掘系统,对挖掘效果进行了直观的展示法并实现了。关键词:商品
8、评论;条;方面抽取;情感分析件随机场;主题模型分类号:TP391iii北京交通大学硕±学位论文ABSTRACTABSTRACTWiththegrowi打gpopularityoftheI打temetapplication,shoppingwebshe,reviewwebsitesas
此文档下载收益归作者所有