欢迎来到天天文库
浏览记录
ID:33509046
大小:4.50 MB
页数:61页
时间:2019-02-26
《基于中文微博的产品评价分类及推荐算法研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、万方数据硕士学位论文基于中文微博的产品评价分类及推荐算法研究ResearchonProductEvaluationClassificationandRecommendationAlgorithmbasedonChineseMicro—blogging学号:21117011大连理工大学DalianUniversityofTechnology万方数据大连理工大学学位论文独创性声明作者郑重声明:所呈交的学位论文,是本人在导师的指导下进行研究工作所取得的成果。尽我所知,除文中已经注明引用内容和致谢的地方外,本论文不包含其他个人或集体已经发表的研究成果,也不包含其他已申请学位或其他用途使用过的成
2、果。与我一同工作的同志对本研究所做的贡献均已在论文中做了明确的说明并表示了谢意。若有不实之处,本人愿意承担相关法律责任。学位论文题目:基王主塞邀监鲍庄昌迁盆佥娄丞推益箕洼盈窒作者签名:趣重丝日期:竺兰年—堡月—三日万方数据大连理工大学硕士学位论文摘要微博是近年新兴的网络媒体传播平台,它具有内容简短、传播速度快、用户众多等特点,而对于微博文本的情感分析是近年来数据挖掘的热点之一,具有重要意义和价值。用户在实施网上购物等行为时,都希望从微博上获取关注产品的评价信息。本文针对中文微博产品评价信息挖掘中存在的文本格式不规范、网络用语大量使用、成分省略等文本特点,及标记数据稀缺、手工标注困难等分
3、类问题开展了如下几项研究工作。针对中文微博的文本特点,提出了一种情感评价单元构建方法。该方法分别构建了情感评价词、副词和评价对象词典,并制定了相应的成分补充和单元构建规则,不仅保证了提取信息的全面性和准确性,还在精简词集、提高效率方面做出了尝试。实验表明,该方法的准确性比基于句法路径的相关方法更高。针对微博文本的分类问题,提出了一种基于图半监督学习的分类算法LP.SVM。该算法将标签扩散过程与支持向量机相结合,不仅实现了少量标记样本的分类,而且避免了图半监督学习不产生分类器,对于新数据只能重新训练的问题。结合该算法对微博产品的情感评价单元进行特征提取和半监督分类。实验表明,该算法的表现
4、优于传统及直推式的支持向量机算法。结合实际应用,提出了一种基于评价分类的微博产品推荐算法。该算法利用产品评价分类的结果,并结合微博的文本特征,制定了微博产品推荐指标及其计算方法。实验最终得到的微博产品推荐方案与相关网站用户评价结果基本一致,充分验证了该算法的准确性。关键词:中文微博;半监督学习;支持向量机;评价分类;产品推荐万方数据基于中文微博的产品评价分类及推荐算法研究ResearchonProductEvaluationClassificationandRecommendationAlgorithmbasedonChineseMicro-bloggingAbstractInrece
5、ntyears,micro—bloggingisallemergingintemetmediaplatform,anditsfeaturesareshortcontent,fastspread,alargenumberofusersandSOon.Sentimentanalysisonmicro—bloggingisanimportantandmeaningfulpartofthisfield.Usersmaywanttogetinformationfrommicro-blogging,whentheydoshoppingorotherbehaviorsonline.Aimingatt
6、extchara-cteristicslikeirregularformat,networklanguage,omittedcomponent,andclassificationprob-lemslikescarcelabeleddata,difficultmanualannotationexistedinproductevaluationdataminingonChinesemicro—blogging,thispapermainlycarriesoutthefollowingresearchwork.Accordingtotextcharacteristics,proposesam
7、ethodforconstructingemotionevaluationunitsets.Thismethodrespectivelyconstructsthreedictionariesofevaluationwords,adverbs,andevaluationobjectwords,andformulatessomerulesforcomponentcomplementandunitconstruction.Itnotonlyensur
此文档下载收益归作者所有