欢迎来到天天文库
浏览记录
ID:51095536
大小:5.95 MB
页数:68页
时间:2020-03-18
《以用户为中心的观点挖掘研究.pdf》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库。
1、ADisertationSubmittedtoZhejiangUniversityfortheDegreeofUnlVers1tYereeMasterofEngineeringTITLE:ResearchonUser—centriCAuthor:ChenMinSupervisor:£!Q£曼兰兰Q!兰i旦g
2、Ii旦g旦!Q£旦兰曼Q!堕坠丛i望g鱼坚iSubject:gQ坐乜丛主金!△乜乜!i璺垒主iQ卫!皇鱼h卫Q!QgYCollege:£Q!!金g旦Q至gQ匹乜坠主金!墨曼i皇卫星金SubmittedDate:I]垒旦坠垒!Y窒
3、Q!垒浙江大学研究生学位论文独创性声明本人声明所呈交的学位论文是本人在导师指导下进行的研究工作及取得的研究成果。除了文中特别加以标注和致谢的地方外,论文中不包含其他人已经发表或撰写过的研究成果,也不包含为获得迸婆盘堂或其他教育机构的学位或证书而使用过的材料。与我一同工作的同志对本研究所做的任何贡献均已在论文中作了明确的说明并表示谢意。学位论文作者签名:雨、乳签字日期:p竹年;月多日学位论文版权使用授权书本学位论文作者完全了解迸’江盘堂有权保留并向国家有关部门或机构送交本论文的复印件和磁盘,允许论文被查阅和借阅。本人授权逝姿盘茔可以将
4、学位论文的全部或部分内容编入有关数据库进行检索和传播,可以采用影印、缩印或扫描等复制手段保存、汇编学位论文。(保密的学位论文在解密后适用本授权书)学位论文作者签名:胨复导师签名:签字日期:Ⅵ咐年j月≥Et签字日期:年月Et浙江大学硕士学位论文摘要随着互联网技术的飞速发展,博客、社交网络、微博等平台的出现,使得人们在网络上发表个人观点变得更为方便快捷。如何从海量数据中提取出消费者、商家、政府等群体需要的信息,并对其进行分析、总结,从而形成有有针对性的、可读性强的分析结果,就变得尤为重要。而现阶段研究者们所进行的观点挖掘,绝大多数都忽略
5、了观点的一个本质特性,即评论者的主观性。单纯地针对评论进行观点挖掘,而未能很好地考虑用户的行为,将影响挖掘结果的精确性。针对以上问题,本文通过引入用户的行为来对现有的观点挖掘技术进行改进。本文的研究成果主要体现在以下儿个方面:(1)针对数值评论部分提出了基于HITS算法的改进挖掘算法;(2)针对文本评论部分采用了朴素贝叶斯分类法,将评论内容映射为分值形式;(3)将数值部分与文本部分评论相结合,剔除不相匹配的评论,从而为用户提供更高可信度的观点挖掘结果。对比实验表明,两种算法均取得了较好的效果,两部分评论的结合有效提高了挖掘结果的准确
6、性。关键词:观点挖掘,用户行为,HITS算法,朴素贝叶斯分类法浙江大学硕士学位论文AbstractWiththerapiddevelopmentofInternettechnology,theuseofthenetworkinpeople’Sdailylifehasbecomeincreasinglypopular.Theappearanceofblog,socialnetworking,weiboandsomeotherplatforms,makespeopleexpresstheirpersonalviewsontheIntem
7、etmoreconvenient.Asaresult,itbecomesparticularlyimportanttoextractinformationfromthemassivedatawhichconsumers,businesses,governmentandothergroupsneed,andanalyze,integrate,therebyformingatargeted,readableanalysisresult.Butatthepresentstage,researchersinthefieldofopinion
8、miningoftenignoretheessentialcharacteristicsofanopinion,that’Sreviewers’subjectivity.Simplyminingtheopinionwithoutconsideringuserbehaviorwillaffectstheaccuracyofminingresults.Tosolvetheaboveproblem,thispaperimprovesexistingopinionminingtechnologybyconsideringuserbehavi
9、or.Accomplishmentsinthisarticleislistedbeiow:(1)ProposesimprovedalgorithmbasedonHITSalgorithmfornumericalcommentsecti
此文档下载收益归作者所有