基于兴趣识别的新浪微博用户群划分研究与实现

基于兴趣识别的新浪微博用户群划分研究与实现

ID:37383442

大小:10.21 MB

页数:67页

时间:2019-05-23

基于兴趣识别的新浪微博用户群划分研究与实现_第1页
基于兴趣识别的新浪微博用户群划分研究与实现_第2页
基于兴趣识别的新浪微博用户群划分研究与实现_第3页
基于兴趣识别的新浪微博用户群划分研究与实现_第4页
基于兴趣识别的新浪微博用户群划分研究与实现_第5页
资源描述:

《基于兴趣识别的新浪微博用户群划分研究与实现》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、劣妻砝二专业硕士学位论文基于兴趣识别的新浪微博用户群划分研究与实现ResearchandImplementTheRealizationofWeiboUserGroupBasedonTheRecognitionofInterest作者:彭显志导师:张红延北京交通大学2013年6月IIUUlIIIIIIIIIIIIIIIIIIIIII学位论文版权使用授权书Y2427795本学位论文作者完全了解北京交通大学有关保留、使用学位论文的规定。特授权北京交通大学可以将学位论文的全部或部分内容编入有关数据库进行检索,提供阅览服务,并采用影印、缩印或扫描等复制手段保存、汇编以供查阅和借阅。同意学校向国家有关

2、部门或机构送交论文的复印件和磁盘。(保密的学位论文在解密后适用本授权说明)学位论文作者签名:趋曼灸导师签名:]艺。{L&0签字日期别3年G月/1日签字眦M年否月,寥日中图分类号:TP311.5UDC:620学校代码:10004密级:公开北京交通大学专业硕士学位论文基于兴趣识别的新浪微博用户群划分研究与实现ResearchandImplementTheRealizationofWeiboUserGroupBasedonTheRecognitionofInterest作者姓:名:彭显志导师姓名:张红延工程领域:软件工程学号:11125870职称:副教授学位级别:硕士北京交通大学2013年6月致

3、谢本论文的工作是在我的导师张红延副教授的悉心指导下完成的,在交大的六年中一直受到张老师的教育,张老师不仅是良师,更是益友,教我如何做人以及做事,是我人生的导师。感谢这六年以来在北京交通大学求学的过程中,赵宏老师,陈旭东老师,冯凤娟老师,孔令波老师,马迪芳老师们的辛勤教育工作,引领我遨游知识海洋,培养我成长。感谢同学侯大伟对我学习和生活上的帮助。感谢师兄董晨曦,苏麒匀给予我学业上的指导。感谢我的女友在学业上给我鼓励和支持。另外也特别感谢父母,他们给了我生命,教育我成为一名顶天立地的男子汉,一直在生命中给予我鼓励,感谢他们的理解和支持使我能够在学校专心完成我的学、Ik。II中文摘要中又捅要微博

4、作为一种新型网络应用,提供了一种新的信息传播方式。在微博上,人们可以通过最多140个字来快速自由地表达自己的感受、见闻或者意见。微博自从出现以来经历了巨大的发展,目前风靡全球的twitter和国内流行的新浪微博都有着数以亿计的用户,每天产生巨大数量的新内容,在海量数据轰炸下,用户的需求已经由如何获取数据改为如何精准的获取想要的数据。而解决该问题的关键在于划分微博用户群。论:乏选题源自本人在实习工作中实际参与的项目,本人在项目的开发过程中主要参与到项目设计和项目的实现开发。在详细分析新浪微博的数据特点和用户习惯后,在设计整个系统的功能和技术架构的基础上,将在设计与实现部分以本人参与开发的模块

5、为核心进行介绍。本二之以划分微博用户群为需求点,在分析了不同的用户群划分方案后,选择以兴趣维度划分用户群的方案。为实现该方案,选取新浪微博平台为对象,在充分分析新浪微博的信息特点和用户行为特点的基础上,结合当前国内外在文本分类,兴趣识别的相关技术,提出结合朴素贝叶斯分类和概率统计加权理论思想的的兴趣识别:算法识别微博用户兴趣,并为之设计对应的兴趣识别系统。最后,以实验结果进:行标准的衡量,证明了工作具有一定的研究和工程应用价值。关键词:文本分类;中文分词;数据挖掘;兴趣识别分类号:TP311.5IIIABSTRACTMi∞_blogasanewnetworkapplication,andp

6、rovidesanewwayofspre础nginfonnation.Inthemicro.blog,peopleCanquicklyandfreelyexpresstheirfeelings,knowledgeoropinionbyupto140words。Sincetheemergenceofmlcro.bloghasexperienced乎eatdeVelopment,thecurrentpopularglobaltwitterandthepopularsmamicro-t1109hashundredsofmillionsofusers,hugequantityofproducene

7、wconten‘evervdav.InthemaSsivedatainthebackground,User’sneedsisfromhowtogetthedatacl!【aIlgedtohowaccurategetthedesireddata.Thesolutiontothisproblem1sdividedmicro-·blogusergroup.ThesistopicsfromIactuallyparticipate

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。