基于两种改进的聚类算法对新浪微博用户的信息的分析

基于两种改进的聚类算法对新浪微博用户的信息的分析

ID:34136954

大小:7.48 MB

页数:57页

时间:2019-03-03

基于两种改进的聚类算法对新浪微博用户的信息的分析_第1页
基于两种改进的聚类算法对新浪微博用户的信息的分析_第2页
基于两种改进的聚类算法对新浪微博用户的信息的分析_第3页
基于两种改进的聚类算法对新浪微博用户的信息的分析_第4页
基于两种改进的聚类算法对新浪微博用户的信息的分析_第5页
资源描述:

《基于两种改进的聚类算法对新浪微博用户的信息的分析》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、首都经济贸易大学硕十学位论文基于两种改进n勺聚类算法对新浪微博用户信息的研究4.3.2TwoSep算法的理论介绍⋯⋯⋯⋯⋯⋯⋯...⋯⋯⋯⋯374.3.3TwoStep算法的应用过程⋯⋯⋯.⋯⋯⋯⋯⋯.....⋯..404.3.4Two—Sep算法的聚类结果分析⋯......⋯⋯⋯.⋯.........434.4本章小结⋯⋯⋯.⋯⋯⋯⋯⋯.......⋯⋯⋯.......⋯⋯.475聚类结果的评估⋯⋯⋯...⋯⋯⋯⋯....⋯⋯⋯⋯⋯⋯⋯⋯.485.1聚类评价方法....⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.......⋯⋯485.2非监督的聚类评价方法⋯⋯⋯⋯......⋯⋯..⋯..

2、.....⋯⋯485.2.1Dunn指数(TheDunnindex)...⋯⋯⋯⋯⋯⋯.⋯.⋯.485.2.2轮廓指数(TheSilhouetteindex)⋯⋯⋯⋯...⋯⋯⋯.495.2.3Davies—Bouldin指数(TheDavies—Bouldinindex)⋯⋯⋯.505.3对聚类评价方法的应用(具体计算过程,程序包说明)⋯⋯⋯⋯..505.4对聚类评价结果的分析⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.......⋯..515.5本章小结⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯....:⋯⋯.516总结与展望⋯⋯⋯..⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯...⋯.536.1总结⋯⋯⋯⋯⋯⋯⋯⋯⋯.

3、⋯⋯⋯⋯⋯⋯⋯⋯.⋯..536.2展望⋯⋯⋯⋯⋯..⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯...⋯..53参考文献.⋯..⋯...⋯⋯⋯.⋯⋯⋯.⋯...⋯⋯⋯⋯⋯⋯⋯⋯54附录⋯......⋯⋯.⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.⋯⋯⋯.56致谢⋯⋯...⋯⋯⋯..⋯.⋯⋯⋯⋯⋯..⋯⋯⋯⋯⋯⋯⋯⋯.59V甬‘都经济贸易大学硕十学位论文基于两种改进的聚类算法对新浪微博用户信息的研究1引言1.1研究背景和意义1.1.1研究背景微博,即微博客(Micro—Blog),是一种可以允许用户随时以简短文本的形式公开发布信息的微型博客形式。其可以允许任何人阅读或者由用户选择的特定群组阅读。随着不断地发展,

4、这些信息可以通过多种方式传播,主要包括短信、实时信息软件、电子邮件或网页等。除了简短文本以外,诸如图片或影音剪辑等形式的媒体信息也可以在一些微博上发布。与传统的博客不同,微博的文件容量通常较小,但用户往往出于各自的原因还是会在相同的事务上运用它。微博还是一种广播式社交网络平台,基于关注机制来分享简短的实时信息。就此而言微博有五方面特点:①关注机制;②简短的内容;③实时信息;④广播式;⑤社交网络平台。在2006年3月,博客技术先驱blogger的创始人埃文·威廉姆斯(Evanwilliams)首先提出了微博的理念。不久之后JackDorsey创办了Twitter。Twitte

5、r是一个微博客及社交网络服务。用户能够通过SMS、即时通讯、电邮、Twitter网站或Twitter客户端软件输入最多140字的文字更新。短短几年间Twitter的注册用户数就超过了1亿,成为了一个世界知名的社交网站,在某种程度上甚至改变了人们的生活方式。同样,国内的新浪微博[1],自2009年8月推出以来,用户数量呈现几何级数增长,截至2012年12月底,新浪微博注册用户已超5亿,日活跃用户数达到4620万,用户每日发博量超过1亿条。如今,新浪微博作为著名的微博平台,己经吸引了大量的公司企业、组织机构和名人明星,他们都希望通过微博平台来推销自己。毫无疑问,具备信息量大、种

6、类丰富、传播速度快等特点的微博已经发展成为了当今世界最主要的信息发布及交流平台。1.1.2研究意义随着微博的不断发展,其影响力日益扩大,其所拥有的用户数量更是己成天文数字。每一秒钟都会有无数的信息在这个平台上产生和传播。上亿名用户在这里浏览信息或表达意见。一方面作为个人的信息平台,微博已经成为人们获取信息的主要渠道之一,人们,尤其是年轻人开始越过传统媒体或新媒体的其他方式,依赖微博来获取信息,因此也深受微博中的报道和观点的影响。另一方面,微博也是每个人直击信息,进行报道和第1页,共60页甬‘都经济贸易大学硕十学位论文基于两种改进的聚类算法对新浪微博用户信息的研究参与社会活动

7、的重要渠道。它在具有媒体功能的同时,还兼有社交网络的功能。与其说微博是一个网络平台,不如说更像是一个庞大的社会网络生态系统。这里每一个用户都拥有不同的目的,有着不同的行为方式,并呈现出了不同的特征。在微博如此重要的今天,如何更好地使用微博,使其为自己服务,这将是每一个个人,每一家公司以及每一个机构所要面对的问题。无论是为了提高个人的微博影响力,还是为了高效地进行企业的营销广告,或是为了更好地进行舆论观测,首先最重要的事情就是对于微博用户进行识别分类。就大多数的人所认为,微博平台上主要存在着四种用户群体:①名人用户群

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。