基于新浪微博开放平台的用户数据挖掘技术的研究

基于新浪微博开放平台的用户数据挖掘技术的研究

ID:33413346

大小:11.79 MB

页数:67页

时间:2019-02-25

基于新浪微博开放平台的用户数据挖掘技术的研究_第1页
基于新浪微博开放平台的用户数据挖掘技术的研究_第2页
基于新浪微博开放平台的用户数据挖掘技术的研究_第3页
基于新浪微博开放平台的用户数据挖掘技术的研究_第4页
基于新浪微博开放平台的用户数据挖掘技术的研究_第5页
资源描述:

《基于新浪微博开放平台的用户数据挖掘技术的研究》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、厦门大学学位论文著作权使用声明本人同意厦门大学根据《中华人民共和国学位条例暂行实施办法》等规定保留和使用此学位论文,并向主管部门或其指定机构送交学位论文(包括纸质版和电子版),允许学位论文进入厦门大学图书馆及其数据库被查阅、借阅。本人同意厦门大学将学位论文加入全国博士、硕士学位论文共建单位数据库进行检索,将学位论文的标题和摘要汇编出版,采用影印、缩印或者其它方式合理复制学位论文。本学位论文属于:()1.经厦门大学保密委员会审查核定的保密学位论文,于年月日解密,解密后适用上述授权。/(\/)2.不保密,适用上述授权。(请在以上相应括号

2、内打“√”或填上相应内容。保密学位论文应是已经厦门大学保密委员会审定过的学位论文,未经厦门大学保密委员会审定的学位论文均为公开学位论文。此声明栏不填写的,默认为公开学位论文,均适用上述授权。)声明人(签孙认应。侈年孓月占日摘要近些年,随着Facebook、Twitter和Google+这类社交网站的蓬勃兴起,社交网络应用已经成为了人们通过互联网使用最为频繁的网络应用之一,各种社交网络应用作为人们之间交流和信息共享的平台,在人们日常生活中扮演着越来越重要的角色。每天都有数以亿计的社交网络信息发布并被存储,然而对于社交网络相关的数据资源

3、,绝大部分仍然得不到有效的利用。本文以社交网络应用的用户数据为研究对象,通过引入数据挖掘技术的相关概念,以寻求一种社交网络用户数据的处理模式,即从社交网络用户数据的采集,到数据的存储和清洗,再到数据挖掘分析,从中得到有价值的信息资源,从而为其它领域的活动提供决策支持或预测分析。文章以新浪微博为实例,通过对微博用户信息获取技术的研究,提出并实现了一种通过新浪微博开放平台提供的API接口,高效获取用户数据的方法,同时利用传统的网络爬虫技术及HTML页面解析实现了少数一些无法利用API接口获取的微博用户信息的抓取,本文实验示例程序采用.N

4、ET平台下的C≠}语言编写,为了便于数据清洗,程序采用了SQLServer2008R2作为数据存储,利用存储过程实现数据的高效写入,有效实现了新浪微博用户数据的全面高效获取。在获取到的样本数据的基础上,根据数据挖掘的需求和方向,选择合适的数据挖掘模式,利用MicrosoftSQLServerAnalysisServices数据挖掘组件及开源的OrangeCanvas可视化数据挖掘工具对采集到的微博用户数据进行分析处理。通过对样本数据的分析找到其中有价值的关联规则及其它有价值的信息。关键词:社交网络:数据挖掘;微博APIAbstrac

5、tWiththeboomingdevelopmentofsocialnetworkingsiteslikeFacebook,TwitterandGoogle+.socialnetworkingapplicationhasbecomeoneofnetworkapplicationsthatpeopleusemostfrequentlybyinternetinrecentyears.Asplatformswherepeoplecommunicatewithoneanotherandshareinformation,varioussoci

6、alnetworkingapplicationsplayanincreasinglyimportantr01einpeople’sdailylife.Everyday,billionsofpiecesofsocialnetworkinginformationarepublishedandsaved·Howeveqmostofdateresourcesrelatedtosocialnetworkinghavenotbeenutilizedeffectively.Targetinguserdataaboutsocialnetworkin

7、gapplications,thisthesisaimsatfindingaprocessingmodefortheuserdataaboutsocialnetworkingapplicationsbyintroducingconceptsaboutdatamining.Inotherwords,itobtainsvaluableinformationresourcesbycollectionoftheuserdataaboutsocialnetworkingapplications,datastorageandcleaningas

8、wellasanalysesofdatamininginordertOprovidedecisionsupportorpredictiveanalysesforactivitiesinotherfields.BytakingSinaM

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。