大数据的来源与数据采集方法

大数据的来源与数据采集方法

ID:1370976

大小:2.74 MB

页数:10页

时间:2017-11-11

大数据的来源与数据采集方法_第1页
大数据的来源与数据采集方法_第2页
大数据的来源与数据采集方法_第3页
大数据的来源与数据采集方法_第4页
大数据的来源与数据采集方法_第5页
资源描述:

《大数据的来源与数据采集方法》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、大数据的来源社交媒体如微博、微信、人人网、facebook等,通过这些大众常用的社交平台,可以分析用户平时在这些社交媒体上的行为动向,归纳出用户的喜好或关注点,这些能够为企业挖掘用户需求提供重要依据。越来越多的机器配备了连续测量和报告运行情况的装置。这些机器传感数据也属于大数据的范围。一些视频、音频设备等产生的数据如一些大型超市,通过监控器观察消费者在超市购物的整个流程,从而对商品进行合理摆放,促进对某些商品的间接促销。企业内部本身的一些行业数据等等。大数据的数据采集方法系统日志采集方法很多互联网企业都有自己的海量数据采集工具,多用于系统

2、日志采集,如Hadoop的Chukwa,Cloudera的Flume,Facebook的Scribe等,这些工具均采用分布式架构,能满足每秒数百MB的日志数据采集和传输需求。网络数据采集方法:对非结构化数据的采集网络数据采集是指通过网络爬虫或网站公开API等方式从网站上获取数据信息。该方法可以将非结构化数据从网页中抽取出来,将其存储为统一的本地数据文件,并以结构化的方式存储。它支持图片、音频、视频等文件或附件的采集,附件与正文可以自动关联。除了网络中包含的内容之外,对于网络流量的采集可以使用DPI或DFI等带宽管理技术进行处理。其他数据采

3、集方法对于企业生产经营数据或学科研究数据等保密性要求较高的数据,可以通过与企业或研究机构合作,使用特定系统接口等相关方式采集数据。谢谢观赏thankyou9.15

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。