欢迎来到天天文库
浏览记录
ID:31356943
大小:106.00 KB
页数:6页
时间:2019-01-09
《大数据时代下统计学的挑战与发展》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、大数据时代下统计学的挑战与发展 摘要:随着科学技术的迅速发展,大数据时代来临,从科学角度看,大数据通过对信息的整合分析处理,形成快捷全新的数据分析方法,这为大数据与统计学架起互通的桥梁。大数据时代的变革为统计学发展起到了重要的推动作用,未来挑战与机遇同在。文章首先对大数据时代下的统计学做出概述,接着陈述统计学在大数据时代影响下的变革,再次分析大数据时代下统计学面临的挑战,最后解读大数据时代下统计学的发展与机遇,以期为相关领域的研究提供有价值的参考。 关键词:大数据时代;统计学;发展 一、大数据时代下统计学概念概述 教科书上对统计学给出了这样的定义“有效搜集整理分析随机性数据
2、,对考察问题给出推断与预测,最终为行动提供数据支持”,这就是统计学。从根本上看,统计学是一门与数据有关的学科。众所周知,美国总统奥巴马通过数据团队的帮助得到连任的机会,阿里巴巴的马云很早就把大数据作为企业发展战略。随着我们走进大数据时代,网络科技给搜集数据带来方便,传统的设备已经无法容纳大量的数据,我们对其进行更新,通过对大数据的分析,我们为社会传递出有效的、有价值的信息,这一切为社会的发展起到了不可替代的推动作用。6 统计是社会各界乃至各环节不可或缺的因素,在商品交换过程中,统计有先导作用,市场经济信息也需要统计学的帮助,大数据时代,我们的统计数据不再局限于随机抽样调查,电话调
3、查等高成本的搜集方式,通过互联网及移动终端,我们可以获得更多数据样本,可以说我们的社会进入高速发展的时期,大数据时代下的统计学也进入全新的发展阶段。 二、统计学在大数据时代影响下的变革 1.从样本的角度看,样本概念得到深化 我们知道统计学离不开样本,有效的样本能够正确反映情况,大数据时代样本概念与传统不再相同,通常我们得到诸多网络数据,一种为静态,即直接在客户端创建的数据,无需提取即可使用,成本低,另一种为动态数据,即数据随着时间的推移而变化,最终表现为所有数据的总和,可见此时的样本不局限于随机抽样,直接可以做选定分析。 2.从类型方面看,呈扩大之势 在过去数据通常指结构
4、化数据,有固定的标准,大数据时代数据不仅局限于固定的结构,还有异构数据,再有存储方式也发生了改变,大数据可以直接将探测的信号容纳进去,由网络系统作为工具,可以识别各类结构或非结构的数据并进行快速存储。 3.收集概念得到扩展 传统的统计过程中,我们有目的的进行数据收集,效率低,成本高,随着大数据时代来临,我们将收集步骤化,第一预先处理好数据的识别与处理,第二做好分析,提炼出所需要的信息,最后做好存储,就这么简单。面对大量的数据,我们的分析、识别等都需要注意,大数据不代表万能,我们还是要注意数据的安全性,尽量控制收集成本。 4.数据来源较传统不同6 曾经我们根据研究目的去做统计
5、收集数据,这些数据源都是已知的,在核对方面相对容易。大数据时代,我们得到数据变得容易,但通过互联网收集数据后,目的性变弱,大多数记录没有源头,很难识别记录身份,可见,大数据时代做好数据来源登记开始变得重要。 5.量化方式也发生变化 对于传统的结构化数据,量化方式是成熟的,可以将收集到数据直接分析得出结果,大数据时代,很多异化结构数据几乎无法做直接分析取得结论,当下,很多结算及专家在研究处理非机构化数据,力争将大数据时代统计推向新的高端。 6.分析思维发生改变 从分析过程看,传统分析需要进行三步走,即定性、定量,最终定性。大数据时代,统计分析过程仅需要两步即定量、定性;从证实
6、分析方面看,传统思路为假设、验证,事实证明传统证实分析有很大误差,而大数据时代,我们的思维为发现,总结,这是整合,发现最终定论的过程,在此过程中会有很多发现。 7.统计软件变得越来越多 传统统计学中,我们比较熟悉的软件有SPSS、SAS、STATA等,大数据时代,我们分析技术为非关系型,主要以数据中心为基础,将软件与大数据结合,分析过程得到很大简化。综上,大数据时代给了我们更多的主动权,这些更促使我们推动大数据时代统计的发展进步。 三、大数据时代下统计学面临的挑战6 大数据时代给我们带来了更多的好处,统计学的大数据化是大势所趋,但传统与更新的交错间还有一些不相容的方面,对于
7、革新我们还是要从各个方面做谨慎考虑与慎重调整。 首先从样本标准的角度看,大数据时代我们可以轻松得到很多样本,此量大到可以视为总体,随着互联网科技的不断发展,大样本标准也应随着发展,传统统计学将界限定在30,大于30为大样本,小于30为小样本,大数据时代这个界限略显低,没办法清除干净干扰信息,这会影响分析结果,因此,加强数据来源的同时还要更新大样本标准,将更大规模的样本数量代替旧有的数量,以适应大数据时代的要求。 其次从样本选取与形式的角度看,传统统计学固定结构化数
此文档下载收益归作者所有