欢迎来到天天文库
浏览记录
ID:31488827
大小:107.50 KB
页数:7页
时间:2019-01-12
《对大数据时代大学统计教学的认识与思考》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、对大数据时代大学统计教学的认识与思考 [摘要]简单介绍了大数据时代的到来,大数据的产生及特征,在此基础上提出了大学统计学教学的几个方面的思考。 [关键词]大数据大学统计教学大统计 [中图分类号]O21[文献标识码]A[文章编号]2095-3437(2015)11-0183-02 一、引言 2009年8月5日的《纽约时报》刊登题为“当今大学毕业生唯一关键词:统计学”文章。[1]文中介绍,哈佛大学人类学家格赖姆斯改行就职Google,从事海量数据的分析工作,整天就是和数学、计算机打交道,用数据分析方法改善Google搜索引擎。文
2、中援引Google首席经济师范里安的话说:“我坚持认为今后10年最性感的工作是当统计师,我可没开玩笑!”麻省理工学院经济学家布林约夫森说:“我们进入了一个一切都可以被监测器和科学仪器数字化和记录的时代(大量数据在不断产生),但最大的问题是我们有没有能力利用、分析这些数据,让其为我们服务。”7数据中有大量的珍宝。IBM组织了200名数学家、统计学家和其他数据分析大师为商业分析和优化服务,在数据中探宝,他们计划将探宝队伍扩充到4000人。网络数据的样本量打开了一个新世界,康奈尔大学克莱因伯格说,社会统计中,相比传统采访和问卷调查等形式的抽
3、样,数百万计的网民的网络互动产生的样本量是令人惊奇的。专家警告,统计学面临着严重的危机,单就网络数据的体量就足以使得传统统计模型丧失能力,而且,数据的强相关性未必就有因-果关系。 数据在爆炸,我们在惊梦中进入了大数据(BigData)时代,大数据正在引起一场革命,它将改变我们的生活、工作和思维[2],统计学是关于数据的科学,它迎来了一场变革,是机遇也是挑战。[3][4] 二、大数据的产生及其特征 数据化是大数据时代到来的标志。社会网络、电子商务、移动通信、深空探测、卫星遥感、基因测序以及其他科学测量仪器时时刻刻都在自动测量和记录
4、着数据,而且这一趋势在不断增强。2007年所有数据中只有7%是存储在报纸、书籍、图片等介质上,其余全部都是数字数据。Google每天要处理超过24PB2的数据,它是美国国家图书馆所有纸质出版物所含数据量的上千倍。科尔尼公司科学家统计结果显示,仅2012年就产生了2.5ZB的数据,并且数据产生量以每年40%的速度递增,2011、2012两年产生了全球90%的数据,到2020年将达到45ZB,这是天文数字。7 我们用中国移动公司为例大致描述一下大数据的产生。2015年中国移动已经达到12.93亿个用户,用户数近似12G,给用户提供通话、
5、短信、上网等服务。若网络流量包月30MB,每天1MB,平均每天网络数据流量达到12PB,若每天还记录用户信息(姓名、身份、职业、位置等),通话(时刻、时长、内容),短信(内容)等,保守估计所产生的数据可以达到300PB,一年将超过100EB=0.1ZB。再看这些数据的形式,它们有文字、表格、符号、图片、语音、数字、影像、上网轨迹等等,如果还考虑这些数据时时刻刻都在改变,每个用户有自己的偏好,可以想象这些数据的体量、变化性、复杂性,如果移动公司利用这些数据进行市场分析和行业规划,这些数据还具有巨大价值。图1描述了大数据的产生及其演化过程
6、。[5] 人们从不同的方面对大数据进行了描述和定义。从特征来看,大数据具有“4V”:Volume(大量)、Velocity(高速)、Variety(多样)、Value(价值)。[6]Volume:由于当今数据的体量大,其处理和管理只能依靠专门的技术,驾驭这些先进技术是开启大数据宝藏的钥匙;Velocity:快速处理大数据并获取有用信息;Variety:要开发利用的大数据的数据类型庞杂、数据源众多;Value:大数据中隐含着商机,隐含着企业、行业乃至国家战略决策的依据,它是煤、石油、金属矿产、水等之外的一种新型资源。 图1大数据的演
7、化图(据科尼尔分析修改[5]) 从统计的角度,李金昌认为大数据不是基于人工设计、借助传统方法而获得的有限、固定、不连续、不可扩充的结构型数据,而是基于现代信息技术与工具可以自动记录、储存和连续扩充的、大大超出传统统计记录与储存能力的一切类型的数据。[6] 从技术的角度,维基百科的定义是,大数据是指无法在可承受的时间范围内用常规软件工具进行捕捉、管理、处理的数据集合。从产业角度,常常把这些数据与采集它们的工具、平台、分析系统一起被称为“大数据”。 三、大数据时代的大学统计教学7 大数据时代是以数据为中心的时代,是数据驱动的时代。
8、作为关于数据的科学,统计学面临着重大的机遇和挑战,大学统计学教学面临着重大变革。20世纪中叶计算机技术的进步为统计应用的腾飞插上了有力的翅膀,使其应用范围遍及自然科学、社会科学的各个领域,无所不在,使得统计学趋向成熟。如
此文档下载收益归作者所有