大数据时代统计学重构研究中的几个热点问题

大数据时代统计学重构研究中的几个热点问题

ID:32806186

大小:55.55 KB

页数:4页

时间:2019-02-15

大数据时代统计学重构研究中的几个热点问题_第1页
大数据时代统计学重构研究中的几个热点问题_第2页
大数据时代统计学重构研究中的几个热点问题_第3页
大数据时代统计学重构研究中的几个热点问题_第4页
资源描述:

《大数据时代统计学重构研究中的几个热点问题》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库

1、大数据时代统计学重构研究中的几个热点问题裘敬忠陕西国防工业职业技术学院710302摘要:科学技术的迅猛发展为人们的牛活带来了便利,大数据时代的到来,必然带来未来社会经济和科学技术产牛巨大影响。深入了解大数据概念是循序渐进的过程,对其研究应结合我国发展,以造福于人们的决策与社会经济为宗旨,发展时代赋予的新型产业。目前,国内外对此的研究资料有限,因此木文通过对大数据时代统计学重构研究中的热点问题研究,希望能为后续研究提供参考借鉴。关键词:大数据时代;统计学重构;热点前言:随着科技的高速发展,人们不得不承认大数据时代的到来,科技正在不断影响并入侵着人们牛活的各

2、个角度。而大数据具有常用软件工具无法比拟的收集信息、组织、管理和快速处理数据的能力。在高速发展的社会经济影响下,人们对数据信息的统筹分析能力要求显著提升,人们的决策效率很大程度上决定于现代科技对信息的整合分析。一、大数据统计学理论和方法传统统计重点研究在于概率分布的指数族方面,比如:从20世纪70年代开始关于指数分不足的研究理论和方法,运用于像图模型与高位贝叶斯/频率计算之中。这种研究包括对图标指数族、协变量信息效应与使用频率Bootstrap计算贝叶斯推断分布。众所周知,指数族中包含大部分一致的概率分布,所以指数族的结果应用范围极广。这些指数族处于理论

3、统计与应用的核心位置,在概率论方面的重要程度不断提升。对非指数族分布族的研究也可更加深入。这种研究目标利用指数族结构将庞大数据集进行简化分析的过程,通过Bootstrap对大数据在概率与统计等角度进行贝叶斯应用[1]。二、大数据吝啬建模对大数据开发中涉及的数理计算方法的探究,帮助理解数据、减少数据中的冗余信息。大数据吋代对人们生活的不断融入与吋代发展,人们将快速线上算法开发出来。这种研究为多样化的大数据中的数据信息简化运用及相关技术的开发产生着深远影响。对于大数据的数理分析,学习优化其中的重点内容,通过网络实现的在线学习依靠任务优化器的做法,以计算效率高

4、的算法开发促进优化器的理想表现。这种研究指向于稀疏建模向新领域与算法,让此类技术能运用于大数据,并结合公式与理论实现大量实际应用进行辅助。三、巨型分布系统的大数据建模分析目前,千万兆平台能运行大规模模拟,未来可能形成亿亿兆速度生成大量数据。当大量数据分布于内存系统大量节点上时,比较数据将会变得尤为困难,新方法大数据进行分析就显得尤为必要,这种研究是在目前千万亿兆与未来亿亿兆系统上,对大型科学数据以分布方式进行建模,其中包括对编码属性设计的新算法,以空间降维技术通过并行将编码树形嵌入分布式数据,以分布式模式的使用,对这些树形进行聚类与分类新算法的设计,探究

5、差异性数据集算法和新型存储技术表现与算法准确性的调试[2]。四、大数据统计分析中并行迭代蒙特卡罗法的并行高速发展的科学技术与网络技术在生活中的广泛运用使大数据信息的收集工作成为可能。对这些数据的整合,需借助于并行与分布结构体系。尽管这种结构体系在存储与处理大数据上有一定优势,但从推测角度的运用模式来看,却没有适当的运行模式。加之社会上数据量的不断增长,使数据结构模型的解释需求更加显著。迭代蒙特卡罗算法虽被证明适用于分析复杂结构的数据,但对大数据分析却并不可行,因为这需要对数据进行大量迭代,而每次迭代都需要对整个数据集进行扫描。应从并列的子样本中计算出的蒙

6、特卡洛平均值来近似最初要从完整数据集中计算的量。这样能真正避免对数据集进行重复扫描,简化算法迭代过程,也能产生对问题具有统计意义的解[3]。五、统计模拟与推断大数据中的巨大矩阵科技的不断发展将低成本收集数据与大数据的存储成为可能,也为科学研究提供了大范围数据。人们获取观测值的能力超过提取有用信息的能力,对模拟与推断大数据中的巨大矩阵提供了动力。对研发协方差矩阵、密度矩阵、波动率矩阵等相关方面的统计理论与方法的探讨,能助力于对大数据影响科学研究与知识产生的重要作用,推动对大矩阵的统计理解,带动不同科学领域的数字化发展。六、张量数据挖掘理论与算法张量是数学上

7、矩阵的多为推广,可有非数值元素。在很多重要应用中,几段大和稀疏耦合张量的岀现,对其分析需要新的算法与软件来识别差异化张量模式之间的几大数据集与核心关系。对这个问题的研究能发展耦合稀疏与低秩张量印子分解的理论算法,开发相关软件包实现这种分析。七、大数据的功能传送预测工具没有先验信息的实践序列数据数据源建模方法适用于地球空间现象和自然、社会现象。从地球空间上来看,动态模型能产生数据启用的预测工具。量化系统的扰动性是对大数据功能传送预测工具研究的有一方面,通过新波动分析技术的运用,产生改进波动指数。应建模、预报、预测、进行动态行为的表征描述。八、大数据的应用大

8、数据的应用能探讨行政记录、社交网络、商业记录产生的差异化大数据在统计中的应用可能

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。