关于数据挖掘技术在经济统计中的应用

关于数据挖掘技术在经济统计中的应用

ID:25061346

大小:51.00 KB

页数:5页

时间:2018-11-16

关于数据挖掘技术在经济统计中的应用_第1页
关于数据挖掘技术在经济统计中的应用_第2页
关于数据挖掘技术在经济统计中的应用_第3页
关于数据挖掘技术在经济统计中的应用_第4页
关于数据挖掘技术在经济统计中的应用_第5页
资源描述:

《关于数据挖掘技术在经济统计中的应用》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、关于数据挖掘技术在经济统计中的应用关于数据挖掘技术在经济统计中的应用一、经济统计中数据挖掘技术应用的可行性(一)随着社会的发展,数据挖掘技术的研究与应用得到很大发展,已被广泛的应用,其具有很多优点,能够更好的提供服务于经济统计,因此进一步加强对其的研究非常有必要数据挖掘技术的发展是从二十世纪九十年代到现在,虽然时间不长,但是发展速度迅猛,因此也是越来越受到人们的重视。就目前的情况来看,国外对于其关注度非常高,致力于数据挖掘技术的开发和应用,例如IBM、微软等等。而其在我国也是得到很大的关注,我国对

2、于该技术主要是体现在已经为其相继的建立了相应的工作实验室。(二)数据挖掘工具日益丰富,能够满足经济统计的各种需要为了更好的符合市场发展需求,数据挖掘的工具也是不断更新,呈现出不同的形式,就目前的情况,数据挖掘工具的市场主要由3个部分,包括通用型工具、综合工具和面向特定应用。1.通用型工具。在我们的现有市场中比较广泛的应用是通用型工具,其实用性非常广,就目前市场的这种类型工作主要包括:SGIMineset、SASEnterprise、SPSSClementine等软件。2.综合工具。综合工具的主要特

3、点是能够满足商业活动的相关要求,其主要的目的是能够及时地提供相关数据情况以及管理报告等,就目前的情况来看,这种类型的工作市场中主要有CognosScenario、BusinessObjects等。(三)宏观经济数据库的建立,为数据挖掘技术的应用创造了良好的条件就目前的情况来看,我国的很多部门经济统计中都使用了数据挖掘技术,其主要工作内容是采集、处理。但是其还是存在着一些不足,主要是还没有完全的形成一个整体,从而进行数据的管理时候会有很多问题,因此,经济统计工作是本文由.L.收集整理需要开发新的技术

4、。而宏观经济统计数据库刚好能解决好这一问题,其能够准确的确保经济统计信息,然后在对其进行整理,从而不断的扩充数据资源。二、数据挖掘技术在经济统计中的应用在社会经济管理活动中,管理主体对经济统计数据的要求主要有两个:一个是统计数据的真实性;一个是数据统计信息的实用性。单就这两个经济统计数据要求而言,数据挖掘技术能够很好地满足经济统计工作的需求,是适用性极强的一种经济数据统计技术,其在具体的经济数据统计活动中主要有以下四种应用方法。(一)预处理方法在经济数据统计活动中,最为基础的一种处理方式就是经济数

5、据的预处理方法。因为数据挖掘本身是一种基于提供基础信息的智能分析技术,其本身是受基础经济信息限制的,不可能无中生有代替经济数据收集系统的功能,所以所有作为数据挖掘系统数据基础的经济统计数据信息都应该进行预处理。处理的内容主要包括:数据中不正确、不真实、不准确,以及不同经济统计数据信息之间差距较大等现象。对这些基础数据存在的问题进行处理的过程被称为数据清理,当前数据清理主要采用的方法有均值法、平滑法和预测法。其中均值法是现代分析技术中模糊理念的一种应用形式,当基础数据中的一个数据点是空值或者噪声数据

6、的时候,可以采用均值法进行处理,即用数据库中所有该属性已知的属性均值来填补空缺,保证数据挖掘系统对基础数据的分析和整理能够正常进行,得出相对而言准确度较高的统计分析数据。(二)决策树方法就目前的情况来看,在数据挖掘技术应用过程中使用比较多的方法是决策树,因为其能够快速、直接的反映情况。对于该方法最主要的是要构建好决策树,通常情况下回分为2部:1)利用训练集建立并精简一棵决策树,同时建立一个模型,能够进行输出分析。2)将构建完的决策树充分利用,做好数据分类工作,这一分类是一个递归的过程,从决策树的根

7、部开始进入到树干、枝丫,直到输入数据的分类满足了某种条件而停止。在具体的应用中停止分割的条件有两个:一个是当一个节点上的所有数据都属于同一个类别的时候;另一个是没有分类属性可以对输入数据进行再分割。在决策树构建完成后,还要根据使用者的具体要求对决策树进行剪枝,剪枝的主要目的是要降低因为使用训练集而对决策树本身数据输出产生的起伏影响。三、数据挖掘技术在某省经济统计中的具体应用举例本文主要是将序列模式和决策树进行结合的方法进行经济统计中的数据挖掘技术的分析,将其进行分类,从而能够确定出调查的对象。通过

8、某地区企业历年上报的数据建立各个企业的序列模式,通过这个方法能够计算出一个企业的预测值,然后进行分析得到差别率,主要的对象是预测值和上报的数据,最后是将这个差别率进行第一次的分类。根据分类可以将其分为3种,A、B、C类,其分类的依据是差别率所占比率,顺序为大于等于百分之二十,百分之二十和百分之十之间以及百分之十以下。然后是进行建立决策树,其主要是从2个方面进行,即企业的规模变化率和企业是否发生了重大经营事件。如果企业的规模变化率非常大,就需要对其进行调查,如果变化率小,还需要进一步

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。