欢迎来到天天文库
浏览记录
ID:12456719
大小:26.00 KB
页数:5页
时间:2018-07-17
《关于数据挖掘技术在经济统计中的应用》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库。
1、关于数据挖掘技术在经济统计中的应用 一、经济统计中数据挖掘技术应用的可行性 随着社会的发展,数据挖掘技术的研究与应用得到很大发展,已被广泛的应用,其具有很多优点,能够更好的提供服务于经济统计,因此进一步加强对其的研究非常有必要 数据挖掘技术的发展是从二十世纪九十年代到现在,虽然时间不长,但是发展速度迅猛,因此也是越来越受到人们的重视。就目前的情况来看,国外对于其关注度非常高,致力于数据挖掘技术的开发和应用,例如IBM、微软等等。而其在我国也是得到很大的关注,我国对于该技术主要是体现在已经为其相继的建立了相应的工作实验室。 数据挖掘工具日益丰富,能够满足经济统计
2、的各种需要 为了更好的符合市场发展需求,数据挖掘的工具也是不断更新,呈现出不同的形式,就目前的情况,数据挖掘工具的市场主要由3个部分,包括通用型工具、综合工具和面向特定应用。 1.通用型工具。在我们的现有市场中比较广泛的应用是通用型工具,其实用性非常广,就目前市场的这种类型工作主要包括:SGIMineset、SAS关于数据挖掘技术在经济统计中的应用 一、经济统计中数据挖掘技术应用的可行性 随着社会的发展,数据挖掘技术的研究与应用得到很大发展,已被广泛的应用,其具有很多优点,能够更好的提供服务于经济统计,因此进一步加强对其的研究非常有必要 数据挖掘技术的发展是
3、从二十世纪九十年代到现在,虽然时间不长,但是发展速度迅猛,因此也是越来越受到人们的重视。就目前的情况来看,国外对于其关注度非常高,致力于数据挖掘技术的开发和应用,例如IBM、微软等等。而其在我国也是得到很大的关注,我国对于该技术主要是体现在已经为其相继的建立了相应的工作实验室。 数据挖掘工具日益丰富,能够满足经济统计的各种需要 为了更好的符合市场发展需求,数据挖掘的工具也是不断更新,呈现出不同的形式,就目前的情况,数据挖掘工具的市场主要由3个部分,包括通用型工具、综合工具和面向特定应用。 1.通用型工具。在我们的现有市场中比较广泛的应用是通用型工具,其实用性非常
4、广,就目前市场的这种类型工作主要包括:SGIMineset、SASEnterprise、SPSSClementine等软件。 2.综合工具。综合工具的主要特点是能够满足商业活动的相关要求,其主要的目的是能够及时地提供相关数据情况以及管理报告等,就目前的情况来看,这种类型的工作市场中主要有CognosScenario、BusinessObjects等。 宏观经济数据库的建立,为数据挖掘技术的应用创造了良好的条件 就目前的情况来看,我国的很多部门经济统计中都使用了数据挖掘技术,其主要工作内容是采集、处理。但是其还是存在着一些不足,主要是还没有完全的形成一个整体,从而
5、进行数据的管理时候会有很多问题,因此,经济统计工作是联盟需要开发新的技术。而宏观经济统计数据库刚好能解决好这一问题,其能够准确的确保经济统计信息,然后在对其进行整理,从而不断的扩充数据资源。 二、数据挖掘技术在经济统计中的应用 在社会经济管理活动中,管理主体对经济统计数据的要求主要有两个:一个是统计数据的真实性;一个是数据统计信息的实用性。单就这两个经济统计数据要求而言,数据挖掘技术能够很好地满足经济统计工作的需求,是适用性极强的一种经济数据统计技术,其在具体的经济数据统计活动中主要有以下四种应用方法。 预处理方法 在经济数据统计活动中,最为基础的一种处理方式
6、就是经济数据的预处理方法。因为数据挖掘本身是一种基于提供基础信息的智能分析技术,其本身是受基础经济信息限制的,不可能无中生有代替经济数据收集系统的功能,所以所有作为数据挖掘系统数据基础的经济统计数据信息都应该进行预处理。处理的内容主要包括:数据中不正确、不真实、不准确,以及不同经济统计数据信息之间差距较大等现象。 对这些基础数据存在的问题进行处理的过程被称为数据清理,当前数据清理主要采用的方法有均值法、平滑法和预测法。其中均值法是现代分析技术中模糊理念的一种应用形式,当基础数据中的一个数据点是空值或者噪声数据的时候,可以采用均值法进行处理,即用数据库中所有该属性已知
7、的属性均值来填补空缺,保证数据挖掘系统对基础数据的分析和整理能够正常进行,得出相对而言准确度较高的统计分析数据。 决策树方法 就目前的情况来看,在数据挖掘技术应用过程中使用比较多的方法是决策树,因为其能够快速、直接的反映情况。对于该方法最主要的是要构建好决策树,通常情况下回分为2部:1)利用训练集建立并精简一棵决策树,同时建立一个模型,能够进行输出分析。2)将构建完的决策树充分利用,做好数据分类工作,这一分类是一个递归的过程,从决策树的根部开始进入到树干、枝丫,直到输入数据的分类满足了某种条件而停止。在具体的应用中停止分割的条件有两个:一个是当一
此文档下载收益归作者所有