资源描述:
《数据预处理技术在劳动保障信息系统中的应用.doc》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库。
1、数据预处理技术在劳动保障信息系统中的应用
数据预处理技术在劳动保障信息系统中的应用
关键词:数据预处理;数据挖掘;劳动保障信息系统
摘要:数据挖掘是一种知识发现技术,近年来得到了快速的发展。数据预处理是数据挖掘过程中的一个重要步骤,尤其是在对包含有噪声、空缺,甚至是不一致数据进行数据挖掘时,更需要进行数据的预处理,以提高数据挖掘对象的质量,并最终达到提高数据挖掘所获模式知识质量的目的。本文讨论了在劳动保障数据挖掘工作中,如何应用数据预处理技术。
ApplicationofDataPreprocessingTechnologyinLabour&a
2、mp;SecurityInformationSystem
ZhangJingchun
(NanjingHumanResources&LabourSecurityBureau,Nanjing210002,China)
Abstract:Thedataminingisakindoftechniqueofknowledge,andhasgotfastdevelopmentinrecentyears.Thedatapreprogressingisbecomingmoreusefuldaybyday.Whethertousethetechniqueofdatapre
3、progressinginrealsubjectsofdataminingwillreceivethedifferentout-come.Andtheregiveamethodindataminingoflabour&securityinformationsystemhowtousethetechniqueofdatapreprogressing.
Keywords:Datapreprogressing;Datamining;Labour&Securityinformationsystem
近年来,劳动保障系统的信息化建设正由事务处理层面走向集成
4、和数据管理阶段。各应用系统产生和收集数据的能力已经迅速提高,拥有越来越多的数据,可以高效地实现数据的录入、查询、统计等功能,但缺乏从海量数据挖掘出知识的手段,无法全面正确分析和理解数据,无法根据现有的数据预测未来的发展趋势,对管理和决策缺乏有效支持。
面对这一挑战,我们引入数据挖掘技术,逐步构建宏观决策支持系统。
数据挖掘是指从大量数据中挖掘出隐含的、先前未知的、对决策有潜在价值的知识和规则的高级处理过程。在劳动保障信息系统,多年的应用产生了海量的数据,这给数据挖掘准备好了物质基础,但是目前还没有针对这些海量数据成功地进行数据挖掘的应用项目。如何规划数据挖掘项目工程,如何选
5、择数据挖掘算法、数据挖掘工具和产品,这些都是具有重要的理论研究价值。
一、数据挖掘(DataMining)
数据挖掘技术作为基于数据库技术、人工智能、机器学习、神经网络、统计学、模式识别、知识库系统、知识获取、信息提取、高性能计算和数据可视化等学科领域而发展起来的从数据中获取知识的技术,正成为各个科研机构竞相研究的对象,也正在多行业得到广泛的应用。数据挖掘的定义可以从技术和应用两个角度叙述:
(一)技术角度的定义
数据挖掘就是从大量的、不完全的、有噪声的、模糊的、随机的实际应用数据中,提取隐含在其中的、人们事先不知道的、但又是潜在有用的信息和知识的过程。
6、
(二)劳动保障信息系统应用角度的定义
从劳动保障信息系统应用的角度来说数据挖掘从本质上说是一种新的信息处理技术,是对劳动保障信息资源的有效采集和管理、合理衍生和使用、充分挖掘和利用,对大量的数据进行深层次分析以揭示隐藏的、未知的规律性并将其模型化,实现联机事务处理(OLTP)和联机分析处理(OLAP)的合理隔离和有机统一,从而实现对各种业务及其管理的强有力支持,通过定期发布各项统计指标向管理部门提供南京劳动保障工作开展情况及南京市民基础信息、劳动就业和社会保障等各方面情况,并为政府提供政策制定依据。
数据挖掘技术把人们对数据的应用,从低层次的联机查询操作,提高到
7、决策支持、分析预测等更高级应用上。它通过对数据进行抽取、转换、分析和其他模型化处理,发现数据间的关联性、未来趋势以及一般性的概括知识等,这些知识性的信息可以用来指导劳动保障管理决策活动,如图1所示。
图1数据挖掘和劳动保障管理决策
(三)数据挖掘的功能
数据挖掘功能用于指定数据挖掘任务中要找的模式类型。数据挖掘任务一般可以分两类:描述和预测。描述性挖掘任务刻划数据库中