欢迎来到天天文库
浏览记录
ID:21506489
大小:54.00 KB
页数:5页
时间:2018-10-22
《数据挖掘技术在企业职工培训中的应用》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、数据挖掘技术在企业职工培训中的应用:本文阐述了数据挖掘的基本理论,介绍了如何建立职工培训数据仓库,进行概念模型、逻辑和物理模型的设计。通过SqlServer2005提供的数据挖掘模型对职工培训信息进行挖掘,得出影响职工培训结果的结论,降低培训成本,提高培训效率。这些分析在企业培训工作的开展与改进有着一定的指导意义。 关键词:数据挖掘SqlServer2005职工培训培训成本 :TP311.13:A:1007-9416(2011)11-0120-02 1、综述 数据挖掘技术在商业、金融业等方
2、面得到了广泛的应用,而在培训领域应用相对较少。企业对职工信息、培训结果等数据的处理一般还停留在简单的数据库管理和查询阶段,还不能发挥其用数据信息为培训工作作出决策的作用。 本文的工作就是以职工培训信息为背景,建立职工培训数据仓库,利用数据挖掘技术对建立的数据仓库进行深入分析,得出有用的结论指导培训工作,节省企业培训成本,提高培训效率。 2、数据挖掘概念 2.1数据挖掘定义 数据挖掘是从大量的、不完整的、有噪声的、模糊的和随即的数据中,提取隐含在其中的、人们事先不知道的、潜在的和有价值的信息和知
3、识的过程。 2.2数据挖掘的技术 最常用的数据挖掘技术主要有决策树、关联规则、贝叶斯、神经X络、聚类分析、模糊集和粗糙集等。 2.3数据挖掘的步骤 数据的挖掘过程主要包括5个阶段:数据准备、数据选择、数据预处理、数据挖掘、转换模型及模式评价。 3、培训数据仓库的建立 数据仓库研究和解决从数据库中获取信息的问题。通过对在册职工的信息及职工已经获得的培训结果进行分析,可以发现这些信息中包含了大量的基础数据和培训结果数据。 3.1职工培训数据仓库模型设计 概念模型设计完成的工作是界定系统边界
4、和确定主要的主题。培训数据库中存贮的是职工的基本信息和培训结果信息,比较单一,又有一定联系。运用数据仓库的理论和方法,对这些数据进行综合、提取,可产生支持培训决策所需要的信息。根据职工的特点及培训结果建立主题的原则,把职工培训结果分析作为主题建立职工培训数据仓库。如图1。 3.2职工培训数据仓库物理设计 物理模型设计是指数据在数据仓库中的存放形式和数据的组织。本数据仓库的核心数据库采用关系型数据库管理系统SQLserver2005。这里列出针对职工培训信息模型的物理结构如图2。 4、职工培训信息
5、挖掘 4.1关联规则 关联规则用来揭示数据与数据之间未知的相互依赖关系,评价标准主要是支持度和置信度。最小支持度表示项目集在统计意义上的最低重要性,最小置信度表示规则的最低可靠性。 用P(A)表示事务中出现物品集A的概率,P(B
6、A)表示物品集A的事务中,出现物品集B的概率,它们的表达式分别为 支持度:Support(A→B)=P(A∪B) 置信度:Confidence(A→B)=P(A
7、B) 4.2用关联规则模型分析职工培训信息 本文抽用了职工信息及考试情况数据,用关联规则对这些数据进
8、行操作,得出数据间的相关联系,被抽取的字段分别是单位、姓名、计算机等级等如表1。 (1)数据预处理。为了进行关联规则分析,需对数据进行概化,用符号A表示年龄,分段概化为:A1(小于等于30岁),A2(30岁-40岁),A3(大于等于40岁)。用符号HH表示是否通过,概化为:HH1(通过)HH2(未通过)。数据进行离散化后,结果如下表2所示: (2)对数据进行训练。其中通过的记录数为5951,未通过的记录数为1796,占总记录数的23.18%,用关联规则对表进行挖掘,规则如表3。 表中的每一行为一
9、条关联规则,也就是说输入项和预测项有强关联性。 重要性也被称为兴趣度,可以用来对频繁项集和规则的度量。通过观察重要性可以发现人们感兴趣的项集和规则,重要性的计算公式如下: Importance(A=>B)=log(p(B
10、A)/p(B
11、notA)) 按重要性降序排列规则列表,如图3所示。可以看出,年龄大于50岁、工龄大于30年且职务级别为班组长、在操作岗位,学历在高中及以下的职工人群未获得太钢要求的等级的概率较大,而且这部分职工与通过等级要求存在负相关,符合人们对职工能力素质的一般认识,所以说明
12、这部分职工在理解力和学习能力以及接受能力相对教弱,所以针对这部分职工,在今后的培训中要重点关注,在培训形式和培训时间以及培训课时数上要对这部分人群要多研究,比如可以增加培训的课时,调整培训时间保证这部分人群能充分参加培训等,这部分职工以外的职工群体相对这部分职工在理解力、学习能力以及接受能力要强一些,所以可以设计开发培训时间和课时数教少的培训项目,达到降低培训成本的目的。 5、结语 本文介绍了数据仓库和数据挖掘的理论知识,建立了考试成绩分析数据仓库,
此文档下载收益归作者所有