数据挖掘技术在企业职工培训中的应用

数据挖掘技术在企业职工培训中的应用

ID:21506489

大小:54.00 KB

页数:5页

时间:2018-10-22

数据挖掘技术在企业职工培训中的应用_第1页
数据挖掘技术在企业职工培训中的应用_第2页
数据挖掘技术在企业职工培训中的应用_第3页
数据挖掘技术在企业职工培训中的应用_第4页
数据挖掘技术在企业职工培训中的应用_第5页
资源描述:

《数据挖掘技术在企业职工培训中的应用》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、数据挖掘技术在企业职工培训中的应用:本文阐述了数据挖掘的基本理论,介绍了如何建立职工培训数据仓库,进行概念模型、逻辑和物理模型的设计。通过SqlServer2005提供的数据挖掘模型对职工培训信息进行挖掘,得出影响职工培训结果的结论,降低培训成本,提高培训效率。这些分析在企业培训工作的开展与改进有着一定的指导意义。  关键词:数据挖掘SqlServer2005职工培训培训成本  :TP311.13:A:1007-9416(2011)11-0120-02    1、综述  数据挖掘技术在商业、金融业等方

2、面得到了广泛的应用,而在培训领域应用相对较少。企业对职工信息、培训结果等数据的处理一般还停留在简单的数据库管理和查询阶段,还不能发挥其用数据信息为培训工作作出决策的作用。  本文的工作就是以职工培训信息为背景,建立职工培训数据仓库,利用数据挖掘技术对建立的数据仓库进行深入分析,得出有用的结论指导培训工作,节省企业培训成本,提高培训效率。  2、数据挖掘概念  2.1数据挖掘定义  数据挖掘是从大量的、不完整的、有噪声的、模糊的和随即的数据中,提取隐含在其中的、人们事先不知道的、潜在的和有价值的信息和知

3、识的过程。  2.2数据挖掘的技术  最常用的数据挖掘技术主要有决策树、关联规则、贝叶斯、神经X络、聚类分析、模糊集和粗糙集等。  2.3数据挖掘的步骤  数据的挖掘过程主要包括5个阶段:数据准备、数据选择、数据预处理、数据挖掘、转换模型及模式评价。  3、培训数据仓库的建立  数据仓库研究和解决从数据库中获取信息的问题。通过对在册职工的信息及职工已经获得的培训结果进行分析,可以发现这些信息中包含了大量的基础数据和培训结果数据。  3.1职工培训数据仓库模型设计  概念模型设计完成的工作是界定系统边界

4、和确定主要的主题。培训数据库中存贮的是职工的基本信息和培训结果信息,比较单一,又有一定联系。运用数据仓库的理论和方法,对这些数据进行综合、提取,可产生支持培训决策所需要的信息。根据职工的特点及培训结果建立主题的原则,把职工培训结果分析作为主题建立职工培训数据仓库。如图1。  3.2职工培训数据仓库物理设计  物理模型设计是指数据在数据仓库中的存放形式和数据的组织。本数据仓库的核心数据库采用关系型数据库管理系统SQLserver2005。这里列出针对职工培训信息模型的物理结构如图2。  4、职工培训信息

5、挖掘  4.1关联规则  关联规则用来揭示数据与数据之间未知的相互依赖关系,评价标准主要是支持度和置信度。最小支持度表示项目集在统计意义上的最低重要性,最小置信度表示规则的最低可靠性。  用P(A)表示事务中出现物品集A的概率,P(B

6、A)表示物品集A的事务中,出现物品集B的概率,它们的表达式分别为  支持度:Support(A→B)=P(A∪B)  置信度:Confidence(A→B)=P(A

7、B)  4.2用关联规则模型分析职工培训信息  本文抽用了职工信息及考试情况数据,用关联规则对这些数据进

8、行操作,得出数据间的相关联系,被抽取的字段分别是单位、姓名、计算机等级等如表1。  (1)数据预处理。为了进行关联规则分析,需对数据进行概化,用符号A表示年龄,分段概化为:A1(小于等于30岁),A2(30岁-40岁),A3(大于等于40岁)。用符号HH表示是否通过,概化为:HH1(通过)HH2(未通过)。数据进行离散化后,结果如下表2所示:  (2)对数据进行训练。其中通过的记录数为5951,未通过的记录数为1796,占总记录数的23.18%,用关联规则对表进行挖掘,规则如表3。  表中的每一行为一

9、条关联规则,也就是说输入项和预测项有强关联性。  重要性也被称为兴趣度,可以用来对频繁项集和规则的度量。通过观察重要性可以发现人们感兴趣的项集和规则,重要性的计算公式如下:  Importance(A=>B)=log(p(B

10、A)/p(B

11、notA))  按重要性降序排列规则列表,如图3所示。可以看出,年龄大于50岁、工龄大于30年且职务级别为班组长、在操作岗位,学历在高中及以下的职工人群未获得太钢要求的等级的概率较大,而且这部分职工与通过等级要求存在负相关,符合人们对职工能力素质的一般认识,所以说明

12、这部分职工在理解力和学习能力以及接受能力相对教弱,所以针对这部分职工,在今后的培训中要重点关注,在培训形式和培训时间以及培训课时数上要对这部分人群要多研究,比如可以增加培训的课时,调整培训时间保证这部分人群能充分参加培训等,这部分职工以外的职工群体相对这部分职工在理解力、学习能力以及接受能力要强一些,所以可以设计开发培训时间和课时数教少的培训项目,达到降低培训成本的目的。  5、结语  本文介绍了数据仓库和数据挖掘的理论知识,建立了考试成绩分析数据仓库,

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。