决策树分类算法在大学生就业指导中的应用研究

决策树分类算法在大学生就业指导中的应用研究

ID:28178383

大小:18.31 KB

页数:5页

时间:2018-12-07

决策树分类算法在大学生就业指导中的应用研究_第1页
决策树分类算法在大学生就业指导中的应用研究_第2页
决策树分类算法在大学生就业指导中的应用研究_第3页
决策树分类算法在大学生就业指导中的应用研究_第4页
决策树分类算法在大学生就业指导中的应用研究_第5页
资源描述:

《决策树分类算法在大学生就业指导中的应用研究》由会员上传分享,免费在线阅读,更多相关内容在应用文档-天天文库

1、为了确保“教学点数字教育资源全覆盖”项目设备正常使用,我校做到安装、教师培训同步进行。设备安装到位后,中心校组织各学点管理人员统一到县教师进修学校进行培训,熟悉系统的使用和维护。决策树分类算法在大学生就业指导中的应用研究  摘要:为深入挖掘剖析影响应加大学生求职择业的关键因素及其潜在的相互作用,笔者针对南京信息职业技术学院近年来的毕业生选择推荐就业、自主择业、自主创业或升学、待业等各种情况的决策因素进行了广泛的统计,以数据挖掘分类技术为支撑设计了算法对各种潜在的影响毕业生就业选择的因素进行了系统化的剖析,从而得出影响应届毕业生就业率的决策模型。本研究的主要意义在于学生可以

2、算法模型在大学在读期间努力完善自己的知识结构,不断增强自身的综合素质及社会竞争力。从而适应日益严峻的就业形势和经济社会发展的需要,提高入职签约成功率。应届毕业生也可以参照算法模型对比自身的素质素养有针对性的选择目标单位进行择业。高等院校则可以根据该算法模型统计各界毕业生的就业指数进行纵向及横向的对比分析,进有针对性的改良教学计划,使院校培养出的毕业生更加符合当代社会的需求,刺激就业率快速增长。  关键词:数据挖掘;分类;决策树;算法;大学生求职  中图分类号:文献标识码:A文章编号:1007--0151-03  1算法  为了充分发挥“教学点数字教育资源全覆盖”项目设备的

3、作用,我们不仅把资源运用于课堂教学,还利用系统的特色栏目开展课外活动,对学生进行安全教育、健康教育、反邪教教育等丰富学生的课余文化生活。为了确保“教学点数字教育资源全覆盖”项目设备正常使用,我校做到安装、教师培训同步进行。设备安装到位后,中心校组织各学点管理人员统一到县教师进修学校进行培训,熟悉系统的使用和维护。算法是对ID3算法的优化改良。与ID3算法不同的是,算法是以数据增益率为标准来选择决策树的每个节点的节点属性。算法默认选择当前分支节点下数据增益率最高的属性作为当前节点的测试属性。算法具有的这一特性使得对数据挖掘结果中的样本分类所需的数据量大大减少,而且能够准确的

4、反映出划分的最小随机性或“不纯性”。这种理论方法使得对一个对象分类所需的期望测试数目达到最小,从而设计一棵最为简单的决策树。为了研究的方便,下面对算法中的相关术语给出定义。  定义1:设数据集S为包含S个数据样本的集合,且类别属性可以取m个不同的值,对应于m个不同的类别Ci。假设Si为类别Ci中样本的个数;对一个给定数据对象进行分类所需要的信息量,称为S划分前的熵,即:  其中Pi是任意一个数据对象属于类别Ci的概率:。Pi=Si/S。  定义2:设一个属性A取v个不同的离散属性值{a1,a2,…av}。利用属性A可以将集合S划分为v个子集{S1,S2,…Sv},其中Sj

5、包含了S集合中属性A取aj值的数据样本。若属性A被选为测试属性,即用属性A对当前样本集进行划分。设Sij�樽蛹�Sj中属于Ci类别的样本数。那么利用属性A划分当前样  2挖掘对象及目标确定为了充分发挥“教学点数字教育资源全覆盖”项目设备的作用,我们不仅把资源运用于课堂教学,还利用系统的特色栏目开展课外活动,对学生进行安全教育、健康教育、反邪教教育等丰富学生的课余文化生活。为了确保“教学点数字教育资源全覆盖”项目设备正常使用,我校做到安装、教师培训同步进行。设备安装到位后,中心校组织各学点管理人员统一到县教师进修学校进行培训,熟悉系统的使用和维护。  本文以南京信息职业技术

6、学院六百名XX届毕业生的就业情况作为研究对象,通过建立算法比对分析六百位XX届毕业生的学习成绩及个人素质等相关信息得出可能影响学生择业就业的潜在因素,为在校学生有针对性的提高自身素养提供了参考方向,同时也给学校学生工作委员会就业指导中心的专兼任教师调整学校课程安排和就业指导工作的中心提供了理论支撑。  3数据采集  利用算法进行数据挖掘分析需要确立具体、可查的研究对象,所以建立算法分析模板前应对可预见的可能影响学生择业就业的潜在因素进行系统化、精细化的搜集整理。数据采集样本的准确程度直接影响了算法分析结果的参考价值。  根据研究分析需要,本文主要从南京信息职业技术学院学生

7、学籍管理系统中“基本信息服务”界面采集了学生“学生基本信息”,从“学习中心-成绩查询服务”界面导出了XX界毕业生的“学生成绩信息”。南京信息职业技术学院学生工作委员会下辖的就业指导中心的同事们向我们提供了XX界相关毕业生的“就业状况信息”。笔者使用随机抽样的方式从调取到的近五千条数据记录中截取了600条相关记录作为本次研究分析的对象。在截取的600条毕业生信息中安排400条数据组成训练数据集,剩余200条数据分配为测试数据集。为了充分发挥“教学点数字教育资源全覆盖”项目设备的作用,我们不仅把资源运用于课堂教学,还利用系统的特色

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。