C4.5分类算法在高职就业预测中的应用.pdf

C4.5分类算法在高职就业预测中的应用.pdf

ID:55936035

大小:514.75 KB

页数:5页

时间:2020-06-16

C4.5分类算法在高职就业预测中的应用.pdf_第1页
C4.5分类算法在高职就业预测中的应用.pdf_第2页
C4.5分类算法在高职就业预测中的应用.pdf_第3页
C4.5分类算法在高职就业预测中的应用.pdf_第4页
C4.5分类算法在高职就业预测中的应用.pdf_第5页
资源描述:

《C4.5分类算法在高职就业预测中的应用.pdf》由会员上传分享,免费在线阅读,更多相关内容在应用文档-天天文库

1、研究s开发文章编号:1007—1423(2014)23—0021—05DOI:10.3969~.issn.1007~1423.2014.23.005C4.5分类算法在高职就业预测中的应用王赛男(江苏省南京工程高等职业学校,南京211135)摘要:将C4.5决策树分类算法用于高职就业预测,并提取挖掘规则。对学生基本信息、各科考试成绩,以及就业信息进行处理,选取决策属性,构造决策树,由提取的规则,获得就业和学生成绩之间的关系,挖掘结果显示,该算法能将学习成绩属性和是否是学生干部属性进行正确分类.做出一定的就业预测,对辅助决策具有一定的帮助。关键词:C4.5;数据挖掘;决策树;就业预测基金项目

2、:江苏省教育科学“十二五”规划课题0引言Quinlan于1993年提出.它是在ID3算法的基础上演变过来的。ID3是一种基于信息熵的决策树算法,但是当前,随着国家经济结构的调整.以及高技能应用由于信息熵存在一个内在偏好.导致该算法总是会选人才缺失的背景下.以培养技能型人才的高职院校.毕择取值较多的属性来作为分裂属性的标准.使得结果业生就业率在逐年升高.但是,就业质量却没有得到相会造成一定的误差。因此,在后续的C4.5算法中,除了应的提高,如何提高就业质量,如何使学生能好就业,保留ID3算法原有的部分功能外.还进行了一系列的就好业.提高学校的办学水平.以“出El畅”推进“进口改进。主要体现

3、在以下几个方面:(1)改用信息增益率旺”是当前的各类学校追求的目标.如何挖掘出学生在代替信息熵,来作为选择分裂属性的标准;(2)离散化校表现及在校学习成绩和学生就业之间隐藏的有价值处理连续型属性;(3)增加了树剪枝技术。的信息.如何能合理地利用这些数据促进就业指导.促目前。C4.5算法已经广泛应用于很多研究领域.例进职业学校的教改.则迫切地摆在了职业院校的决策如:医疗诊断、模式识别、语音识别等。者面前。1.3C4.5算法实现1决策树技术C4.5算法按照下列方法计算并实现:1.1决策树概述(1)计算类别的信息熵假设包含s个数据样本的样本集5={置Ii=1,2,⋯。在数据分类问题中.决策树是

4、一种很有用的方法.},包含m个不同值的类别属性集合C={cjjl=1.2,⋯.该方法构建一棵树对分类问题进行建模.通过这棵树m}。假设属于类G的样本数用s来表示,那么,给定的可以对问题进行有效的分类,并得到分类结果因此。数据样本分类所需要的信息熵计算公式:用决策树分类要通过两个步骤进行:①建立分类模型:m②将数据集应用到此模型.进行分类。、nI(sl,s2,⋯,s)一·l0g1.2C4.5算法概述j=l(2)计算属性A划分的子集熵C4.5算法作为数据挖掘十大经典算法之首.由现代计算机2014.08中回当对应值=⋯C’.则:业课程成绩决策属性)=“A”+“SC”(英语成绩决策属,(c,S髓

5、,S∞,)-,(0,8,0,8)=1.0性):“A”THEN在事业单位就职;IF“PS”(专业课程成绩决策属性)=“A”+“BS”(专由此得出:业课程成绩决策属性):“A”+“SC”(英语成绩决策属E(PS)=

6、S+×,(Js性):“B”+“SC”(是否为学生干部)=“A”(是)THEN在事业单位就职:

7、s,)+×,(sc,,,)=1-375IF“PS”(专业课程成绩决策属性)=“A”+“BS”(专Gain(PS)=I(A,B,C,D)一E(PS)=O.5016业课程成绩决策属性):“A”+“SC”(英语成绩决策属所以“PS”的信息增益率为:性):“B”+“SC”(是否为学生干部)=⋯B

8、’(不是)THEN在民营企业工作:Ratio(PS)=_0.3648IF“PS”(专业课程成绩决策属性):“A”+“BS”(专业课程成绩决策属性):“B”+“SC”(英语成绩决策属同理.“SC”的信息增益率为:性)=“A”THEN在事业单位工作:Rnt。(Jsc)=—{=0.0955IF“PS”(专业课程成绩决策属性)=“A”+“BS”(专业课程成绩决策属性)=“B”+“SC”(英语成绩决策属“AS”的信息增益率为:性):“B”THEN在事业单位工作:。(=舞_0_0922IF“Ps”(专业课程成绩决策属性)=“A”+“BS”(专业课程成绩决策属性)=“B”+“SC”(英语成绩决策属对比

9、所有决策属性的信息增益率。可以发现:决策性)=“C”THEN在民营企业工作:属性“PS”的信息增益率最大.在构建决策树时应处于IF“PS”(专业课程成绩决策属性)=“B”+“BS”(专根节点。依次的顺序是:决策属性“BS”(基础课程成业课程成绩决策属性):“A”+“SC”(英语成绩决策属绩)、决策属性“ES”(英语成绩)、决策属性“SC”(是否是性)=“A”THEN在事业单位工作:学生干部),决策属性“AS”(入学成绩)。IF“PS

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。