基于Kmeans和CBR方法的高校就业预测模型应用研究.doc

基于Kmeans和CBR方法的高校就业预测模型应用研究.doc

ID:14166114

大小:29.00 KB

页数:4页

时间:2018-07-26

基于Kmeans和CBR方法的高校就业预测模型应用研究.doc_第1页
基于Kmeans和CBR方法的高校就业预测模型应用研究.doc_第2页
基于Kmeans和CBR方法的高校就业预测模型应用研究.doc_第3页
基于Kmeans和CBR方法的高校就业预测模型应用研究.doc_第4页
资源描述:

《基于Kmeans和CBR方法的高校就业预测模型应用研究.doc》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、基于Kmeans和CBR方法的高校就业预测模型应用研究  【摘要】提出运用Kmeans聚类算法和CBR案例推理方法对高校学生就业趋向进行预测。针对采集的高校就业信息的高维海量数据,首先使用Kmeans聚类方法将已就业数据划分成不同的就业类别,从而极大地减少了特征分析工作量。对未就业数据进行预测时,先计算跟每一聚类中心的距离值,从而得到其合适的分类,再在每一类中进行CBR推理,最后得出对其的预测分类结果。实验结果表明,提出的算法预测结果较为精确,为高校就业指导提供了帮助。  【关键词】Kmeans聚类CBR推理高校就业预测    随着高校的扩招,我国高等教育已

2、经由精英教育转向大众教育,从1999年开始,高等学校的办学规模、招生规模逐步扩大。而由此带来了应届毕业生的就业形势一年比一年严峻,2010年,全国普通高等毕业生达630万,比2009年的611万又增加了19万人[1]。面对如此大的就业压力,各个高校也加强了就业指导方面的工作。不少高校开展了对学生的就业指导,如收集、筛选有效的需求信息,为毕业生提供指导与咨询等,以提高学校的就业率。但很多高校就业工作还只是做了面上工作,缺乏实际效果,并不能真正解决学生的实际问题。  目前,很多高校都在使用就业管理系统、学籍管理系统等数据库帮助工作,但这些数据库往往还停留在简单的

3、统计、查询等功能上。由于毕业生就业工作涉及的数据量十分巨大,而且时间集中,仅靠传统的数学和统计手段已经不够。如何运用数据库中的数据得到对就业指导有用的信息成为了一个非常有实际意义的研究内容,而数据挖掘技术可在高校就业预测中有很好的应用前景。  本文首先用Kmeans[2]方法对往年已就业学生进行聚类,对每一类特征进行分析,得到其就业特征信息。对未就业学生进行预测时,先将其与每一类中心点计算距离,将其分入某一类,在同一类中再用CBR[3]进行案例推理,从而得出其与哪几个个案最相似,用这些成功就业的特征作为该学生的预测结果,而且还可以根据这些学生特征给新同学一个

4、建议。本文结构如下,第1节介绍基于Kmeans和CBR的高校就业预测模型,第2节给出实验结果和分析,最后一节给出结论。    1基于Kmeans和CBR的高校就业预测模型    学生管理和就业数据数据量庞大,因此需要使用数据挖掘知识进行处理,使用数据挖掘对学生管理和就业数据进行管理的概念流程如图1所示。  在图1的数据挖掘和机器学习库中,可以使用多种算法,如决策树算法[4]、关联规则算法[5]、SVM(SupportVectorMachine,支持向量机)[6]算法等等。本文重点是对就业数据进行预测,因此提出了使用Kmeans聚类算法和CBR算法,以得到较好

5、的预测结果。4  Kmeans(K均值)聚类算法是一种基于划分的聚类算法,建立在最小化误差平方和的准则上。其过程是先随机选择一些初始代表点作为初始聚类中心,然后计算其余样本点与各中心点的距离,把它们分到最近(距离最小)的类中去;然后对每一类中的样本点计算均值,把这个均值作为新的聚类中心点;反复迭代,直到聚类中心点不再改变或者达到迭代最大步数。Kmeans聚类算法的效率很高,时间复杂度为O(tkn),其中n是样本数,k是聚类的类数,t是算法迭代次数(t<历史”与待求解问题进行相似性匹配,利用相似的一个或若干个“历史”对待求解问题进行解答。当给定一个待求解

6、问题,CBR首先检查是否存在一个同样的训练案例。如果找到一个,则返回附在该案例上的解。如果找不到同样的案例,则CBR将搜索具有类似于新案例的训练案例。概念上讲,这些训练案例可以视为新案例的邻接者。CBR试图组合临近的训练案例,提出新案例的解。如果解之间出现不相容,可能需要回溯搜索其他解。CBR的主要难点包括找到一个好的相似性度量,开发对训练案例索引的有效技术和组合解的方法。    本文提出的基于Kmeans和CBR的高校就业预测模型的流程示意图如图2所示,首先用Kmeans方法对往年已就业学生进行聚类,对未就业学生进行预测时,先将其与每一类中心点计算距离,将

7、其分入某一类,在同一类中再用CBR进行案例推理。    2实验结果和分析    数据挑选自最近几年实际的就业信息,共320个样本,部分样本数据例子如表1:    2.1数据预处理  首先要把数据进行预处理,不是数值型的数据转换成数值型数据。如性别男用0代表,女用1表示,获奖情况我们也将其数值化,考虑用获奖的次数来替换获奖这个属性,社会工作也是如此.对特长我们简单用有特长(数值1表示)、无特长(数值0表示)来区分。生源地则与工作单位所在地进行对比,如在同一省份则用数值1代替,否则用数值0代替。则上述就业数据例子变成  2.2实验结果和分析  为了验证所提出方法

8、的效果,我们使用Weka工具对预处理数据进行分析。 

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。