欢迎来到天天文库
浏览记录
ID:55399558
大小:1.02 MB
页数:7页
时间:2020-05-15
《基于数据挖掘的国内大学生就业信息双向推荐系统.pdf》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库。
1、第27卷第3期Vo1.27,NO.32015年6月Jun.20l5文章编号:2095—5456(2015)03—0226—07基于数据挖掘的国内大学生就业信息双向推荐系统沈阳眦r刘玉华,陈建国一,张春燕大(1.福建工程学院软件学院,福建福州350003;学2.湖南大学信息科学与工程学院,湖南长沙410082)y学g摘要:针对目前国内无法及时、准确地获取高质量的就业招聘信息,企业无法便捷获取符合岗位需求报U的人才信息等问题,提出一种基于数据挖掘的大学生就业信息双向推荐系统方案,实现毕业生信息与企业招r聘信息双向推荐的目的.该系统通过分析某城市若干高校
2、历年毕业生就业管理工作中积累的大量就业数据自信息,分别对毕业生信息和企业招聘信息进行聚类分析,同时对各毕业生与其成功就职的企业和岗位信息进y行关联分析.根据聚类规则对当前求职的毕业生和招聘企业分别进行分类,向各毕业生自动推荐其同类学生然a所关联的企业及岗位信息,同时向各企业自动推荐符合其岗位需求的毕业生信息.实验证明,该系统能够有科a效利用高校之间的就业信息资源共享机制,对各个高校的毕业生及企业岗位招聘信息进行准确聚类,实现毕学S业生和企业之间的双向推荐.C关键词:双向推荐;就业信息;数据挖掘;聚类分析;关联分析版锄∞中图分类号:TP311.13文
3、献标志码:A伴随着计算机技术和信息技术的迅速发展,生信息与企业招聘信息的双向推荐的目的.各种业务管理系统的应用要求进一步提高,各项1核心技术研究业务决策已经越来越依赖于数据的分析和挖掘.目前国内许多高校已经完成毕业生就业工作管理1.1数据挖掘的信息化建设,纷纷建立符合自身学校特色的毕数据挖掘是指从海量数据中采用各种特定算业生就业管理系统l1].这些系统经过多年的运法,经过整合、归纳和评估,提炼出隐含的、有价值行和使用,已经积累了海量的毕业生就业管理业的信息,并将信息提炼成知识,为企业决策提供科务数据,包括毕业生信息、企业信息、企业招聘信学依据的过程
4、].近年来,工业界各行业领域纷纷息、毕业生求职过程记录等宝贵的原始数据_4].大对数据挖掘技术开始关注和研究.数据挖掘技术数据应用的价值越来越明显.海量数据里面蕴含已广泛应用于电子商务、经济金融、科学计算、工着大量十分有价值的数据,要处理的数据量越来业制造等众多领域.越大、而且还将更加快速地增长[5].数据挖掘的过程可分为三个阶段:数据准备、基于以上背景,本文针对目前高校毕业生在挖掘的数据和结果的输出与分析。就业过程中存在无法及时、准确地获取高质量的1.2K.means聚类算法招聘信息,企业无法便捷获取符合岗位需求的人K—means算法是一种经典的
5、聚类算法],其才信息等问题;结合某城市大学城各个高校的毕基本思想是:以随机选取的是(预设类别数)个样业生就业管理工作数据,提出一种基于数据挖掘本作为起始中心点,将其余样本归入相似度最高的大学生就业信息双向推荐系统方案,建设一个中心点所在的簇(cluster),再确立当前簇中样本区域性的高校间毕业生就业推荐系统,实现毕业坐标的均值为新的中心点,依次循环抚今追昔下收稿日期:2014—12—23基金项目:福建省教育科学“十二五”规划课题(2o14CG1363).作者简介:刘玉华(1985一),女,福建福州人,福建工程学院助教第3期刘玉华等:基于数据挖掘的
6、国内大学生就业信息双向推荐系统227去,直到所有样本所属类别不再变动.K—means表1毕业生数据特征选择Table1Featureselectionofthegraduatesdata算法过程如图1所示.序号变量名称类型取值说明图1K—means聚类算法演示(2)K—means聚类分析.本文使用K—meansFig.1AdemonstrationofK-meansalgorithm算法对高校历年的毕业生就业数据中的毕业生信本文使用K—means算法对高校历年的毕业息进行聚类分析,根据分析结果对毕业生进行分生就业数据中的毕业生信息和企业招聘信息分别
7、类.毕业生聚类分析功能示例如图2所示.进行聚类分析.从而对毕业生和企业招聘信息分学生性别年龄专业成绩/^、坐别进行分类.业1.3Apriori关联规则算法生聚Apriori算法是一种径典的关联规则挖掘算类分法,该算法使用迭代的逐层搜索方法挖掘频繁项析,/集L9].其基本思想是:通过读取并计算各个数据项图2毕业生聚类分析功能的个数,找出满足最小支持度阈值的数据项并形Fig2Thefunctionofclusteringanalysisof成1级频繁项集合(含有单个数据项).接着使用graduates’data1级频繁项集找到2级频繁项集(含有两个数据
8、使用K—means算法对毕业生信息进行聚类,项).重复该迭代操作,直到找出极大频繁项集(含需要先设定聚类数和所使用的准则函
此文档下载收益归作者所有