欢迎来到天天文库
浏览记录
ID:32977090
大小:1.68 MB
页数:63页
时间:2019-02-18
《id3算法在高校毕业生就业分析中的应用研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、北京工业大学硕士学位论文ID3算法在高校毕业生就业分析中的应用研究姓名:杨龙平申请学位级别:硕士专业:软件工程指导教师:何泾沙;聂永红20070501摘要在高校的发展过程中,有很多的学校存储了多年的毕业生就业的信息,面对浩瀚的数据海洋和匮乏的信息,数据挖掘技术不仅可以对过去的数据进行查询,而且能够找出过去数据之间的潜在联系,进行更高层次的分析,更好地进行决策、预测。为了能够充分利用这些已经存在的数据,找出这些数据之间的一些可用信息,并能从这些数据中,分析出的以后的毕业生的就业概率,为学校的发展提供决策的依据。本文将从就业的
2、形势分析入手,收集高校往年的毕业生就业基本信息,建立数据库,从很多的数据挖掘方法中选出一种作为分析的技术手段,来创建就业模型,并对创建好的模型进行验证,再利用验证后的模型对毕业生的就业信息进行分析,对每个毕业生的就业可能性进行预测。根据课题本身的特征,在分析了众多的挖掘方法后,选择的挖掘方法是决策树方法。根据决策树中ID3算法的要求,对数据进行了预处理,并对非数值型数据进行数字化表示,使数据表中的数据符合ID3算法的要求。然后通过计算信息增益,建立一个初始的毕业生就业分析的模型。对该模型根据要求进行了剪枝处理,再对剪枝后的
3、模型进行验证,并对验证后的模型进行评价,从中计算出每一个毕业生就业的可能性。毕业生就业分析模型对各个高校分析就业的原因,进行教学计划的调整和开发新专业,都具有积极的参考价值,为高校的可持续发展以及构建和谐校园具有实际的指导意义。关键词数据挖掘;毕业生就业;ID3算法;分析模型;预测AbstractInthedevelopingprocessofuniversity,therearemanyuniversitiessavetheemploymentinformationofgraduatesformanyyears.Faci
4、ngtothevastdataseaandthedeficientinformation,thedataminingtechnologynotonlycaninquiryaboutthepastdata,butalsoCanfindoutthelatentrelationbet’Ⅳ嘲thedecision-makingandforecast.InordertofullyusetheseexisteddatatofindoutsomeavailableinformationbetWeellthesedata,andalsoa
5、nalyzetheemploymentprobabilityoffuturegraduatesfromthesedatatoprovidepolicy-makingbasisforthedevelopmentofuniversity,thisarticlewillstartwiththeanalysisofemploymentsituationandselectthebasicemploymentinformationofformer-year-graduatesinauniversitytosetupadatabase,
6、however,selectORekindofachievementanalysis,thetechnicalmethodfromthemultitudinousdataminjngmethod,foundtheemploymentmodel,andwecantestandverifythefoundedmodel,andthenanalyzethegraduate’semploymentinformationbyusingthetestedmodel,aswellaswecanforecasttheemploymentp
7、ossibilityforeachgraduate.Andaccordingtothetopicowncharacters,aswellasafteranalyzingmanymethodsofminingmethods,weselectasuitableminingmethodthatisthedecisionfreemethod.AccordingtotherequirementoflD3methodinthedecisiontreemethod,wedealwiththedata,andusenumericalval
8、uetOexpressthenon-numericaldatasothatthedatainthisdatabaseCanmeettherequirementofID3algorithm.Andthenthroughcountingtheincreaseoftheinformation,wesetupa
此文档下载收益归作者所有