欢迎来到天天文库
浏览记录
ID:33133758
大小:1.42 MB
页数:61页
时间:2019-02-21
《数据挖掘技术在招生信息系统中的应用》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、北京工业大学硕士学位论文数据挖掘技术在招生信息系统中的应用姓名:刘静申请学位级别:硕士专业:软件工程指导教师:张书杰;宋群20060201摘要海量数据的存在以及从海量数据中提取决策信息的强烈需求,使得数据挖掘日益成为研究的热点。本文主要研究了数据挖掘的理论、相关技术以及数据挖掘技术在现实中的应用。论文以数据挖掘技术的研究作为核心,深入研究了关联规则和决策树分类技术。关联规则及决策树归纳分类作为数据挖掘的两个重要方法,有着可理解性强、简洁性好、应用范围广等优点。本文首先介绍了对传统关联规则算法的改进。在介绍现行算法——Apriori算法不足的基础上,本文提出了新的改进算法。经考生实际
2、数据测试证明,改进后的算法与传统算法相比具有更好的性能和可扩展性。其次阐述了对D3决策树分类算法的改进。介绍了经典的D3决策树分类算法,并提出了一种高效的简化决策树的算法。算法先序遍历由ID3构造出来的决策树的各个节点并对其子树进行比较,如果各子树的属性都相同而且存在某些相应的分支对于各子树完全相同,则改变决策树中相应属性的层次关系并把相同的分支分别合并起来。算法减少了决策树的深度、宽度与叶子数目,降低了决策树的规模。目前,国内在数据挖掘方面的研究仅限于算法和模型的研究,还没有提升到实际应用的层面上。本文通过深入学习和研究,在总结实际项目开发经验的基础上,尝试将招生考试中的商业逻辑
3、与数据挖掘功能平滑集成,形成简单易用的数据挖掘系统。以便对成人教育有全面准确的判断,从而提高考试院主管部门的政策制定水平。由于国内还没有在此方面的应用实例,所以此系统仍处于不断完善和探索的阶段。关键词数据挖掘;关联规则;分类;决策树AbstractToogreatnumbersofdataexistingatthiseraofinformationstronglyrequirethecomondata—userstohavetheabilitytopreciselypickoutdecision—makingdatafromthem.Manyresearchershavestudi
4、edhowwecanmanagetoachieVethisabilitytochoose.Thispapermainlydwellsonthetheoriesofthetechn0109y。fdatamining,theotherrelevanttechn。logiesandtheapplicationsofallthesetechn0109ies.Thetwocentraltopicsofthepaperaretheassociationruleandclassificationusingdecisiontree,whicharethemostimportantmethodsin
5、theselectionofdata.Bothofthemethodsareeasytounderstand,comparativelysimple,andthushavebeenappliedextensively.工nthefirstpartofthepaper,theshortageofthetraditionalalgorithmoftheassociationrule一一Apriori,themethodcurrentlyused,ispointedoutandawaytoimproveitisgiven.Thetestsconductedam。ngtheexaminee
6、shaveprovedthattheimprovedalgorithmhasagreaterextensibility.Inthesecondpartofthepaper,asimplifiedandmoreefficientmethodofclassificationusingtheID3decisiontreeissuggested:A1lthenodesofthedecisiontreewillbeexaminedandifparticularbranchesofthetreehavethesameproperties,theywillbecorrespondinglyinc
7、orporated.Theimprovedwaycanhelpminimizethedepth,widthandthenumberof1eavesinthetree.MostresearchershomehaⅣelimitedtheirstudiestothealgorithmsandmatnxesintheselectionofdata.Thispaper,however,inanattempttoexplorefurtherintheapplicationaspe
此文档下载收益归作者所有