基于数据挖掘的决策树技术在成绩分析中的应用.研究

基于数据挖掘的决策树技术在成绩分析中的应用.研究

ID:31983276

大小:1.46 MB

页数:37页

时间:2019-01-30

基于数据挖掘的决策树技术在成绩分析中的应用.研究_第1页
基于数据挖掘的决策树技术在成绩分析中的应用.研究_第2页
基于数据挖掘的决策树技术在成绩分析中的应用.研究_第3页
基于数据挖掘的决策树技术在成绩分析中的应用.研究_第4页
基于数据挖掘的决策树技术在成绩分析中的应用.研究_第5页
资源描述:

《基于数据挖掘的决策树技术在成绩分析中的应用.研究》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、山东大学硕士学位论文第一章绪论近十几年来,数据挖掘技术已得到广泛的研究,并在商业、金融、医疗等领域得到成功地应用。数据挖掘是信息处理领域的一项重要课题,它融合了数据库、人工智能、机器学习、统计学等多个领域的理论和技术。其中分类分析在商业等领域中的成功应用使它成为数据挖掘中最活跃、最成熟的研究方向。目前常用的分类方法有决策树、关联规则、贝叶斯网络、神经网络、粗糙集模型和统计模型等。而决策树方法以其速度快、精度高、生成的模式简单易懂以及容易转化成分类规则等优点,在数据挖掘领域被广泛地研究和应用。由于高校连年扩招,造成了在校

2、生人数规模剧增,给高校的教学工作带来了许多影响教学质量的问题。本论文以笔者所工作的学校为例,提出了一种应用决策树技术来挖掘隐藏在学生成绩背后有价值信息的研究方案,目的是对教师今后的教学工作提供重要的决策依据。决策树技术是数据挖掘分类和预测的主要技术。是通过一组无次序、无规则的实例中推理出决策树表现形式的分类规则。决策树方法与其它分类方法相比具有可理解性、易训练、易实施和通用性等优点,所以本论文选择将决策树技术应用到学生成绩分析研究中。1.1课题提出的研究背景及意义在高校教学中,教师在教学实施过程中往往积累了大量的数据,

3、但目前对这些数据的处理还停留在初级的数据备份、查询及简单统计阶段.不能发挥它应有的作用.如对学生成绩的分析处理一般仅仅是统计成绩为优、良、一般、差等级别的人数,对于学生取得这些成绩的原因往往无法了解.数据挖掘是一种决策支持过程.是深层次的数据信息分析方法.将数据挖掘技术应用于教学评价无疑是非常有益的,它可以全面地分析考试结果与各种因素之间隐藏的内在联系,可以将大量的数据转化为分类规则,从而更好地分析这些数据。必然有利于教学质量的提高。在激烈的市场竞争中,信息对于企业的生存和发展越来越起到至关重要的作用,随着数据库技术的

4、迅速发展以及数据库管理系统的广泛应用,数据库中表达信息的数据亦随着时间和业务的发展而急剧膨胀,人们需要对数据进行更高层8山东大学硕士学位论文暑量曼鼍曼曼量曼量曼鼍曼皇I—I_i_iIiI;II皇量毫量皇量皇詈曼詈曼皇鲁曼量曼曼曼曼量曼皇曼量曼皇皇次的处理,从中找出规律和模式,以帮助人们更好的利用数据进行决策和研究。目前的数据库系统虽然可以实现高效的数据录入、查询、统计等功能,却无法发现数据中存在的关系和规则,无法根据现有的数据预测未来的发展趋势。由于缺乏挖掘数据背后隐藏的知识的手段,导致了“数据爆炸但知识贫乏”的现象,

5、面对“人们被数据淹没,人们却饥饿于知识’’的挑战,数据挖掘和知识发现技术应运而生,并得以蓬勃发展,越来越显示出其强大的生命力。数据挖掘的核心部分是为数据集建立模型的过程,不同的数据挖掘方法构造数据模型的方式也不相同,在进行数据挖掘时可采用许多不同的方法,例如神经网络、决策树、遗传算法和可视化技术等,同时同一方法下又有数以百计的派生方法。决策树算法是数据挖掘常用的方法之一,但它一直未受到人们重视,直到1984年Breiman等人合著出版了《分类和回归树》一书,决策树方法才开始被统计学界接受并获得了信赖,并很快得到推广应用

6、。现在很多公司的数据挖掘产品中都采用了决策树数据挖掘算法,J.R.Quinlan对决策树算法做出了详细的理论描述‘1mmm2Ⅲ朝。决策树算法中一种广为人知的算法就是ID3算法,是1986年由Quinlan提出的一种基于信息熵的决策树算法,近年来在很多知识发现领域得到应用,很多学者‘81啪omll针对ID3算法进行研究与改进。1.2国内外的研究现状目前,决策树技术己经在许多数据挖掘系统应用中得到研究者和软件公司的极大关注,国内外很多公司均己推出自己的数据挖掘系统,其中很多都采用决策树方法,而在Microsoft、SGI、

7、SAS昭儿“1在已推出的数据采掘系统中,首选的方法就是决策树方法。SAS公司的SASEnterpriseMiner⋯1,是一种通用的数据挖掘工具,通过收集分析各种统计资料和客户购买模式,帮助用户发现业务的趋势,解释已知事实,预测未来结果,并识别完成任务所需关键因素,最终实现增加收入并降低成本的目的。IBM公司的IntelligentMiner嘲,具有典型数据集自动生成、关联发现、序列规律发现、概念性分类和可视化显示等功能,可以自动实现数据选择、数据转换、数据发掘和结果显示,必要时重复这一过程。Solution公司的Cl

8、ementine提供了一个可视化的快速建模环境,由数据获取、挖掘、整理、建模和报告等部分组成。中科院计算技术研究所智能信息处理重点实验室开发的MSMiner聆1是一种多策略知识发现平台,能够提供快捷有效的数据挖掘解决方案,9山东大学硕士学位论文提供多种知识发现方法。Angoss公司的KnowledgeSEEKER是一个基于决策树的

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。