数据挖掘在毕业论文成绩管理中的应用研究

数据挖掘在毕业论文成绩管理中的应用研究

ID:21292024

大小:61.00 KB

页数:9页

时间:2018-10-21

数据挖掘在毕业论文成绩管理中的应用研究_第1页
数据挖掘在毕业论文成绩管理中的应用研究_第2页
数据挖掘在毕业论文成绩管理中的应用研究_第3页
数据挖掘在毕业论文成绩管理中的应用研究_第4页
数据挖掘在毕业论文成绩管理中的应用研究_第5页
资源描述:

《数据挖掘在毕业论文成绩管理中的应用研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、数据挖掘在毕业论文成绩管理中的应用研究:数据挖掘技术自产生以来,己经被广泛应用于多种领域,并得到了充分的验证,显示了其重要的经济和社会价值。利用数据挖掘技术快速而准确的提取有价值的教学信息,提高毕业论文教学质量是一项系统工程。研究目的在于探索如何在当前的教学条件下提高学生毕业论文教学质量,及时发现对教学管理有用的知识,并将这些知识应用于本科学生毕业论文教学工作实践中,为学校管理者提供有用的信息,进而获得更好的管理效益。  关键词:数据挖掘;决策树;C4.5算法;教学管理;高校教学  :TP391:A:1009-3044(2012)30-7150-04  随着数字信息化社会的飞速发展,计算

2、机技术和数据库管理系统被广泛应用于科学探索、商业、金融业、电子商务、企业生产等各种行业,已逐渐发展成为一种智能管理过程。数据挖掘作为一种新兴的数据分析技术,它的研究成果取得了令人瞩目的成就[1]。利用数据库技术,通过对教务管理的大量数据进行多层次、多维度的加工处理,从而实现人性化管理,为科学决策提供支持。  毕业论文在教学体系中占有十分重要的位置,是本科生培养计划中衡量教学质量的重要指标。提高毕业论文教学质量是一项系统工程,为研究在当前的教学条件下如何提高毕业论文教学质量,本文采用数据挖掘技术对影响毕业论文成绩管理的多方面因素进行了深入分析和挖掘,以期发现对学校毕业论文教学管理有用的知识

3、,将这些知识应用于本科学生毕业论文教学实践中,为学校管理者提供有用的信息,进而获得更好的管理效益,为学校未来的发展提供更广阔的空间,发挥重要的作用。  1数据挖掘简介  数据挖掘(DataMining),又称数据库中的知识发现(KnowledgediscoveryinDatabase.KDD)[2],是通过分析每一个具体数据,从大量的、有噪声的、模糊的、随机的海量数据中寻找其规律的技术,它是数据库研究中的一个很有应用价值的新领域。  1.1数据挖掘的定义  H包含如下功能:  综上所述,数据挖掘具有三大特点:其一是处理大型数据;其二应用数据挖掘的目的是发现未知的、有意义的模式或规律;其三

4、是一个对大量数据处理的过程,有特定的步骤[3]。  1.2数据挖掘的主要方法  数据挖掘是一个多学科交叉领域,它由人工智能、机器学习的方法起步,并与统计分析方法、模糊数学和可视化技术相融合,以数据库为研究对象,围绕面对应用,为决策者提供服务。  数据挖掘的方法主要可分为六大类:统计分析方法、归纳学习方法、仿生物技术、可视化技术、聚类方法和模糊数学方法。归纳学习法是目前重点研究的方向,本文根据给定的训练样本数据集,采用归纳学习法中的决策树技术构造分类模型,将事例分类成不同的类别。  2决策树算法基本理论  2.1决策树方法介绍  决策树[4]方法是以事例学习为基础的归纳推算法,着眼于从一组

5、无序的,无规则的事例中推断出类似条件下会得到什么值这类规则的方法,它是一种逼近离散值函数的方法,也可以看作一个布尔函数[5]。决策树归纳方法是目前许多数据挖掘商用系统的基础,可以应用于分析数据,同样也可以用来作预测。建模过程中,即树的生长过程是不断的把数据进行切分,采用“自顶向下,分而治之”的方法将问题的搜索空间划分为若干个互不交叉的子集,通常用来形成分类器和预测模型。如图1所示,为决策树的示意图。  决策树一种类似流程图的树形结构,是一种知识的表现形式。为了对未知样本进行分类,生成具体的分类规则,信息样本的各个属性值要在决策树上进行测试。主要分为两个阶段:在第一阶段中生成树。决策树最上

6、面的节点为根节点,是整个决策树的开始,然后递归的进行数据分区,每次切分对应一个问题,也对应着一个节点;在第二阶段中对树进行修剪,此过程中去掉一些可能是噪音或异常的数据,防止决策树的过匹配,进而保证生成决策树的有效性和合理性。当一个节点中的所有数据都属于同一类别,或者没有属性可以再用于数据进行分割时,分割工作停止。具体的工作流程如图2所示。  2.2C4.5算法  1986年RossQuinlan首次提出了ID3决策树算法,它是最早的决策树算法之一。ID3算法运用信息熵理论,选择当前样本中具有信息增益值的属性作为测试属性,对样本的划分则依据测试属性的取值[6]。C4.5算法是在ID3算:数

7、据挖掘技术自产生以来,己经被广泛应用于多种领域,并得到了充分的验证,显示了其重要的经济和社会价值。利用数据挖掘技术快速而准确的提取有价值的教学信息,提高毕业论文教学质量是一项系统工程。研究目的在于探索如何在当前的教学条件下提高学生毕业论文教学质量,及时发现对教学管理有用的知识,并将这些知识应用于本科学生毕业论文教学工作实践中,为学校管理者提供有用的信息,进而获得更好的管理效益。  关键词:数据挖掘;决策树;C4.5算法;教学管理;高

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。