高职招生数据挖掘的过程模型构建

高职招生数据挖掘的过程模型构建

ID:31380090

大小:111.00 KB

页数:8页

时间:2019-01-09

高职招生数据挖掘的过程模型构建_第1页
高职招生数据挖掘的过程模型构建_第2页
高职招生数据挖掘的过程模型构建_第3页
高职招生数据挖掘的过程模型构建_第4页
高职招生数据挖掘的过程模型构建_第5页
资源描述:

《高职招生数据挖掘的过程模型构建》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、高职招生数据挖掘的过程模型构建  摘要:为了从历年积累下来的大量招生数据中获得有价值的信息,根据相关数据挖掘的理论知识,在目前现有的通用数据挖掘过程模型的基础上,结合高职院校招生工作及其数据的特点,给出一个高职招生数据挖掘过程模型的构建思路。该数据挖掘的过程模型可以为接下来的高职招生数据挖掘工作提供宏观上的指导和工程化的方法。  关键词:数据挖掘;过程模型;招生数据;高职院校  中图分类号:TP311.13文献标志码:A文章编号:1006-8228(2015)08-78-03  Constructofhigh

2、ervocationalenrollmentdataminingprocessmodel  HuangChunhua  (TalentInternationalCollege,Qinzhou,Guangxi535000,China)  Abstract:Inordertoobtainthevaluableinformationfromthemassiveenrollmentdataaccumulatedovertheyears,accordingtotherelatedtheoryofdatamining,o

3、nthebasisofthecurrentlyuniversaldataminingprocessmodelandcombinedwiththecharacteristicofhighervocationalenrollmentworkandrelateddata,aconstructionideaofhighervocationalenrollmentdata8miningprocessmodelisproposed,whichcouldprovidethemacroguidanceandtheproces

4、singmethodforthenexthighervocationalenrollmentminingdatawork.  Keywords:datamining;processmodel;enrollmentdata;highervocationalcollege  0引言  招生工作一直是高职院校最重要的工作,因为生源是其生存之本。如何有针对性地开展招生工作,既能提高新生报到率,又能节省招生成本,一直是高职院校非常关心的问题之一。通过对学校历年保存下来的招生数据进行挖掘与分析,从中找到有价值的信息,以此

5、来指导学校的招生工作,让学校将有限的人力物力用在能“产出”大量生源的地区,达到招生效益最大化。  数据挖掘(DataMining)又称为数据库中知识发现(KnowledgeDiscoveryfromDatabase,简称KDD),它是一个从大量数据中抽取挖掘出未知的、有价值的模式或规律等知识的复杂过程,简单地讲就是从大量数据中抽取或挖掘出知识[1]。为了确保数据挖掘工作能有条不紊地实施并取得成功,必须先明确挖掘过程将采取什么样的步骤、每一步需要做什么、达到什么样的目标等,即在实施数据挖掘工作之前必须先构建好数

6、据挖掘的过程模型。本文根据相关数据挖掘的理论知识,在现有的通用数据挖掘的过程模型基础上,结合高职招生工作及其数据的特点,给出一个高职招生数据挖掘过程模型的构建思路。  1数据挖掘的过程模型8  构建数据挖掘的过程模型旨在为接下来的数据挖掘工作提供宏观上的指导和工程化的方法,以使人们能更好地研究、开发和使用数据挖掘技术。目前现有的数据挖掘系统大致分为两种通用的过程模型,一种是1996年由Fayyad等人提出的Fayyad过程模型,另一种是1999年由欧盟机构联合起草的CRISP-DM过程模型。  1.1Fayy

7、ad过程模型    图1Fayyad数据挖掘的过程模型  Fayyad过程模型将数据库中的知识发现看作是一个多阶段的处理过程,它从数据集中识别出以模式的形式来表示的知识,在整个知识发现的过程中包含很多个处理步骤,各个步骤之间相互影响并反复调整,从而形成一个螺旋式的上升过程[1],如图1所示。由图1可知,Fayyad过程模型分为数据准备、数据挖掘以及结果表达和解释三个阶段。  Fayyad过程模型是一个从数据入手以知识结束的偏技术模型,在实际应用中该模型存在着两个问题[1]。①该模型是从数据入手的,而忽略了具体

8、业务问题的确定,即没有明确对挖掘业务的认识和对数据的理解,而这是决定过程模型质量非常重要的一步。②该模型是结束于知识的,但对于知识应当怎么使用,如何支持决策等问题却没有得到反映。只有当挖掘出来的模型得到了一定的应用,才能更好地体现出数据挖掘的价值。  1.2CRISP-DM过程模型  CRISP-DM(Cross-IndustryStandardProcessforData8Mining,跨行业数据

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。