《数据挖掘》复习

《数据挖掘》复习

ID:47429976

大小:864.51 KB

页数:13页

时间:2020-01-11

《数据挖掘》复习_第1页
《数据挖掘》复习_第2页
《数据挖掘》复习_第3页
《数据挖掘》复习_第4页
《数据挖掘》复习_第5页
资源描述:

《《数据挖掘》复习》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库

1、《数据挖掘》复习一、题型1、判断题15分2、单选题15分3、简单题15分4、综合题20分5、计算题35分(C5.0算法、感知机算法、Apriori算法,见练习题)二、考试大纲三、实验/作业评讲在教学过程的各个环节,从学生的出勤、日常表现、作业、测试、项目完成情况及完成质量、TOPCARES能力目标的实现情况等方面,对学生进行全方位的考核。类别考核项目考核主要内容考核方式考核时间所占权重形成性考核出勤出勤、请假、迟到、旷课等过程考核上课期间5%日常表现是否认真听课,回答问题等过程考核上课期间5%作业

2、课堂作业的完成情况过程考核上课期间10%实习项目实践任务的完成情况机考上课期间10%终结性考核完成情况及完成质量教学内容闭卷第17周70%说明:四、知识点梳理,重点教学内容串讲名词解释数据挖掘(P6)、算法(P10)、MODELER中的节点(P13)、MODELER中的数据流(P14)、MODELER中的超节点(P18)、决策树分析(P104)、人工神经网络分析(P157)、关联分析(P207)、知识发现KDD(P6)主要概念DW产生的基础(P3)DW的基本过程包括(P6)DW能做什么(P7)DW

3、得到的知识形式(P8)DW的算法分类(P10)MODELER的主窗口由哪几部分组成(P13)MODELER中数据流中的节点主要可实现哪些功能(P15)MODELER中数据流的操作主要包括哪几步(P15)MODELER中节点工具箱含由八大选项卡组织(P15)MODELER中通常数据挖掘的基本思路包括哪些过程(P19)MODELER中从数据挖掘角度看变量有哪7大类型(P26),通过TYPE节点可以说明变量什么内容(P42)什么是“有指导学习”(P12、P104)?举例说明;决策树算法的核心问题有哪些(

4、P106)?什么是信息熵(P57、P109)?(信息熵是连续型变量分箱MDLP算法和决策树C5.0算法的核心)人工神经网络中主要有哪些网络种类(P156)神经网络中处理单元的内部结构图(P158)什么是感知机模型(P162)什么是B-P反向传播网络模型,由什么特点(P164)Apriority关联分析算法主要包括哪两大部分技术(P213)(产生频繁集、依据频繁集产生关联规则)决策树分析(P104)、人工神经网络分析(P157)、关联分析(P207)等数据挖掘方法主要用来解决什么问题(分类、预测、关

5、联等)3、算法决策树C5.0算法、人工神经网络B-P感知机算法、关联分析Apriori算法五、典型例题分析(一)判断题,在每题后面正确打勾,错误打叉有高质的原始数据,才可能有高质量的数据挖掘结果。(√)高质量数据是数据分析的前提和分析结论可靠性的保障。(√)MODELER中数据质量的探索主要包括数据缺失、数据离群点和极端值等几方面。(√)数据挖掘的结果都是正确的。(*)MODELER中数据挖掘的数据通常以变量为列、样本为行的二维表形式组织。(√)变量说明是对读入数据流中变量取值的有效性进行限定、检

6、查和修正,同时指出各个变量在未来建模中的角色。(√)变量说明应通过FieldOps选项卡中的类型(Type)节点实现。(√)样本浓缩是通过RecordOps卡中的浓缩(Distinct)节点实现。(√)样本浓缩是通过RecordOps卡中的汇总(Aggregate)节点实现。(*)数据的重新组织是通过FieldOps选项卡中的类型(Type)节点实现。(*)数据的重新组织是通过FieldOps选项卡中的重构(Restructure)节点实现。(√)数据质量的探索是通过Output卡中的表(Tabl

7、e)节点实现。(*)数据质量的探索是通过Output卡中的审核(Data Audit)节点实现。(√)网状图是一种更为生动和直观地展示两个或多个分类变量相关特征的图形。(√)决策树中,分类树实现对分类型输出变量的分类,回归树则完成对数值型输出变量取值的预测。(√)决策树中,称树的每个节点都只能生长出两个分枝的树为多叉树。(*)决策树算法中,C5.0用于生成多分支的决策树。(√)人工神经网络中,神经网络的最低层称为输入层,最顶层称为输出层,中间层称为中间层。(*)在关联分析中,与时间有关的关联分析称

8、为简单关联分析。(*)关联规则中的规则的支持度测度了关联规则的普遍性,表示项目X和项目Y同时出现的概率。(√)(二)多选题选择题,请在每题正确备选答案前面打勾(单选及多选)。(每题满分3分,全选对得3分,部分选对得2分,有选错者该题不得分)1.Modeler中(类型Type)节点的主要作用有:1)定义变量的取值范围和缺失值;2)变量取值的有效性检查和修正;3)角色说明;4)变量取值的实例化。答案:1-42.Modeler中(数据审核DataAudit)节点的主要作用有:1)对变量取

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。