数据库挖掘复习提纲

数据库挖掘复习提纲

ID:18614075

大小:86.50 KB

页数:5页

时间:2018-09-19

数据库挖掘复习提纲_第1页
数据库挖掘复习提纲_第2页
数据库挖掘复习提纲_第3页
数据库挖掘复习提纲_第4页
数据库挖掘复习提纲_第5页
资源描述:

《数据库挖掘复习提纲》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、第一章绪论(1)什么是数据挖掘(DataMining)数据挖掘是从大量数据中发现并提取隐藏在内的、人们事先不知道的但又可能有用的信息和知识的一种新技术(2)什么是商业智能BI(BusinessIntelligence)商务智能,指用现代数据仓库技术、在线分析处理技术和数据挖掘技术进行数据分析以实现商业价值。(3)分类算法的评价标准准确率(查准率)precision=系统检索到的相关文件数/系统返回到的文件总数召回率(查全率)recall=系统检索到的相关文件数/相关文件数第二章数据仓库(1)什么是数据仓库是一

2、个用以更好地支持企业(或组织)决策分析处理的、面向主题的、集成的、不可更新的、随时间不断变化的数据集合。本质上和数据库一样,是长期储存在计算机内的、有组织、可共享的数据集合。(2)数据仓库的基本特征1.面向主题2.整合性3.长期性4.稳定性第三章数据挖掘简介(1)数据挖掘的一般功能1.分类2.估计3.预测4.关联分组5.聚类(2)数据挖掘的完整步骤1.明确挖掘任务2.对所选择数据进行预处理3.选择具体的算法进行挖掘4.对挖掘出的模式进行评价5.消减重复部分6.展现最终的结果(3)数据挖掘建模的标准CRISP-

3、CM(跨行业数据挖掘的标准化过程)第四章数据挖掘中的主要方法(1)基于SQLServer2005SSAS的十种数据挖掘算法是什么1.决策树2.聚类3.Bayes分类4.有序规则5.关联规则6.神经网络7.线性回归8.Logistic回归9.时间序列10.文本挖掘第五章数据挖掘与相关领域的关系(1)数据挖掘与机器学习、统计分析之间的区别与联系相对于统计分析而言,数据挖掘有下列几项新特点:处理大量实际数据更具优势,并且使用数据挖掘工具无需具备专业的统计学背景数据分析的需求和趋势已经被许多大型数据库所实现,并且可以

4、进行企业级别的数据挖掘应用相对于重视理论和方法的统计学而言,数据挖掘更强调应用,毕竟数据挖掘目的是方便企业用户的使用。第六章SQLServer2005中的商业智能(1)商业智能(BI)的核心技术是什么:数据仓库技术和数据挖掘第七章SQLServer2005中的数据挖掘MicrosoftSQLServerManagementStudio提供了两个用于管理数据库项目(如脚本、查询、数据连接和文件)的容器是什么?答:项目和解决方案第八章SQLServer2005的分析服务什么是UDM?答:统一维度模型第九章SQLS

5、erver2005的报表服务(1)什么是报表服务,其功能ReportingServices是一个基于服务器的完整平台,可创建、管理和交付传统报表和交互式报表。它包括创建、分发和管理报表所需的一切工具和信息。同时,产品的标准模块化设计和应用程序编程接口(API)是软件开发人员、数据提供商和企业能够继承所有系统或第三方应用程序中的报表功能。功能:Ø可以基于关系、多维和XML数据源。Ø提供了表格、矩阵、图表和自由格式的报表布局。Ø支持即席报表。Ø钻取报表和交互性。Ø支持参数化报表。Ø提供多种显示格式。Ø支持自定义控

6、件或报表项。Ø提供导航功能。Ø提供聚合功能。Ø支持图形元素。第十章决策树模型(1)什么是决策树?决策树是数据挖掘的一项主要分析工具。决策树能从一个或多个预测变量中,针对类别因变量的选项,预测出个例的趋势变化关系等。也可以由结果来反推原因。第十一章贝叶斯分类(1)什么是简单贝叶斯分类器简单贝叶斯分类器(NaïveBayesClassifier),主要的运作原理,是通过训练样本,举习记忆分类根据所使用属性的关系,产生这些训练样本的中心概念,再用学习后的中心概念对未归类豹数据对象,进行类别预测,以得到受测试数据对象

7、的目标值。每只训练样本,一般含有分类相关联属性的值,及分类结果(称为目标值)。第十二章关联规则(1)什么是关联规则可解决哪些问题?关联规则是分析发现数据库中不同变量或个体间(例如商品间的关系及年龄与购买行为……)之间关系程度,并用这些规则找出顾客购买行为模式,如购买了台式计算机对购买其他计算机外设产品(打印机、音箱、硬盘……)的相关影响。发现这样的规则可以应用于商品货架摆设、库存安排以及根据购买行为模式对客户进行分类。(2)兴趣度指标的意义Interesting当兴趣度大于1的时,这条规则就是比较好的;当兴趣

8、度小于1的时候,这条规则就是没有很大意义的。兴趣度越大,规则的实际意义就越好。第十三章聚类分析(1)什么是聚类分析聚类分析(Clusteranalysis)是一种分类的方法,目的在将相似的事物归类。可以将变量分类,使同一类中的事物相对于某些变置来说是相同的,相似的或是同质的。而类与类之间确有着显著的差异或是异质性。(2)在聚类方法中定量地描述研究对象之间的相近程度的指标答:相似系数和距离(3)聚类分

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。