数据挖掘与商务智能总结

数据挖掘与商务智能总结

ID:14813744

大小:269.00 KB

页数:6页

时间:2018-07-30

数据挖掘与商务智能总结_第1页
数据挖掘与商务智能总结_第2页
数据挖掘与商务智能总结_第3页
数据挖掘与商务智能总结_第4页
数据挖掘与商务智能总结_第5页
资源描述:

《数据挖掘与商务智能总结》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、第一章绪论什么是数据挖掘,什么是商业智能从大型数据库中提取有趣的(非平凡的、蕴涵的、先前未知的且是潜在有用的)信息或模式。商业智能是要在必须的时间段内,把正确有用的信息传递给适当的决策者,以便为有效决策提供信息支持。分类算法的评价标准召回率recall=系统检索到的相关文件数/相关文件总数准确率precision(查准率)=系统检索到的相关文件数/系统返回的文件总数第二章数据仓库什么是数据仓库是运用新信息科技所提供的大量数据存储、分析能力,将以往无法深入整理分析的客户数据建立成为一个强大的顾客关系管理系

2、统,以协助企业制定精准的运营决策。数据仓库的基本特征1面向主题2整合性3长期性4稳定性第三章数据挖掘简介数据挖掘的一般功能1分类2估计3预测4关联分类5聚类数据挖掘的完整步骤1理解数据与数据所代表的含义2获取相关知识与技术3整合与检查数据4取出错误或不一致的数据5建模与假设6数据挖掘运行7测试与验证所挖掘的数据8解释与使用数据数据挖掘建模的标准CRISP-CM跨行业数据挖掘的标准化过程第四章数据挖掘中的主要方法基于SQLServer2005SSAS的十种数据挖掘算法是什么1.决策树2.聚类3.Bayes

3、分类4.有序规则5.关联规则6.神经网络7.线性回归8.Logistic回归9.时间序列10.文本挖掘第五章数据挖掘与相关领域的关系数据挖掘与机器学习、统计分析之间的区别与联系(再看看书整理下)32页处理大量实际数据更具优势,并且使用数据挖掘工具无需具备专业的统计学背景。数据分析的需求和趋势已经被许多大型数据库所实现,并且可以进行企业级别的数据挖掘应用。相对于重视理论和方法的统计学而言,数据挖掘更强调应用,毕竟数据挖掘目的是方便企业用户的使用。第六章SQLServer2005中的商业智能商业智能(BI)

4、的核心技术是什么数据仓库和数据挖掘第七章SQLServer2005中的数据挖掘MicrosoftSQLServerManagementStudio提供了两个用于管理数据库项目(如脚本、查询、数据连接和文件)的容器是什么?1项目2解决方案第八章SQLServer2005的分析服务什么是UDM?统一维度模型第九章SQLServer2005的报表服务什么是报表服务,其功能是一个基于服务器的完整平台,可创建、管理和交付传统报表和交互式报表。1制作报表2管理报表3提交报表第十章决策树模型什么是决策树?是数据挖掘的

5、一项主要分析工具。(决策树能从一个或多个预测变量中,针对类别因变量的选项,预测出个例的趋势变化关系等。也可以由结果来反推原因。)SQLServer2005决策树算法步骤第十一章贝叶斯分类什么是简单贝叶斯分类器是简单又使用的分类方法。SQLServer2005贝叶斯分类算法步骤第十二章关联规则什么是关联规则可解决哪些问题?是分析发现数据库中不同变量或个体间(例如商品间的关系及年龄与购买行为…)之间关系程度,并用这些规则找出顾客购买行为模式,如购买了台式计算机外设产品(打印机、音箱、硬盘…)的相关影响。发现

6、这样的规则可以应用于商品货架摆设、库存安排以及根据购买行为模式对客户进行分类。兴趣度指标的意义当兴趣度指标大于1的时候,这条规则就是比较好的;当兴趣度小于1的时候,这条规则就是没有很大意义的。兴趣度越大,规则的实际意义就越好。SQLServer2005关联规则算法步骤第十三章聚类分析什么是聚类分析聚类分析的思想与判断分析类似,同样是由样本分组,寻找到多维数据点中的差异之处。不同的地方有两点:(1)聚类分析的分类方式并不需要预先指定一个指针变量;(2)聚类分析属于一种非参数分析方法,所以并没有非常严谨的数

7、理依据,也无需假设总体为正态分布。在聚类方法中定量地描述研究对象之间的相近程度的指标两个1相似系数2距离(用的比较多)聚类分析中“类”的具有什么特征(判断)–聚类所说的类不是事先给定的,而是根据数据的相似性和距离来划分–聚类的数目和结构都没有事先假定聚类分析方法的分类1基于层次的方法2基于划分的方法k-means(K均值聚类)属于哪种聚类划分聚类的方法欧式距离的计算聚类的原则是最大化类内的相似性,最小化类间的相似性(选择)SQLServer2005聚类分析算法步骤第十四章时序聚类分析序列聚类与关联规则挖

8、掘区别是什么?•SequenceClustering:在找出先后发生事物的关系,重点在于分析数据间先后序列关系。•Association则是找出某一事件或资料中会同时出现的状态,例如项目A是某事件的一部份,则项目B也出现在该事件中的机率有a%。序列模式解决什么问题?时序聚类算法用于根据某一顺序对数据分组。•例如,Web应用程序的用户经常按照各种路径浏览网站。此算法可以根据浏览站点的页面顺序对用户进行分组,以帮助分析消费者并确定是否某个路径比

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。