青大《数据仓库数据挖掘》作业

青大《数据仓库数据挖掘》作业

ID:34845276

大小:413.50 KB

页数:5页

时间:2019-03-12

青大《数据仓库数据挖掘》作业_第1页
青大《数据仓库数据挖掘》作业_第2页
青大《数据仓库数据挖掘》作业_第3页
青大《数据仓库数据挖掘》作业_第4页
青大《数据仓库数据挖掘》作业_第5页
资源描述:

《青大《数据仓库数据挖掘》作业》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、2012春《数据仓库与数据挖掘》复习提纲1、商务智能【参考:BI是一种解决方案,它的目的是把用户积累下来的、大量的数据转化为业务容易理解的信息,进而辅助决策。】2、Kimball对数据仓库的定义【参考:DW仅仅是构成它的数据集市的联合。】3、Inmon对数据仓库的定义【参考:一个面向主题的、集成的、随时间变化的、非易逝的用于支持管理的决策过程的数据集合。】4、ETL【参考:数据的提取、转换和装载,预处理数据并装在DW中。】5、数据仓库总线矩阵【参考:该矩阵将公司业务过程映射到参与这些过程的实体或对象。矩阵的每一行对应一个业务过程,每一列描述对象,它们参与了各种业务过程。】矚慫润厲钐瘗睞枥庑赖。

2、6、事实【参考:对一些事件发生结果的度量。】7、维度【参考:维度是维度模型的基础,用来描述业务的对象。】8、粒度【参考:事实表中包含信息的详尽程度。】9、维度模型【参考:由一个中心事实表(或者多个事实表)和与其相关的维度构成。事实表位于中心,而所有维度表环绕在其周围,类似于星形结构,因此又把维度模型称为星形模式。】10、业务过程维度模型【参考:关于一个业务过程所有的维度模型的集合。】11、多维数据集(又称为数据立方体)由维度和一个或多个度量组构成的多维分析结构,用于OLAP12、部署【参考:将多维数据集的定义发布到OLAP服务器上的过程。】13、OLAP联机分析处理采用多维数据结构和层次结构作

3、为导航,探查汇总数据,辅助决策。14、代理键【参考:对于DW/BI系统,需要在数据仓库数据库中建立一组与事务处理源系统中的键分离开来的全新的键,称这种键为代理键。】独立于业务键的用于数据仓库中的从ETL中的人工键15、渐变维度【参考:属性值可以改变的维度。分为值的改变需要跟踪和不需要跟踪两种。】16、聚合【参考:经过预先计算后形成的汇总表,主要目标是用来改进查询性能。】17、星型模型【参考:由一个事实表和多个维度表构成的模型。事实表与维度表是1对多关系。事实表位于中心,而所有维度表环绕在其周围,类似于星形结构。】聞創沟燴鐺險爱氇谴净。18、雪花模型【参考:雪花模型是将维度表中的字段和查找表相连

4、接而得到的结果。】19、事实星座模型由多个星型模型或雪花模型通过共享维度形成的多事实表多维度表的模型20、多维数据库【参考:采用多维数据组存储数据,主要应用于OLAP服务器的数据存5/5储结构。】1、SQLServer2005的维度层次2、SQLServer2005的属性层次SQLServerAnalysisService默认为每个维度每个属性构成的单层结构残骛楼諍锩瀨濟溆塹籟。3、数据挖掘【参考答案:从海量数据中提取有趣模式或知识(有趣是指:隐含的、非平凡的、事先未知的、潜在有用的)】酽锕极額閉镇桧猪訣锥。4、数据挖掘的两大类通用功能【参考答案:描述型数据挖掘和预测型数据挖掘。前者用于刻画数

5、据集的一般特征,后者对现有数据进行推演以用于新实例(某个属性的取值)的预测。】彈贸摄尔霁毙攬砖卤庑。5、OLAM【参考答案:On-LineAnalyticalMining,联机分析挖掘,将OLAP与数据挖掘相互融合进行数据探查分析,是未来基于数据仓库的数据分析的一种趋势】謀荞抟箧飆鐸怼类蒋薔。6、简单了解关联分析(又称为关联规则挖掘或购物篮分析)、分类、回归、聚类分析的功能关联分析:发现交易数据库中不同商品(项)之间的联系分类:预测离散属性的取值回归:预测连续属性的取值聚类分析:将数据分类到不同的类或者簇7、数据仓库各环节工具(如ETL)的市场占有率最高的公司【参考:(1)OLAP市场,微软第

6、一;(2)ETL市场三大主流:Powercenter(美国Information公司)—ETL市场老大;DataStage(IBM公司);ETLAutomation(数据仓库(引擎)老大美国Teradata公司)。DI(DataIntegrator(BO公司)厦礴恳蹒骈時盡继價骚。8、数据库和数据仓库的区别【参考答案:(1)应用目的不同:数据库主要用于构建联机事务处理(OLTP)系统,这种系统自己产生新数据,每次事务处理涉及的记录数较少,通常为几条;而数据仓库主要用于构建分析型决策支持系统,这种系统自己不产生新数据,所使用的数据来自于OLTP系统或其他数据源。(2)数据的时间跨度不同:数据库通

7、常存放较新的业务数据;而数据仓库中存放的是历史业务数据,其时间跨度为5~10年。(3)数据的业务范围不同:数据库系统通常关注局部业务范围的事务处理;数据仓库通常要关注整个企业的全部业务。(4)所采用的设计技术不同:数据库面向事务,采用三范式(3NF)建模;数据仓库则面向主题,采用三范式(3NF)或维度模型建模。(5)注重的技术不同:数据库系统存在大量的数据查询和数据更新,需要重点考虑包括数据更新和

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。