2016商务智能复习

2016商务智能复习

ID:47313086

大小:2.97 MB

页数:10页

时间:2020-01-10

2016商务智能复习_第页
预览图正在加载中,预计需要20秒,请耐心等待
资源描述:

《2016商务智能复习》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库

1、2016合工大商务智能复习概念:数据仓库;粒度;数据仓库模型;聚类;关联规则及频繁项集;核函数;距离度量;多维分析;OLAP及OLTP;数据预处理;ETL;元数据及其类型;KDD;特征选择方法;熵的计算;众数;数据清理;数据增长管理技术;ID3算法;文本挖掘及应用;电子商务环境下的商务智能;决策树;数据挖掘;空缺值处理方法;遗传算法特点;K-均值算法及聚类;Web及Web挖掘;题型:选择;填空;名词解释;简答;综述;1数据仓库:数据仓库是面向主题的、集成的、稳定的、随时间变化的数据集合,用以支持管

2、理决策。数据仓库事务型处理:即操作型处理,是指对数据库的联机操作处理OLTP。事务型处理是用来协助企业对响应事件或事务的日常商务活动进行处理。它是事件驱动、面向应用的,通常是对一个或一组记录的增、删、改以及简单查询等。在事务型处理环境中,数据库要求能支持日常事务中的大量事务,用户对数据的存取操作频率高而每次操作处理的时间短。分析型处理:用于管理人员的决策分析。它帮助决策者分析数据以察看趋向、判断问题。分析型处理经常要访问大量的历史数据,支持复杂的查询。分析型处理过程中经常用到外部数据,这部分数据不

3、是由事务型处理系统产生的,而是来自于其他外部数据源。多库系统的限制可用性:源站点或通信网络故障将导致系统瘫痪,源站点不能通过网络在线联入多库系统。响应速度:全局查询多级转换和通信传输,延迟和低层效率影响响应速度。系统性能:总体性能取决于源站点中性能最低的系统,影响系统性能的发挥;系统开销:每次查询要启动多个局部系统,通信和运行开销大实施数据仓库的条件数据积累已达到一定规模面临激烈的市场竞争在IT方面的资金能得到保障数据仓库性质面向主题:数据仓库中的数据是按照各种主题来组织的。面向主题的数据组织方式

4、可在较高层次上对分析对象的数据给出完整、一致的描述,能完整、统一的刻画各个分析对象所涉及的企业的各项数据以及数据之间的联系,从而适应企业各个部门的业务活动特点和企业数据的动态特征,从根本上实现数据与应用的分离。集成性:数据仓库中的数据是从原有分散的源数据库中提取出来的,其每一个主题所对应的源数据在原有的数据库中有许多冗余和不一致,且与不同的应用逻辑相关。为了创建一个有效的主题域,必须将这些来自不同数据源的数据集成起来,使之遵循统一的编码规则。稳定性:数据仓库内的数据有很长的时间跨度,数据仓库中的数

5、据反映的是一段时间内历史数据的内容,是不同时点的数据库快照的集合,数据仓库中的数据是不可实时更新的。时变性:数据仓库必须不断捕捉OLTP数据库中变化的数据,生成数据库的快照,经集成后增加到数据仓库中去;另外数据仓库还需要随时间的变化删去过期的、对分析没有帮助的数据,并且还需要按规定的时间段增加综合数据。数据仓库的技术要求:复杂分析的高性能体现,对提取出来的数据进行集成,对进行高层决策的最终用户的界面支持。数据仓库系统的组成:n源数据:数据仓库中的数据来源于多个数据源,它不仅可以是企业内部的关系型数

6、据库,还包括非传统数据,如文件、HTML文档等。n数据仓库管理系统:元数据库及元数据管理部件:元数据库用来存储由定义部件生成的关于源数据、目标数据、提取规则、转换规则以及源数据与数据仓库之间的映射信息等。数据转换部件:该部件把数据从源数据中提取出来,依定义部件的规则将不同数据格式的源数据转换成数据仓库的数据格式并装载进数据仓库。数据集成部件:该部件根据定义部件的规则、统一各源数据的编码规则,并净化数据,根据元数据中定义的数据组织形式对数据进行汇总、聚合计算。数据仓库管理部件:它主要用于维护数据仓库

7、中的数据,备份、恢复数据以及管理数据的安全权限问题。n数据仓库前端工具集查询/报表工具:以图形化方式和报表方式显示数据,帮助了解数据的结构、关系以及动态性。OLAP工具:通过对信息的多种可能的观察形式进行快速、一致和交互性的存取,便于用户对数据进行深入的分析和观察。数据挖掘工具:从大量数据中挖掘出具有规律性的知识,以及数据之间的内在联系。前端开发工具:提供用户编程接口,便于在现有系统的基础上进行二次开发,增强系统的伸缩性。n数据仓库:在数据仓库系统中,数据仓库是一个数据存储集合,它的存储形式通常有

8、多维数据库,关系型数据库及其他存储方式。2粒度:对数据仓库中的数据综合程度高低的一个度量,它既影响数据仓库中的数据量的多少,也影响数据仓库所能回答询问的种类。粒度越小,综合程度越低,回答查询的种类越多;粒度越高,综合程度越高,查询的效率也越高。在数据仓库中可将小粒度的数据存储在低速存储器上;大粒度的数据存储在高速存储器上。3数据仓库模型:概念模型,逻辑模型,物理模型。由于大多数商务数据是多维的,但传统的数据模型表示三维以上的数据有一定困难。概念模型简化了这个过程并且允许用户与开发者

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。