2010年商业智能研究分析报告

2010年商业智能研究分析报告

ID:34468902

大小:852.33 KB

页数:31页

时间:2019-03-06

2010年商业智能研究分析报告_第1页
2010年商业智能研究分析报告_第2页
2010年商业智能研究分析报告_第3页
2010年商业智能研究分析报告_第4页
2010年商业智能研究分析报告_第5页
资源描述:

《2010年商业智能研究分析报告》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、2010年商业智能研究分析报告作者周倚平商业智能通常被理解为将企业中现有的数据(业务,财务,研发等)转化为知识,帮助企业做出明智的业务经营决策的系统架构。为了将数据转化为知识,需要利用数据仓库、联机分析处理(OLAP)工具和数据挖掘(DM)等技术。因此,从技术层面上讲,商业智能不是什么新技术,它只是数据仓库、OLAP和数据挖掘等技术的综合运用。商业智能的形成过程:采集(业务系统ERP)→组织存储(数据仓库)→分析预测(数据挖掘)→实时报表(OLAP)相对来说做商务智能和ERP最大的区别在于ERP是流程驱动,商务智能是目标驱动。看企业究竟想做什么。主

2、流产品:Cognos(IBM),SPSS(IBM),Hyperion(Oracle),BO(SAP,Crystal),Excel+SQLServer(Microsoft),Informatica,SAS主要厂商ETL:Informatica,SQLServerAnalysisServerDW:IBMDB2,Oracle,SybaseIQ,NCRTeradataOLAP:Cognos,BusinessObjects,MicroStrategy,Hyperion,IBMDataMining:IBM,SAS,SPSS第1页共31页Copyright©Zh

3、ouYi-pingMail:zyp2671@hotmail.com1.关键技术1.1.ETL过程ETL不同数据源(Oracle,DB2,SQLServer)数据仓库不同的数据(关系型数据,文档,图片,音视频)商业智能的核心内容是从许多来自企业不同的业务处理系统的数据(分布的,异构的源数据)中,提取出有用的数据,进行清理以保证数据的正确性,然后经过抽取(Extraction)、转换(Transformation)和装载(Load),即ETL过程(本质上是样本提取的过程),整合到一个企业级的数据仓库里,从而得到企业信息的一个全局视图,在此基础上利用合适

4、的查询和分析工具、数据挖掘工具等对数据仓库里的数据进行分析和处理,形成信息,甚至进一步把信息提炼出辅助决策的知识,最后把知识呈现给管理者,为管理者的决策过程提供支持。ETL特征:l以串行/并行方式,从不同异构数据源流向统一的目标数据,核心在于转换过程(关联,聚集),而抽取和装载一般可以作为转换的输入和输出。lETL元数据主要包括每次转换前后的数据结构和转换的规则。l数据同步,数据ETL是经常性的活动,按照固定周期运行,甚至实时运行。l庞大的数据量,需要ETL工具有良好的伸缩性。l流程控制和数据验证机制。下图是数据仓库/商业智能的完整的体系结构图,根

5、据数据的不同形态,整个体系被划分为四个大的层面,并根据数据的处理和应用过程再细分成七个环节。从数据源经过抽取(Extra,E)、转换(Transform,T)、装载(Load,L)过程加载到中央数据仓库,再从数据仓库经过分类加工放到数据集市(DM,DataMarket),或者将数据集市中的数据进一步存放到多维数据库(MDD,Multi-dimensionDatabase),这都属于数据组织的问题,从中间层到终端用户或从多维数据库到终端用户可将其划归为前端应用实现的问题。而贯穿整个体系数据处理环节的,是系统的流程调度控制和元数据管理。第2页共31页C

6、opyright©ZhouYi-pingMail:zyp2671@hotmail.com1.2.数据仓库(DW)按照W.H.Inmon这位数据仓库权威的说法,“数据仓库(DataWarehouse)是一个面向主题的、集成的、时变的、非易失的数据集合,支持管理部门的决策过程”。这个简短而又全面的定义指出了表明数据仓库主要特征的四个关键词:面向主题的、集成的、时变的、非易失的,将数据仓库与其他数据存储系统(如关系数据库系统、事务处理系统和文件系统)区别开来。面向主题的(subject-oriented):数据仓库围绕一些主题,如顾客、供应商、产品和销售

7、组织。数据仓库关注决策者的数据建模与分析,而不是集中于组织机构的日常操作和事务处理。因此,数据仓库排除对决策无用的数据,提供特定主题的简明视图。集成的(integrated):通常,构造数据仓库是将多个异种数据源,如关系数据库、一般文件和联机事务处理记录集成在一起。使用数据清理和数据集成技术,确保命名约定、编码结构和属性度量等指标的一致性。时变的(time-variant):数据存储从历史的角度提供信息。数据仓库中的关键结构,隐式或显式地包含时间元素。非易失的(nonvolatile):数据仓库的数据是有历史保存意义的,数据仓库的数据也只使用添加的

8、方式,进入了数据仓库的数据一般情况下是不需要更新的,这样就保证了数据的稳定性。通常,它只需要三种数据访问:数据的初始化装入

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。