欢迎来到天天文库
浏览记录
ID:41375923
大小:616.76 KB
页数:31页
时间:2019-08-23
《商务智能之二商务智能过程》由会员上传分享,免费在线阅读,更多相关内容在应用文档-天天文库。
1、目录引言商务智能过程数据仓库商务智能应用构建商务智能环境关联规则分类分析聚类分析概念描述商务智能过程是一个多步骤的处理过程,一般可分为六个步骤:问题定义、数据选择、数据预处理、数据转化、数据挖掘和知识解释/评估数据转化后的数据预处理后的数据模式知识目标数据123451数据选择2数据预处理3数据转化4数据挖掘5知识解释/评价一开始是在基本业务数据层面进行数据处理,用于对日常运作的信息处理和汇总。进一步,在业务数据库的基础上,通过数据抽取、汇总和转换形成数据仓库,并进一步进行分析。在数据仓库的基础上
2、,可以采用数据挖掘技术进行知识发现。商务智能过程数据库与事物处理数据仓库与在线分析处理知识发现与可持续竞争优势小结及练习目录数据管理经历了三个阶段:自由管理,文件管理和数据库管理自由管理文件管理数据库管理自由管理和文件管理方式在数据存储结构上的标准化程度很低,不足以支撑数据的综合性管理和应用,而数据库是以一定的组织方式存储在一起的相关数据的集合。数据库是“按照数据结构来组织、存储和管理数据的仓库”,数据库概念的两个主要目标是减少数据冗余(数据共享性)和获得数据独立性。获得数据独立性:数据独立性指
3、两个方面,即数据与数据间的独立性及数据与处理间的独立性。前者指对于某些数据的更新,不影响与其不相关的其他数据,后者是指对某些数据的更新,不影响处理该数据的应用程序。减少数据冗余:数据冗余指数据重复,即同样的数据存储在多个文件中,冗余数据意味着相同事实的重复,如果对这些相同的事实进行多处修改时发生错误,使它们的值不等时,很难判断哪个值是正确的。数据库概念主要目标数据库管理系统(DBMS)是一种操纵和管理数据库的软件,用于建立、使用和维护数据库。它对数据库进行统一的管理和控制,以保证数据库的安全性和
4、完整性。用户通过DBMS访问数据,管理员通过DBMS修改数据程序程序程序模式维护查询数据维护事物管理器“查询”处理器存储管理器数据元数据DBMSDBMS以特定的结构化方式来管理和保存数据DDL编译器DML编译器嵌入型DML预编译器查询运行核心程序授权和完整性管理器事物管理器文件管理器缓冲区管理器使用数据库环境来管理数据,具有很多方面的优势123456集中管理数据降低系统复杂性剔除包含复杂数据的孤立文件减少数据的冗余和不一致通过集中控制来管理数据的混乱将数据逻辑视图和物理视图分开,降低程序和数据间
5、的依赖性允许对信息进行定制查询,增强了适应性提升了信息存取和利用的可能性OLTP(OnlineTransactionProcessing)在线事物处理,也称为面向交易的处理系统,其基本特征是顾客的原始数据可以立即传送到计算中心进行处理,并在很短的时间内给出处理结果OLTP应用领域记录来自销售点终端或通过网站输入的订单(在线订票)当库存量降到指定级别时,订购更多的货物在制造厂中将零部件组装为成品时对零部件进行跟踪。记录雇员数据OLTP特征支持大量并发用户定期添加和修改数据反映随时变化的单位状态面对
6、的是事物操作人员和底层管理人员处理的数据高度结构化,涉及的事务比较简单,访问路径已知商务智能过程数据库与事物处理数据仓库与在线分析处理知识发现与可持续竞争优势小结及练习目录OLTP解决业务自动化和信息查询的基本需求,但在资源开发和利用的分析处理层面上则无能为力,这样就要求建立一个面向分析的,集成保存大量历史数据的新型数据管理机制-----数据仓库(DW)信息处理的任务包括信息获取信息传递(信息获取反过程)信息创造(涉及到对信息进行加工)信息存储信息通信事物处理和分析处理都是信息创造的过程,事物处
7、理时统计报表和数据查询,分析处理则是对信息的分析,涉及到信息的切分,多维化,前推和回溯,以及回答what-if问题。常见的分析处理应用如多维视图,预测,敏感性分析和成本控制等,由于这类应用随着网络的发展而更为强大,因此称之为在线分析处理(OLAP)OLAP与OLTP之间的关系客户数据库产品数据库数据仓库路由器数量改变改变产品价格添加供应商改变还款期限数据数据是否有替代品可用库存是否可控投资是否达到年度预算数据仓库是把一个组织中的历史数据收集到一个中央仓库中以便于处理,是当今信息管理中的主流趋势之
8、一,是OLAP应用的环境和基础。相比传统的数据库,数据仓库具有四个重要特征数据仓库根据主题域来组织和提供数据,使用标准化的面向业务的数据并不可行,根据主题的数据必须是多种多样的,并且是基于决策者的角度来组织和提供数据的。面向主题面向事物处理的操作型数据库,为了提高应用程序访问数据的效率是面向事物处理任务,但造成系统之间相互独立。而数据仓库中的数据是对原有分散的数据库进行数据抽取、清理的基础上经过系统加工、汇总和整理后实现数据的集成,消除了源数据中的不一致性。集成的操作性数据库中的数据是实时更新的
此文档下载收益归作者所有