欢迎来到天天文库
浏览记录
ID:5339149
大小:339.17 KB
页数:4页
时间:2017-12-08
《业务驱动型信息分析平台研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、第36卷第9期信息化研究Vo1.36No.92010年9月InformatizationResearchSep.2010业务驱动型信息分析平台研究胡细平(江苏教育学院,江苏省南京市210013)摘要:为了适应业务变更、汇总数据分析与实时业务结合的纵深数据分析、实时业务处理,快速定义并部署用户的多维查询,实现对基于数据仓库的联机分析处理。文中针对数据仓库系统实施过程中的特点,结合用户对产品功能的需求,提出“业务驱动的”实时数据处理和构建数据仓库的解决方案。平台利用数据抽取技术,对数据进行集成和加工整理,产生综合的、面向分析的数据存储,提供在分析数据基础的数据展现、分析和挖掘;实现分析
2、型应用功能和业务处理系统查询功能的直接关联,满足管理人员和业务操作人员的数据查询和统计需求。关键词:业务驱动型;数据挖掘;BI;数据仓库;ETL中图分类号:TP311O引言圈I业务探索系统I圈l业务建模系统I犀佚‘I—JII茎嚣BI(商业智能)经历了3个主要发展阶段:数据驱动型、模型驱动型、业务驱动型。从面向用户层面的不区匦圃臣圃蒜同,BI产品主要被划分为功能型、流程型2类。BI发元数据展阶段与BI产品类型的逐步形成与用户需求密切相集中数据库J]J数据仓库关,业务驱动型BI产品是当今研究的热点与难点问元题。充分挖掘信息价值,进而全面提升企业竞争力已垂至[垂蔓囹数奎换数据成为企业管理
3、者共识。管理如何结合业务活动,从海量数据中快速提取各级管理者关注的有用信息,满足各级决策者的决策需要以及各类业务的活动需要,这是目前企业迫切需要的,图1业务驱动型信息分析平台结构也是国内外BI产品提供商所面临的关键及难点问题。本文研究的主要内容是元数据管理、数据加工平台、多2元数据管理维查询建模及分析。2.1元数据的作用l业务驱动型信息分析平台的原理及结构元数据的使用M的在于识别、评价和追踪数据在业务驱动型信息分析平台是基于数据仓库理论基使用过程中的变化,以实现数据资源的有效发现、查础,利用数据抽取技术,对数据进行集成和加工整理,找、一体化组织和对数据的有效管理⋯。元数据管理产生综
4、合的、面向分析的数据存储;提供在分析数据基是平台中的基础,主要包括对异构数据源、转化与映射础的数据展现、数据分析平台;同时围绕数据抽取及展关系、数据深加工规则、完整的ETL过程、数据仓库主现的全过程提供数据管理和系统管理的基础性平台。题、多维结构等的多层面详细描述,采用XML进行描平台由数据交换平台、数据加工平台、元数据管理系述。统、多维查询建模系统、业务建模系统、业务分析系统2.2元数据管理功能设计及数据仓库、元数据资料库、模型库等构成,结构如图在数据仓库系统中,元数据管理作为数据仓库的基1所示。础,贯穿数据仓库系统的所有阶段,包括源数据库的结构、数据仓库的结构,数据加工转换的算
5、法和过程,数据收稿日期:2010-07.14;修回日期:2010-08-05。展现的算法和逻辑等。元数据提供了数据对象的准确、基金项目:国家创新基金项目(09C26213210870)。一致、全面的定义。元数据管理功能设计如表1。·46·第36卷第9期胡细平:业务驱动型信息分析平台研究·研究与设计·表1元数据管理功能FI塑=垫=塑垦I模块名称功能对数据元数据进行管理,即数据仓库中所有数据EI鍪塑壁I模型元库对象的物理结构的定义和逻辑含义的描述,数据管理提供数据元数据的录入、导人、反向生成、查看等功能。圜⋯一对数据加工转换过程、算法和调度进行管理,直Lira)图2ETL总体结构数据管
6、理h受紧曩箜程序的3.1构建ETLETL从各种异构操作数据源中抽取数据,并对抽对麓骤黧取到的数据进行转换处理,最后加载到DW(数据仓库)中的过程,是建立数据仓库的基石和灵魂,也是建2.3元数据语义描述立DW的必要步骤。数据加工平台的核心问题是元数据是对业务数据本身及其运行环境的描述与系统性能,除了运行效率之外,尤为关注数据加工质定义的数据,它是描述数据的数据J。给定形式背景量,体现为数据加工前后的来源与目标数据之间的正为一个三元组T=(O,D,R),其中O为事例集合,D为确性、完整性、一致性、完备性、有效性等。描述符(属性)集合,尺是O和D之间的一个二元关ETL平台除了具有传统ET
7、L在数据抽取、数据转系。则存在唯一的一个偏序集合与之对应,并且该偏换、数据聚合、数据装载等方面的技术实现之外,为满序集合产生一种格结构,这种由背景(O,D,R)所诱导足部分行业用户对业务数据、加工数据的高质量要求,的格称为一个概念格。格中的每个节点为一个序采取了数据分层清洗、数据逐级对比、数据审计等数据偶(称为概念),记为(Y,X),其中是幂集P(O)中的事质量控制手段,这些功能主要包含在ETL服务器的技例集合,称为概念的外延;X∈P(D)是y中所有事例术实现中。共同
此文档下载收益归作者所有