自适应数据仓库系统的研究与实现

自适应数据仓库系统的研究与实现

ID:36807738

大小:5.60 MB

页数:113页

时间:2019-05-15

自适应数据仓库系统的研究与实现_第1页
自适应数据仓库系统的研究与实现_第2页
自适应数据仓库系统的研究与实现_第3页
自适应数据仓库系统的研究与实现_第4页
自适应数据仓库系统的研究与实现_第5页
资源描述:

《自适应数据仓库系统的研究与实现》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、摘要数据仓库的创建与应用是企业信息化发展的必由之路。近十年来,为满足历史数据管理与决策支持的目的,在世界各地出现了大量的、不同规模的数据仓库系统,同时也门益暴露出数据仓库与生俱来的反生命周期的特点与当前流行的软件51:发方法之间的矛盾。当前,数据仓库技术面临这样的紧迫问题:在数据仓库创建伊始,数据仓库系统无法辅助用户精确定义业务元数据(用于确定维一指空间)与聚集元数据(用于确定聚集空I刨);在软件运行过程中,不能够自动捕狄用户需求的变化而做出反应:无法在更大范围内分布式处理数据仓库实体化时的繁重负载:无法在更大范围内分布式处理

2、数据仓库使削过程中的金询负载。鉴于此,本文以数据仓库系统面临的问题与矛盾为研究背景,以巾田人民银行大连资金清算中心清分信息服务系统、人连国际合作集团决策支持系统、中国人寿保险公司大连分公司营销决策支持系统评估与规划等三个项目为应用背景,以强化数据仓库系统的自适应性、在数据仓库系统中进行聚集优化和度量数据仓库用户适用度,得到一个自适应的数据仓库系统为目的,利用数据仓库技术、数据仓库质量、CORBA结构以及Agent技术,重点研究了以下内容:(1)为达到降低软件系统丌发成本、提高组件重用性、在较大范围内实现平衡负载与分_lj运算的

3、目的,赋予数据仓库体系结构主动性、持久性、智能性的能力,本文利用CORBA技术、Agent技术与Java编程语言,研究并实现了数据仓库自适应体系结构。它足‘种能够接受多种有效组件,可实现组件的即插即用,并支持多种操作系统平台、数据库平台与网络平台,可方便的实现组件与数据仓库自适应体系结构之间、组件与组件之间以及组件与用户之间的通信,在Agent的支持下,实现了在一定范围内按照‘定的规范分布计算、负载平衡与自我调整的新型智能数据仓库体系结构。该体系结构由组佴,系列、数据库系列、质量系列、服务系列与维护系列的多种Agent与服务器

4、软件组成,全面吸收和利用了当前有效的软件丌发技术与组件重用技术,尤其在组件调用上突破了组件对象引用时,必须利用对象标志进行连接,以及简单的名字服务的局限性,在更大的范围内实现了负载平衡与分布计算。(2)为适应数据仓库的个性化要求,响应用户对数据仓库的需求,本文基于现有产品的数据仓库优化功能,提出了数据仓库聚集方案最优寻径算法,与数据仓库聚集方案自身优化算法,研究并实现了数据仓库聚集优化。对于在用户的频繁使用之下的数据仓库系统,肖务之急是通过机器学习,利用专有软件系统经常性或阶段性地、主动地对数据仓库的元数据进行修正,以使数据仓

5、库系统能够在最好的时间复杂性与空间复杂性上响应用户的需求,从而提高数掘仓库系统的执行效率,延长数据仓库系统的生命周期。本文在对数据仓库优化给出全面的介绍之后,详细讨论了聚集优化的解决方案与实现办法。在聚集优化的实现当中,本文基于原聚集方案关系图,提出了一种聚集方案最优寻径算法与自身优化算法,从而得到一个聚集代价较低,又能够满足当前用户需求的聚集力‘案实体化集合。(3)为量化用户对数据仓库的需求,本文引进了数据仓库质量的概念,经过对其深入的应用,建萨了较为完备的数据仓库质量体系结构,研究并实现了数据仓库数据使用质量。数据仓库数据

6、使用质量是数据仓库对用户的最佳适用度。数据仓库数据使用质量本身是一个主观性的问题,要使之发挥相应的作用就必须量化质量,使其具有多个指标和决定冈素,以便于综合评判。因此,本文就数据仓库数据使用质量进行了深入的研究与分析,给出了获取数据仓库聚集方案用户适用度的解决方案。(4)本文研究并得到了一种自适应数据仓库系统的实现模型,利用CORBA技术、Agent技术、数据仓库技术、OLAP技术,基于数据仓库自适应体系结构,借助数据仓库数据使用质量,利用数据仓库聚集优化技术,得到了一个能够自动采集用户需求并更新数据仓库元数据、平衡采集负载与

7、使用负载,有效响应用户需求的新型数据仓库系统。综上所述,本文扩展了传统的数据仓库体系结构,利用CORBA结构、Agent技术,赋予了数据仓库系统持续、主动、智能性工作的能力,为数据仓库系统持续、主动、智能地在运行念进行数据仓库系统自身优化提供了基础,丰富了CORBA结构的组件调用万式,增强了数据仓库系统在更大范围内分布计算与平衡负载的能力;基于数据仓库聚集方案的空问复杂度、时剧复杂度、用户期望度、用户适用度、聚集闽值以及查询闽值,基于贪心算法原理,提出了聚集方案自身优化算法与聚集方案最优寻径算法,提高了数据仓库聚集优化的能力;

8、引进数据仓库质量思想,给出了一般的数据仓库数据使用质量的质量日标、质量要素以及质量标准,给出了数据仓库数据使用质量(即用户适用度)的测算方法;基于以k三点,文章给出了白适应数据仓库系统的实现模型,并基于MSOLAPServices2000给出了实现案例。自适应数据仓库系统的提

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。