数据仓库相关技术研究综述

数据仓库相关技术研究综述

ID:21430343

大小:61.00 KB

页数:10页

时间:2018-10-22

数据仓库相关技术研究综述_第1页
数据仓库相关技术研究综述_第2页
数据仓库相关技术研究综述_第3页
数据仓库相关技术研究综述_第4页
数据仓库相关技术研究综述_第5页
资源描述:

《数据仓库相关技术研究综述》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、数据仓库相关技术研究综述:该文给出了数据仓库的定义,通过对相关文献的研究,给出了普通数据仓库和空间数据仓库的构建方法,研究了数据仓库的关键技术,包括数据仓库的粒度、查询、维护、集成等方法,文章还就数据仓库的应用进行了深入的研究,最后进行了总结与展望。  关键词:数据仓库;空间;粒度;维护  :TP311:A:1009-3044(2011)10-2234-03  ResearchRelatedTechnologyonData&EEngineering,FeixianCollegeofQingdaoTechnologiclUniversity,Linyi273400,China) 

2、 Abstract:Thispaperpresentedthedefinitionofdataethodsofbuildingmondataaintenance,integrationandsoon,thearticlealsodiscussedtheapplicationofdatamaryandoutlook.  Keyaintenance  1概述  随着企业对数据管理不断提出新的要求,人们要求计算机在处理日常简单数据的同时,能够更多地参与数据分析和决策支持,由此出现了一种用于数据分析处理和决策支持的数据存储和组织技术,即数据仓库技术,构建数据仓库是实现海量数据存储和管理

3、的有效途径。本文针对数据仓库的实现特别是大型数据仓库的实现面临许的多技术问题,围绕开发一个灵活、高效的数据仓库等关键问题进行了研究和探讨。  2数据仓库定义  美国著名信息工程学家系统的相关知识,阐述了数据仓库技术在CRM系统中应用的必然性,提出了该分析型CRM系统中客户信息数据仓库模型的设计方案,具体阐述了概念模型设计、逻辑模型设计和物理模型设计,并以MSSQLServer2000平台为基础,给出了具体的实现,在企业引入分析型CRM系统时为构建数据仓库提供了参考依据。  文献[7]提出了构建数据仓库模型的建议:1)采用星系模型:在实际应用中,用户的需求多种多样,数据可能为多个

4、事实表,故可采用多个事实表共存,之间通过公用的维表相关联的星系模型,也称为事实星座。2)原子级数据模型和汇总级数据模型并存:坚持原子级数据模型和汇总级数据模型并存,而且要尽可能地细化原子级数据。3)设立代理键:代理键是维表中一些没有业务含义的字段,只是一个由数据仓库加载程序时建立的数字。  文献[8]认为对于流程工业中的数据仓库建设,存在一贯性质量分析的需求,即前一个工序的工艺可能影响下一个工序的产品质量。针对这种需求,提出了一种数据仓库的概念设计模型,星链ER模型。其中引入了链式事实主题结构的概念,并把度量细分为传递型度量与非传递型度量,给出了星链ER模型的图形表示法以及由概

5、念模型到逻辑模型的转换规则。该模型可以方便地转化成多种逻辑模型如星型模式、雪花模式以及星座模式。  由于数据仓库的一个主要特点是其“非易失性”,即进入数据仓库中的数据长期保存,不再改变。文献[9]利用“时问”维度可以标识事实数据的历史,实现了“事实数据的非易失性”。但是,“时间维并不能标识数据仓库模式的变化”,“模式结构的非易失性”需要构建数据仓库模式版本来实现。针对数据仓库多维模式结构的进化问题,文献[10]提出一种多版本数据仓库模型,给出模型结构、模型对象以及对象之间指派关系的定义。多版本数据仓库基于“版本控制”策略管理数据仓库的多维模式,将数据仓库进化过程中的每一种有效状

6、态都以版本的形式保存下来。  3.2空间数据仓库构建方法  近年来,空间数据仓库的研究也取得了较大进展,文献[11]给出了空间数据仓库的定义和特征,文献[12]首先表述了空间数据仓库的三个核心思想,其次设计出了空间数据仓库的概念框架,着重描述了空间数据仓库的外部结构、内部结构以及各组成模块的工作流程,设计出了空间数据仓库认知过程的概念框图,并对认知的基本概念进行了描述,表述了认知过程14个世界模型和13个转换算子的基本内容,并用代数系统给出了严格定义。  把空间信息融合进企业现有的数据仓库中,采用3种方式构建企业空间数据仓库[13]:1)把空间信息作为多维模型中的维引入;2)把

7、空间信息作为分析主题引入;3)在维和度量中都包含空间信息因此,计算并存储所有空间度量是不现实的。文献[14]使用空间索引树(如R—tree)在最细空间粒度上构建分组层次,作为空间维的分层,每个空间维需要建立一棵空间索引树。空问度量类似数值度量,空间数据的聚集函数根据计算性质也可以分为3类[15]:1)空间分配型(spatialdistributive)聚集函数,包括convexhull,union,intersection,length等函数;2)空间代数型(spatialalgebraic

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。