欢迎来到天天文库
浏览记录
ID:46746032
大小:64.00 KB
页数:6页
时间:2019-11-27
《浅论数据仓库技术》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库。
1、浅论数据仓库技术【摘要】随着网络技术的发展,数据仓库技术的应用十分普遍。本从国内外日前数据仓库的发展现状入手,介绍了数据仓库的相关技术,数据仓库可变性的特点以及数据仓库在企业决策中的重要性。在此基础Z上展望了数据仓库发展。【关键词】数据仓库;可变性;决策;技术;发展中图分类号:C37文献标识码:A文章编号:、八―1—一、刖吕随着计算机科学与技术的飞速发展,数据库、计算机网络和自动控制系统等被广泛用于企业管理、政府办公、科学研究和工程开发等领域,产生的数据量急剧增加,海量数据层出不穷。为了处理数目巨大的数据,数据仓库应运而生。数据仓库的应用也十分广泛,并在不
2、断的发展。二、目前国内外发展现状在数据库技术的当前及未來发展里程中,数据仓库以及基于此技术的商业智能无疑将是大势所趋。IBM的实验室在这方面进行了10多年的研究,并将研究成果发展成为商用产品。除了用于0LAP(联机分析处理)的后台服务器DB20LAPServer外。IBM还提供了一系列相关的产品:包括前端工具,形成一整套解决方案。其它数据库厂商在数据仓库领域也毫不示弱方法各有不同。Informix也是类似,在其动态服务器IDS(InformixDynamicServer)中提供一系列相关选件,如高级决策支持选件AdvancedDecisionSupport
3、Option,OLAP选件扩展并行选件ExtendedParallelOption等,并认为这种体系结构严谨,管理方便,索引机制完善,并行处理的效率更高。其屮数据仓库和数据库查询的SQL语句的一致使用户开发更加简便:而微软则是在其SQTServer7.0中集成了代号为Plato柏拉图的OLAP服务器,与上述公司不同的是,Sybase提供了专门的服务器OLAPSybaseIQ,并将与数据仓库相关工具打包成WarehouseStudio。从中国的数据库市场来看,大部分数据库系统的建立是用来进行传统的OLTP业务。也有一些企业建立了数据仓库系统,但真正发挥效用的
4、却不多见。和TCP/IP,SMTP)Java等相比。尚不存在可靠的、完善的、被广泛接受的数据仓库标准,影响了数据仓项目的实施。三、数据仓库的相关技术1、异种数据源集成企业在进行经营分析与决策支持系统建设时必须将遗留系统(LegacySystem)进行高效全面地集成,由于遗留系统是在企业发展的不同时期建设的往往缺乏全局的规划,所以常表现为不同的操作系统平台、不同的数据库平台、不同的网络通信机制等等,形成了所谓的“信息孤岛”。数据源分为在线数据源和离线数据源,在线数据源是指允许在线抽取的业务数据源,如营业数据,离线数据源是指不允许直接在线抽取的数据源,如计费详
5、单数据,采用以脱机平面文件数据的格式以FTP方式集成进本系统。2、ODS层的设计操作数据存储ODS(OperationDataStorage)是一个集成了来自不同数据库数据的环境。其目的是为终端用户提供一致的企业数据集成视图。它可以帮助用户轻松应对跨多个商业功能的操作挑战。它是面向主题的、集成的、实时的数据存储。3、TL过程的设计数据抽取、转换和加载,是数据仓库实现过程中,进行数据山数据源系统向数据仓库加载的主要方法,整个数据处理过程如下:数据抽取:从数据源系统抽取数据仓库系统需要的数据。数据抽取采用统一的接1:3,可以从数据库抽取数据,也可以从文件抽取,
6、对于不同数据平台、不同的源数据形式、不同性能耍求的业务系统以及不同数据量的源数据,可能采用的接口方式不同;数据转换:数据转换是指对抽取的源数据根据数据仓库系统模型的要求,进行数据的转换、清洗、拆分、汇总等处理,保证来自不同系统、不同格式的数据和信息模型的一致性和完整性,并按要求装入数据仓库;数据加载:数据加载就是将转换后的数据加载到数据仓库系统中。数据加载采用数据加载工具,也可以采用API编程进行数据加载。四、数据仓库可变性数据仓库不是一个静止不变的产品,而是一个动态的,不停变化的过程。这个过程为全企业的管理系统奠定信息基础。该系统可用来测算利润、管理和分
7、析风险、进行市场分析、帮助规划和加强客户服务计划及市场推进计划。与现买现装的产品不同,成功的数据仓库实际上是一个过程。它要求公司仔细分析本公司的基本原则,决定需要哪些运作数据和外部数据源,然后利用一种严密的方法把所有的数据集中起來,再变换成有用的信息。数据仓库过程一旦开始实施,就没有终结的时候。它的可用性和中肯性在极大程度上来自于英信息的新鲜性。因此,公司必须不断对它进行更新,馈入新的统计信息和新的事务档案。五、数据仓库的在企业决策中的重要性数据仓库直接影响事关公司命运的决策。数据仓库是一种数据集成战略,目的是促进最终用户利用企业数据,同时保护公司的数据财
8、富(关键任务的可操作数据)安全性和完整性。只要安排妥当,数据仓库就
此文档下载收益归作者所有