欢迎来到天天文库
浏览记录
ID:17573605
大小:350.00 KB
页数:17页
时间:2018-09-03
《国家级石油数据中心建设与posc系列标准》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库。
1、国家级石油数据中心建设与POSC系列标准袁满yuanman@263.net(黑龙江省 大庆市大庆石油学院 计算机学院)1引言信息技术的应用已经深入到石油工业应用中的各个环节。而且随着石油工业的发展,积累的信息呈爆炸式增长。存储与维护这些信息的费用也越来越高,尤其是随着石油市场竞争日趋激烈,迅速而准确地从现有的信息中抽取出有用的决策信息是现代石油生产、销售与管理等迫切需求的。而以往只是面向应用的数据模式的应用已经满足不了这种需求。随之而来的一种面向主题的联机分析与决策应用便应运而生。正是在这种应用需求的驱动下产生出了适合这种应用需求的数据仓库技术。进入90年代,世界上一些国家
2、的油公司、石油协会、石油相关的组织、一些大学及研究机构联合先后建立了自己的数据仓库,这些国家从这些数据仓库中得到了相当的效益,为油田的勘探、开发等提供了可靠的、科学的决策依据。自90年代初至今,世界许多著名的油公司与相关组织联合发起并成立了POSC,旨在为世界油田勘探与开发制定一套集数据集成、软件集成等于一体的标准,而且这些标准已经越来越被各国的油公司所认可。这些标准必将成为世界共同的财富,必定会促进油公司信息系统建设,并为其建设提供可参考与可实施的标准。本文主要讨论了三个主要的问题:一个是讨论了数据仓库及相关技术;接着讨论了POSC的系列标准;最后给出了世界上数据仓库成功
3、的案例-美国国家地球科学数据仓库系统(NGDRS)。通过本文的讨论,旨在说明数据仓库建设在石油生产、管理等各个领域的应用潜力;提到数据中心建设就必然会涉及到标准问题,而POSC系列标准正是为这一目的而制定的。POSC系列标准经过10多年的发展与完善已经越来越得到世界的认可,尤其POSC组织目前正在进行的基于电子商务的石油数据交换规范更加细致与实用,这些为我们的信息建设提供了可参考的标准。并全通过一些大组织在信息建设中对POSC系列标准的采用的实践已经证明了POSC系列标准的先进性。2数据仓库体系结构及相关技术2.1数据仓库的概念及特点近年来,数据仓库技术已经成为计算机领域中
4、的热门话题。这主要是因为:首先,从计算机的应用需求上讲,由于全球范围内的经济、贸易以及军事、科技等领域竟争的激烈,给传统的信息产业提出了新的问题和挑战,使得传统的信息技术在处理某些复杂问题上显得力不从心;另一方面,从现实的技术发展角度上来看,目前计算机科学以及相关领域的技术实现了突飞猛进的发展,使得它们之间的相互协同成为可能,并达到使数据仓库技术走向实用的程度。数据仓库的概念最早是由W.H.Inmon和Richard Hackathorn在他们的著作中提出来的。他们对数据仓库是这样定义的:数据仓库是信息技术构架的新焦点,它提供集成化的和历史化的数据,它集成种类不同的应用系统
5、,数据仓库从发展和历史的角度来组织和存储数据,以供分析与处理使用。这里的的集成化数据是指数据在结构上具有综合性而且在语义上是异构的;历史化的数据表明数据仓库中包含的数据是一段历史性的数据,它既包括某一点上的瞬间信息,同时也包含一个区段上的信息;集成种类不同的应用系统说明数据仓库不仅仅是数据的仓库,同时也是软件的仓库。其中的数据一般按应用主题进行组织与存储。也有人将数据仓库抽象地定义为:数据仓库是决策支持技术的集合,其目的是利用所存储的知识做出更好、更快的决策。数据仓库体系结构见图 1。也有人将数据仓库定义为:面向主题的、集成的、随时间变化的、用来支持组织决策的稳定数据的集合
6、。不管哪种定义,它们均有共同的特点:● 数据仓库需要为决策提供综合信息,因此,它是以企业业务的主题内容来组织数据。这样的组织形式使得提供的信息具有全方位的可用性。● 数据仓库中所保存的数据,虽然来自于日常的运行,但是它是经过加工、重组的数据。因此它所存储的数据是源数据的增值和统一,并不是简单的拷贝。● 数据仓库不仅仅是“数据的仓库”,而且也是“软件的仓库”,至少它应该包含对数据的变换功能。● 数据仓库还需要处理历史数据。任何的数据都带有时间标记,这将为实现预测奠定基础。● 数据仓库应当能够通过信息以及服务来反映企业的业务模型,实现数据的逻辑模型。● 对于行业的数据仓库必须定
7、义统一数据标准。2.2组成数据仓库的部件从图1可以看出,数据仓库的组成结构。它包括各种各样的工具:这些工具负责从若干个运行着的外数据库及外部数据源中抽取数据,并负责对这些数据的清洗、变换与集成,同时还负责向数据仓库中加载数据;这些工具还要周期地对数据仓库进行更新,并负责对数据仓库中一些归档数据的净化。除了主数据仓库之外,可能还会存在一些部门级的数据集市。存储在数据仓库或数据市场中的数据可能被一个或若干个数据仓库服务器负责管理,这样对不同的前端工具会呈现出各种丰富的数据视图以满足不同决策与应用的需求,这些前端工具可能
此文档下载收益归作者所有