欢迎来到天天文库
浏览记录
ID:10166939
大小:29.00 KB
页数:7页
时间:2018-06-12
《数据仓库技术在天气预报决策中的应用探讨》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、数据仓库技术在天气预报决策中的应用探讨【摘要】数据仓库技术作为数据库技术新的应用,经过数年的发展已经逐渐完善,将数据仓库技术应用于天气预报中将会给气象服务保障能力的提高产生巨大的推动作用。文章概述了数据仓库的概念和特点。讨论了联机分析处理(OLAP)和数据挖掘(DM)要解决的主要技术问题,侧重于数据仓库技术在天气预报领域中的应用。数据仓库技术将原始数据转换为便于分析的数据,并增强了管理和使用历史数据及特种观测数据的能力,能够帮助预报员快速积累经验,指出关联规则的挖掘是目前预报方法研究中值得尝试的新方法。【关键词】数据仓库;联机分析;数据挖掘中图分类号:C37文献标识码:A1数
2、据仓库技术简介数据仓库是面向主题的、集成的、稳定的并随时间不断变化的数据集合,建立数据仓库的目的是为了更好的支持决策分析,数据仓库是一种综合解决方案,具有强烈的工程性。7目前许多领域都开始使用数据仓库技术,并使数据仓库有了新的发展。例如,能够存储和使用地理信息空间非结构化数据的空间数据仓库、将联机分析处理和数据挖掘相结合的联机分析挖掘(OLAM)系统等。在天气预报领域,数据仓库根据预报专家的经验将原始数据转换为分析型数据,并按主题统一管理,使预报员能够快速查询和分析各种数据;以元数据为核心的数据管理技术能够有效地管理大量历史数据和特种观测数据,甚至是分布在Internet上的
3、数据;数据挖掘功能可以在预报员未使用过的数据中自动发现数据之间的联系,帮助预报员快速积累经验;联机分析处理的多维分析能够开阔预报员的视野,整合已有的分析工具。因此,数据仓库技术能够很好地解决目前预报决策支持系统存在的问题。2气象数据与天气预报业务特点(1)数据种类多:各级气象台站日常收集的资料通常包括各种模式物理量场的空间格点资料、气象观测站点的地面(及海上)和高空实况资料以及卫星、雷达的探测资料,以及本地的气象观探测资料,还有根据任务需要而实施的其他气象观探测资料,每种气象数据资料又包含若干类数据,因此数据种类非常多。(2)数据量大:各级气象台站收集的各种资料每天都有若干时
4、次,收集、存储的数据资料数据总量达上百兆,总的资料甚至可达GB量级。(3)预报业务范围广:从大类分为统计预报和数值预报,而每类又包括若干种天气预报项目如天气形势、物理量场、天气现象、气象要素等,决定了天气预报所需的气象数据多。7(4)气象数据需要精心筛选:气象台站每天收集的数据很多,但并不是所有的数据对所有的气象台站进行的气象预报业务都有用,所需要的数据也可能很多也可能很少,这需要气象预报专家根据预报业务项目的需要对气象数据资料进行严格的精心筛选。(5)数据的深加工应用:通过人工或仪器观探测到的数据不足以充分反映大气系统的物理结构和物理场,只有经过对数据进行更深层次的筛选及计
5、算,才能计算出大气的运动矢量、垂直运动、梯度、涡度、散度等物理量,从而更好地认识大气演变的规律及模式,进而提高气象预报的能力与水平。(6)数据可挖掘性高:由于气象预报理论和气象预报模型在某种程度上还具有一定的不完善性与不完备性,在天气预报实践中常常表现为预报准确率低以及一些气象预报业务无法高效率地展开,随着数据仓库技术在天气预报业务的应用,数据挖掘技术必将挖掘出大量的相关数据,促进气象预报理论和气象预报模型的进一步完善与完备(7)数据更新要求低:天气系统的演变有一定规律,而且气候变迁是一个漫长的过程,从而决定了数据不需要频繁更新。3、联机分析处理系统(OLAP)7在天气预报数
6、据仓库中,数据处理、存储和数据挖掘都是后台运行的,而直接面向预报员的工作界面就是联机分析处理系统(OLAP)。OLAP的核心是多维分析。所谓多维分析其实就是对多维空间中的数据进行观察的工具。多维分析中的可以是观察数据的任何一个角度,可以是平常所说的时空维,也可以是傅立叶变换中的正交基,还可以是某个空间点上随时间变化的要素值等。在商务领域,一般是采用对立方体各维进行计数、求和、求平均等统计,数据的规约等手段降低维数和数据量,研究的热点是快速聚集算法、数据规约算法等。针对天气预报决策特点,在多维分析基础上我们增加了比较分析及专门分析历史数据的多元分析和相似分析。其中增加比较分析是
7、考虑预报员经常要对不同时间、不同层次、不同要素的场进行比较,比较分析功能就是预报员选取多个数据同时进行多维分析,并凸显数据间差异。4、数据挖掘技术(DM)7数据挖掘技术是数据仓库的核心技术之一。它是将KDD中较成熟的技术应用于大规模数据,自动寻找数据的发展趋势、数据中隐含的模型及数据之间的关联关系等。数据挖掘研究的主要问题包括系统的体系结构、预处理、挖掘算法、挖掘结果的评估和显示等。其作用是帮助预报员自动寻找数据特别是过去使用较少的数据之间的规律,加快积累预报经验的速度。实际上,预报员在统计预报和模式释
此文档下载收益归作者所有