欢迎来到天天文库
浏览记录
ID:41535624
大小:4.47 MB
页数:69页
时间:2019-08-27
《《大气统计基础》PPT课件》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库。
1、大气统计方法第二章大气统计基础气象资料实测资料模式资料天气和气候分析的根本第一步分析数据的基本特性……进一步气象资料的整理用统计方法作气象要素的分析和预报是依据大量的气象观测资料来进行的。从概率论或统计学的观点来看,某个气象要素及其变化可看成为一个变量(或随机变量),它的全体在概率论中称为总体,而把收集到的该要素的资料称为样本。利用统计学方法对样本进行分析来估计和推测总体的规律性就是本课程主要介绍的内容。气象中单个或多个要素可看成为统计学中单个或多个变量。本章将介绍对它们的资料(样本)进行初步整理的方法。我们要研究的对象是
2、气象要素,比如气温、降水量、气压,它们可以是月平均值、年平均值、也可以是日平均值,这要看我们所要研究的气象问题而定。对于长期预报或短期气候预测,经常分析的是气象要素的月或年资料。对于短期预报则常使用日资料,要作出预报就需要先研究它们随时间变化的规律性。单个变量我们把单个气象要素记为x,取它某一时间段的资料记录作为样本,样本中包含n个数据,记为n称为样本容量,每一个资料称为所抽取的一个样品。x1,x2,…,xn如果取某要素月平均值的n年资料,那么这些数据就是一串随时间变化的序列,我们习惯把它称为时间序列,并记为xt,其中t=
3、1,2,…,n这种表示法在时间序列分析中常用。对于气温、气压及降水量等气象要素,观测值变化在正负无穷大之间,这种类型要素可看成为连续型随机变量。至于有一些气象要素,例如冰雹、晕、华等天气现象,气象资料中仅记录此现象“有”或“无”,这类无法用连续型变量表示的变量,一随用“1”或“0”二值数字化表征,这类变量可看成为离散型随机变量。至于云量,用数字1~10来分级表示的,也属于这一类型。当然,变量类型可以互相转化,例如对连续型变量如气温,规定一个临界值T0。凡T≥T0记为“1”,T<T0的记为“0”,那么这时的气温就处理成二值变
4、量,这种做法在模式输出预报技术中经常被采用来作短期天气预报中的定性预报。多个变量气象要素观测是三维空间的,有各种等压面上的要素资料,既有空间,又有时间变化。这时就可以把多个要素在某一段时间收集的资料看作为多个变量的样本,每个变量的样本可看成为一个向量。p个变量n次观测的样本可看成为n维空间中p个向量,每个向量可用行向量(1×n矩阵)表示统计量的数字特征平均值距平,标准差,方差协方差,相关系数峰度系数,偏度系数中心趋势统计量——平均值平均值(mean)对于包含有个样本的一个变量,即样本平均值为:变化幅度统计量统计量中的平均值
5、描述的仅仅是气候变量分布中心在数值上的大小,并没有告诉我们这种变化与正常情况的偏差和变化的波动。变化幅度统计量即表征距离分布中心远近程度的统计量。变化幅度统计量包括:距平(anomaly)方差(variance)和标准差(standarddeviation)距平是气象上常用的量,它也即通常所说的异常,即对平均值的正常情况的偏差。资料中某一个数值与平均值之差就是距平,例如第i点资料的距平为:气象上经常用距平值代替原样本中资料数值作为研究对象,因为在气象要素的研究中,它们受年变化周期影响很大,各月的平均值不一样。例如12月、1
6、月、2月平均值就各不相同。为使之能在同一水平下进行比较,常使用距平值。用距平值作为变量的资料值,使得各变量的平均值为0,可以带来研究上的方便,也便于计算。有时直接以它作为预报值,可以给人们一个偏高或偏低的直观了解。距平的意义标准差与方差描述样本中资料与平均值差异的平均状况的统计量就是标准差,它衡量资料围绕平均值的平均变化幅度。平常说:“内陆台站气温日变化较沿海地区要大”。这个日变化大小的比较就是用它们的标准差来比较的。某气象要素(变量)x(含n个资料的样本)的标准差计算公式为数据的标准化原因及优点---不同单位、不同量级数
7、据之间便于比较计算公式---,为标准差特点1---通常标准化后的数据为无量纲的数据特点2---标准化数据的平均值为0,标准差为1为相关系数的引出作了铺垫数据的标准化数据标准化处理是不仅使得数据间便与比较,其核心思想是试图消除数据的“位置”和离散程度对进一步分析所带来的影响;例如,1月和7月某日温度相对本月长期平均温度的距平相同,但1月和7月数据离散程度,即标准差不同,则距平标准化值能体现出这两月中这种温度变化是否是属于异常事件。协方差也可以体现两个变量间的关系,其公式为但协方差是一个带有单位的统计量,不便于不同要素间进行联
8、系,因此需要将原数据作标准化处理。得到相关系数为:协方差与相关系数Pearson(“普通”)相关---特点相关值介于±1之间,即ⅡⅠⅢⅣ常可以用来表示两个变量中的一个被另一个变量解释的程度,但并不能从物理上解释其中一个变量的变化是由另一个变量所致,可能这两个变量的变化皆由其它物理过程所致。为什么?证明:
此文档下载收益归作者所有