欢迎来到天天文库
浏览记录
ID:58957252
大小:1005.50 KB
页数:51页
时间:2020-09-28
《2019 第3章地理学中的经典统计分析方法――第1节相关分析ppt课件.ppt》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库。
1、达尔文和高尔顿进化论的奠基人达尔文(Charles.R.Darwin,1809-1882),他晚年在《达尔文讲义——数学的功用》里,曾经写道:“年轻时,我讨厌数学,始终不明白为什么一定要学代数初步。我就是因为这个缘故而没有再学数学,实在是非常愚蠢。“后来,我看到具有数学知识的人,能驾轻就熟地处理与数字有关的问题时,才深深后悔自己当初要是多努力一点,就不会对数字那么没有概念了。”达尔文的表弟高尔顿(FrancisGalton,1822-1911),是回归分析的奠基人,是一个著名的统计学家,但他在地理学、气象学、心理学和生物学(特别是遗传学和
2、优生学)等多个领域有突出贡献。此人智力早熟,很小就学习数学,但没有完成学业;然后学习医学,也没有完成学业。在一些世俗的观念里面,这个人简直是一个不成器的家伙。在20岁出头的时候,他继承了父亲的一笔遗产,然后外出旅行探险:沿着多瑙河到黑海、到埃及,然后逐步深入到当时尚未开发的非洲西南部的一些地区……。最后,他定居英国伦敦,从事科学研究。获得英国皇家地理学会的金质奖章。第三章地理学中的经典统计分析方法1、相关分析2、回归分析3、时间序列分析4、系统聚类分析5、主成分分析6、马尔可夫预测7、趋势面分析8、地统计分析§3.1相关分析问题提出某地
3、区表层土壤中有机碳和有机氮含量分别如下表所示,试分析两者之间是否存在相关关系,并建立其函数方程。10.1361.60820.1381.57230.1251.47040.1231.44750.1201.42260.1131.36070.1121.41880.0951.19790.0791.002100.0871.099110.0720.904120.0640.756130.0520.533140.0480.439150.0510.472160.0440.352SampleSON(%)SOC(%)某山地各气象观测站的相关数据如下表所示,试分析
4、其降水是否具有经度地带性和垂直地带性分异规律。某地理要素Y的变化可能受到地理因素x1,x2,x3的综合影响,请根据样本观测数据,分析Y与X之间是否存在线性关系,并建立其经验回归方程。函数关系它反映着现象之间存在着严格的依存关系,即具有确定性的对应关系,可用一个数学表达式反映出来。§3.1相关分析相关分析的任务,是揭示地理要素之间相互关系的密切程度。而地理要素之间相互关系密切程度的测定,主要是通过对相关系数的计算与检验来完成的。两要素之间相关程度的测定多要素间相关程度的测定正相关负相关线性相关非线性相关相关关系的分类•按照影响因素分类简单线
5、性相关偏相关复相关主要步骤•判断现象之间是否存在相互依存的关系,是直线相关,还是曲线相关,这是相关分析的出发点;•确定研究变量均为随机变量;•根据变量个数和特征选择合适的分析方法;•计算相关系数;•对相关系数进行显著性检验。一、两要素之间相关程度的测定相关系数的计算与检验秩相关系数的计算与检验(一)、相关系数的计算与检验相关系数的计算①定义和为两要素的平均值。②说明:-1<=<=1,大于0时正相关,小于0时负相关。的绝对值越接近于1,两要素的关系越密切;越接近于0,两要素的关系越不密切。(3.1.1)极显著相关显著相关③简化记公式3.1.
6、1可简化为:(3.1.2)表3.1.1伦敦的月平均气温与降水量资料来源:cwb.gov.tw/V4/climate/wta_station/wta20.htm相关分析实例根据表3.1.1中的数据,我们可以代入公式(3.1.1),计算伦敦市月平均气温(T)与降水量(P)之间的相关系数:计算结果表明,伦敦市的月平均气温(t)与降水量(p)之间呈负相关,即异向相关。又如:根据甘肃省53个气象台站的多年平均数据(见教材表3.1.2),可以对降水量(p)和纬度(y)之间的相关系数以及蒸发量(v)和纬度(y)之间的相关系数,分别代入公式(3.1.1)
7、计算如下:==计算结果表明,降水量(p)和纬度(y)之间异向相关,而蒸发量(v)与纬度(y)之间同向相关。相关系数的检验:相关系数是根据要素之间的样本值计算出来,它随着样本数的多少或取样方式的不同而不同,因此它只是要素之间的样本相关系数,只有通过检验,才能知道它的可信度。检验是通过在给定的置信水平下,查相关系数检验的临界值表来实现的。自由度(degreeoffreedom,df)在数学中能够自由取值的变量个数,如有3个变量x、y、z,但x+y+z=18,因此其自由度等于2。在统计学中,自由度指的是计算某一统计量时,取值不受限制的变量个数。
8、通常df=n-k。其中n为样本含量,k为被限制的条件数或变量个数,或计算某一统计量时用到其它独立统计量的个数。在上表中,f称为自由度,为f=n-2,n为样本数;上方的代表不同的置信水平;表内的
此文档下载收益归作者所有