欢迎来到天天文库
浏览记录
ID:48814164
大小:751.00 KB
页数:44页
时间:2020-01-27
《第十章 简单回归与相关(1).ppt》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库。
1、第10章一元相关和回归分析10.1相关和回归的意义农业生产实践和科学研究中存在许多现象,且它们之间存在相互关系,例如,产量与施肥量有关,病虫害发生时期与温度有关。我们可以用不同的变数,如X和Y代表不同现象或性状,一般说来变数之间的关系可以分为两类。①函数关系,一个变数的取值和变化完全取决于另一个或几个变数的取值和变化。例如,距离=速度×时间;*②相关关系,一个变数的取值和变化同另一个或几个变数的取值和变化有关,但又不完全取决于这些变数。例如,作物的产量肯定与施肥量有关,但还要受到降雨量、积温、品种等许多因素影响。①因果关系,
2、即一个变量的变化受另一个或几个变量的影响。如病虫害发生时期受温度的影响,小麦单位面积产量受单位面积穗数、千粒重等的影响;统计学上采用回归分析研究呈因果关系的相关变量。表示原因的变量称为自变量(无随机误差),表示结果的变量称为依变量。相关关系又分为两种:②平行关系,即二个变量相互影响,互为因果。如小麦每穗粒数与千粒重之间的关系,株高与穗长之间的关系等都属于平行关系。两个变量属于平行关系,一般用相关分析研究.相关分析中没有自变量及依变量之分,且都具有随机误差。(1)根据相关变数的多少可将相关关系分为一元和多元相关。一元相关指只涉
3、及两个变数的相关关系;多元相关指涉及3个或更多个变数的相关关系。相关关系的分类(2)根据相关的形式可将相关关系分为线性和非线性相关。线性相关指变数间的变化规律基本上呈直线形式的相关关系;非线性相关指变数间的变化呈某种规则或不规则的曲线形式的相关关系。本章主要讨论一元线性相关关系的统计分析。通常用x和y代表两个存在一元相关关系的变数的观测值,将观测点标在直角座标图上就构成了散点图。从散点图上可大致地看出相关的形式。根据研究目的和依据的数学模型不同一元相关关系的分析方法有两种:1.相关分析相关分析的目的是定性地研究两个变数间有无
4、相关、相关程度、相关方向和形式等。在相关模型中,两个变数是平行的,没有因果关系,皆具有随机误差并服从二维正态联合分布。参数称相关系数,反映了X和Y间的相关特征。相关分析就是求的估计值,根据估计值及对它的显著性测验结果可以回答X和Y间有无相关、相关程度和相关方向等问题。例如,研究水稻每穗粒数与穗长之间的关系时,因为这些性状间不存在明显的因果关系,又都受到许多不可控因素的影响,都具有随机误差,所以应进行相关分析。回归(regression)分析的目的是定量地研究两个变数间的数值变化规律,根据这种规律可由一个变数的变化来估计另一个
5、变数的变化。在回归模型中,两个变数有因果关系。原因变数称自变数,通常用X代表。结果变数称依变数,通常用Y代表。2.回归分析要求X是可控制的,没有误差或误差很小,而Y则不仅随X的变化而变化,还受到随机误差的影响。X和Y间的数值变化关系用回归方程来描述,如读作“y依x的一元线性回归方程”。(10.1)其中x是自变数X的观察值;ε是随机误差,是相互独立且服从同一正态是X=x时依变数Y的平均值;α是X=0时Y的平均值,称为回归截距;β是X每变化一个单位时Y相应增加或减少的单位数,又称回归系数;分布(0,σ2)的。回归分析就是求α和β
6、的估计值,建立一个样本回归方程并对其进行显著性测验。有了回归方程就可根据X的变化来估计Y的变化,这称为回归预测。也可以反过来根据Y的变化来估计X的变化,这称为回归控制。(1)变数间是否存在相关以及在什么条件下会发生什么相关等问题,都必须由各具体学科本身来决定。(2)仅研究该事物(y)和另一事物(x)的关系,则要求其余事物的均匀性必须得到尽可能严格的控制。进行相关、回归分析应注意以下问题:(3)为了提高回归和相关分析的准确性,两个变数的成对观察值应尽可能地多一些,并使X变数的取值范围尽可能大一些,一般应有5对以上观察值。(4)
7、正确看待线性相关或回归分析的结果。线性相关或回归显著表明可用直线形式来描述变数间的关系,但不等于用直线形式来描述就是最合适的,也许用某种曲线形式来描述会更好些。反之,线性相关或回归不显著也不等于变数间没有相关。10.2一元线性相关分析上,则各个点的设一双变数总体,由N对(X,Y)构成,并将这N对(X,Y)标在直角坐标图上。和如果将坐标轴平移至相对位置不变,而所取坐标数化为.并且,在象限Ⅰ,在象限Ⅱ,在象限Ⅲ,在象限Ⅳ,因而,凡落在象限I、Ⅲ的点,凡落在象限Ⅱ、Ⅳ的点,皆为负值。.皆为正值;ⅠⅡⅢⅣ当(X,Y)总体呈正相关时,
8、落在象限I、Ⅲ的点,一定比落在象限Ⅱ、Ⅳ的多,故一定为正;同时落在象限I、Ⅲ的点所占的比率愈大,此正值也愈大。当(X,Y)总体呈负相关时,则落在象限Ⅱ、Ⅳ的点一定比落在象限I、Ⅲ的为多,故且落在象限Ⅱ、Ⅳ的点所占的比率愈大,此负值的绝对值也愈大。一定为负;如果(X,Y)总体没有相关,则落在
此文档下载收益归作者所有