欢迎来到天天文库
浏览记录
ID:58693217
大小:415.00 KB
页数:106页
时间:2020-10-04
《第七章简单回归与相关分析ppt课件.ppt》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库。
1、第七章简单回归与相关分析回归与相关的概念简单线性回归分析简单线性相关分析简单非线性回归分析为什么要学习回归与相关分析前面介绍的统计分析方法,仅限于一个变量或性状。但是作物的生长发育往往是复杂的,一个性状的变化可能与另一个或几个性状的变化有关,这就需要我们同时考察多个变量或多个性状间的关系。对这种变量间的关系研究就要采用新的统计分析方法—回归与相关分析。§7.1回归与相关的概念1、确定性关系可用一个确定的数学表达式表示。例如,S=πr2;I=V/R一个变量的任一个值都必有另一个变量的一个确定值与之对应,这种关系即为确定性关系,也称做函数关系。常见于力学、电学、光学、运动学等学科,在农学和
2、生物学中较少见。不能用确定的数学表达式表示。例如,作物产量与施肥量之间的关系,人的年龄与血压,身高与体重,身高与遗传和后天锻炼等现象都属于不确定性的数量关系,但确有一定的规律性存在。在一定的范围内,一个变量的数量变化只是部分地引起另一个变量的数量变化,没有一个确定的数值与之对应,这种关系称为不确定性关系。2、不确定性关系从统计学上讲,确定关系与不确定性关系的区别仅在于前者不存在随机误差,而后者不可避免地存在随机误差。统计学上把变量之间存在的这种不确定关系称为相关关系。并把存在相关关系的变量称为相关变量。回归与相关就是用来研究变量之间不确定关系的统计方法。3、相关关系的两种类型◆平行关系如
3、水稻的穗长与每穗粒数,果实的径粗与果重,我们不能说谁影响谁。但是,穗长的数量变化的确又与每穗粒数的变化有一定关系。穗长和穗粒数是平行变化关系,二者都有随机误差。对于这类资料,则适用于做相关分析。◆因果关系如播种期与产量的关系,播种期是事先设计的、固定的,而产量是有随机误差的。播种期的取值可控或独立变化,而产量是随播种期的不同而变化的,是依从的,或者说是播种期的反应。对这类资料则应做回归分析。根据变量间相关关系的两种类型,可以将变量间的关系划分为两种理论模型:(1)回归模型和(2)相关模型回归是指由一个(或多个)变量的变化来估测另一个变量的变化。这种估测是通过回归方程实现的。X:既可以是随
4、机的,如身高体重一例;也可以是非随机的(一般变量),如农作物产量一例中施肥量和播种期是可控制的,不受试验误差影响或误差较小。Y:则不仅随X的变化而变化,且受其它未考虑因素和试验误差的影响,是随机变量。这一模型中的X叫自变量,Y叫依变量。Y=α+βX+ε回归模型:①有自变量和依变量之分;②具有预测和控制作用;③自变量x无误差或误差很小可以略去,依变量y存在随机误差。对回归模型资料,通常在确定自变量和依变量的基础上,建立由X来预测Y的回归方程,并确定当自变量X取某一定值时依变量Y将会在什么范围内变化。这种分析,在统计上就称为回归分析(regressionanalysis)。特征:回归分析:相
5、关是指两个变量间有一定的关联,一个变量的变化必然会引起另一个变量的变化。在相关模型中,两个变量X和Y是平行变化的,都有随机误差,因而不能区分哪一个是自变量,哪一个是依变量,二者互为自变量与依变量。①表示两个变量的偕同变异;②没有自变量与依变量之分;③不具有预测的作用;④存在随机误差。特征:对相关模型资料,通常只研究两个变量之间有无关系,以及关系的密切程度和性质,而不需要由一变量去估测另一变量。这种分析在统计上就称为相关分析(correlationanalysis)。相关分析:回归与相关的种类1、根据所研究变量的多少可分为两类:①简单回归与简单相关(一元回归与一元相关);②多元回归与多元相
6、关(复回归与复相关);①直线回归与直线相关(线性回归与线性相关);②曲线回归与曲线相关(非线性回归与非线性相关)。2、根据所研究变量之间的关系特征可分为两类:§7.2简单线性回归分析一、线性回归方程::自变量;:表示与x值相对应的y的平均值的估计值;a:是x=0时的值,即回归直线在y轴上的截距,叫回归截距;b:表示该直线的斜率。当x每增加一个单位时,平均将要增加或减少的单位数,称回归系数(regressioncoefficient)。对于(x1,y1)、(x2,y2)、(x3,y3)、…、(xn,yn)这样一组数据资料,要了解x和y到底呈何种关系?通常可采用以下方法:1、作散点图将每一对
7、观察值都表示为直角坐标平面上的一个点,作成散点图,对X和Y之间的关系进行初步的考察。·······························xxxyyy(直线,正)(直线,负)(曲线)图7-1x与y的散点图根据散点图可以看出:两个变量相关的性质和密切程度或由x估计y的精确度;两个变量的关系是直线型的还是非直线型的;是否有一些特殊的不规则的点表示着其他因素的干扰等。设x与y之间存在线性关系,如果要概括其在数量上的互变规律,也就是
此文档下载收益归作者所有