欢迎来到天天文库
浏览记录
ID:51478178
大小:767.50 KB
页数:37页
时间:2020-03-24
《《直线回归与相关》PPT课件.ppt》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库。
1、第八章直线回归与相关分析统计关系是一种非确定关系,即一个变数的取值受到另一变数的影响,两者之间有关系,但又不存在完全确定的函数关系。如:施肥量与产量的关系药物浓度与反应率的关系;一、函数关系与统计关系函数关系是一种确定的关系。例如圆面积与半径的关系为:第一节直线回归与相关的基本概念二、自变数与依变数对据有统计关系的两个变数,分别用变数符号Y和X表示。根据两个变数的作用特点,统计关系又可分为因果关系和相关关系两种。两个变数间的关系若有原因和反应(结果)的性质,则称这两个变数间存在因果关系,并定义原因
2、变数为自变数,以X表示;定义结果变数为依变数,以Y表示。如果两个变数并不是原因和结果的关系,是一种平行关系,呈现一种共同变化的特点,则称这两个变数间存在相关关系。如在人的身高和体重关系中,它们不是互为因果,而是同步增长、互有影响的。相关关系中没有自变数和依变数之分。相关关系:(1)对具有因果关系的两个变数,统计分析的任务是由实验数据推算出一个表示Y随X的改变而改变的方程,称之为回归方程(regressionequationofYonX),这一过程称为回归分析。(2)对具有相关关系的两个变数,统计分
3、析的目标是计算表示Y和X相关密切程度的统计数,并测验其显著性。这一过程称为相关分析。三、回归分析和相关分析相关分析只能研究两个变数y和x相关密切程度,而不能用一个变量去预测和控制另一个变量的变化,这是回归分析和相关分析区别的关键所在。但二者不能截然分开,由回归分析可以获得相关的一些重要信息,由相关分析可以获得回归的一些重要信息。对于同一资料来说,回归系数和相关系数进行显著性检验,都是检验该总体有无直线关系。对于同一资料,回归显著,相关显著;反之也成立。回归分析和相关分析:四、两个变数资料的散点图将
4、两个变数的n对观察值(x1,y1)、(x2,y2)、…、(xn,yn)分别以坐标点的形式标记于同一直角坐标平面上得到的图,称为散点图(scatterdiagram)。1234x,生物产量(g)0.00.51.01.52.0y,稻谷产量(g)水稻单株生物产量与稻谷产量的散点图3.23.644.44.8x,每平方米颖花数(万)05560657075y,结实率(%)水稻每平方米颖花数和结实率的散点图34567890250300350400450x,最高叶面积指数y,产量(kg/亩)水稻最高叶面积指数和亩
5、产量的散点图利用散点图判断相关性质及密切程度r=-1(d)r=1(b)00时)或减少(b<0时)的单位数,叫回归系数(regressioncoefficeint)。一
6、、直线回归方程式从上图得知,要使能够最好地代表y和x在数量上的互变关系,必须使yx(yi-)实际观察值与估计值之差二、求a和b值分别对a和b求偏导并令其为0,即:式中是x的离均差和y的离均差的乘积之和,简称乘积和(sumofproducts),记作SP。[例7.1]一些夏季害虫盛发期的早迟和春季温度高低有关。江苏武进连续9年测定3月下旬至4月中旬旬平均温度累积值(x,旬.度)和水稻一代三化螟盛发期(y,以5月10日为0)的关系,得结果于下表。试计算其直线回归方程。x累积温35.534.131.74
7、0.336.840.231.739.244.2y盛发期12169273139-1三、直线回归方程的计算解:1.由观察值计算一级数据2.由一级数据计算二级数据3.求a和b值4.求回归方程:当3月下旬至4月中旬的积温(x)每提高1旬·度时,一代三化螟的盛发期平均将提早1.1天;若积温为0,则一代三化螟的盛发期将在6月27—28日(x=0时,y=48.5;因y是以5月10日为0,故48.5为6月27—28日)。但在应用回归方程预测时,需限定x的区间为[31.7,44.2];如要在x<31.7或>44.2
8、的区间外延,则必须有新的依据。回归系数和回归截距的意义:x,3月下旬至4月中旬旬平均温度累积值旬平均温度累积值和一代三化螟盛发期的关系四、直线回归方程的图示五、直线回归的估计标准误满足为最小的直线回归方程和实测的观察点并不重合,表明该回归方程仍然存在随机误差。Q就是误差的一种度量,称之为离回归平方和或剩余平方和。由于在建立回归方程时用了a和b两个统计数,故Q的自由度ν=n-2。因而,可定义回归方程的估计标准误为:Q值的计算:(1)F测验第三节直线回归的假设测验一、直线回归的假设测验
此文档下载收益归作者所有