资源描述:
《第7章直线回归与相关分析ppt课件.ppt》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库。
1、第七章直线回归与相关★本章讨论两个变量间的相互关系问题例如S=πr2也称做函数关系常见于力学、电学、光学、运动学等在农学和生物学中较少见1、确定性关系可用精确的数学表达式表示一、变量之间的关系2、不确定性关系不能用精确的数学表达式来表示例如,作物产量与其影响因素温度、雨量等之间的关系,一个变量只是部分地引起另一个变量的变化,没有一个确定的数值与之对应常见于农业科学和生物学中从统计学角度讲,确定性关系与不确定性关系的区别仅在于前者不存在随机误差,而后者不可避免地具有试验误差﹡。统计学上把变量之间既存在着密切关系,又不能由一个变量(或几个变量)的数值准确地求出另一个变量数值的关系称为相关关系
2、,并把存在相关关系的变量称为相关变量。相关变量间的关系分为两种情况:◆因果关系一个变量是原因,另一个变量是结果原因变量可事先设计、固定,结果变量则带有随机误差例如:播种期与产量,播种期是原因变量,可事先设计,而产量是结果变量,带有随机误差◆平行关系两个变量相互影响,互为因果二者都有随机误差例如水稻的穗长与每穗粒数回归分析(regressionanalysis)对因果关系变量的统计分析二、回归和相关分析建立由X来预测Y的线性回归方程式预测X取某一定值时Y的变化区间相关分析(correlationanalysis)对平行关系变量的统计分析研究两个变量之间线性相关的性质和密切程度考察n对试验数
3、据的关系:(x1,y1)、(x2,y2)、…、(xn,yn)通常可采用以下方法:1、作散点图第一节直线回归分析2、建立直线回归方程••••••••图1(直线,正相关)图2(直线,负相关)图3(曲线)••••••••••••••••••••••xyxxyy1、作散点图:表示该直线的斜率,是x每增加一个单位数时,平均地将要增加或减少的单位数,称做回归系数。2、建立直线回归方程其中,:是x=0时的值,即回归直线在y轴上的截距,称做回归截距;:y的回归估计值:观测值(x,y)ab••••••••••yx对于n对(x,y),理论上可以作无数条直线但是哪一条最能代表x与y在数量上的互变关系?••••
4、••••••xy显然y的观察值和回归估计值之间的偏差越小越好,因此有:••••••••••yxQ称为离回归平方和SP:是自变数x的离均差和依变数y的离均差的乘积和,简称乘积和SSx:平方和这种求解a、b的方法称做最小二乘法,或最小平方法。由此a、b构成的直线回归方程具有以下三个性质:①②③3建立直线回归方程实例【例7.1】一些夏季害虫盛发期的早迟和春季温度高低有关。江苏某县测定1956-1964年间3月下旬至4月中旬旬平均温度累积值x(单位:旬·度)和一代三化螟蛾盛发期y(以5月10日为0)的关系于下表,试计算其直线回归方程。X(累积温)35.534.131.740.336.840.23
5、1.739.244.2Y(盛发期)12169273139-1(月/日)5/255/205/155/105/55/30x,3月下旬至4月中旬平均温度累计值y,一代三化螟盛发期i作散点图ii计算a和b,建立直线回归方程⑴首先计算6个一级数据:∑x=35.5+34.1+…+44.2=333.7∑x2=35.52+34.12+…+44.22=12517.49∑y=12+16+…+(-1)=70∑y2=122+162+…+(-1)2=794∑xy=(35.5×12)+(34.1×16)+…+〔44.2×(-1)〕=2436.4n=9⑵计算5个二级数据:得到该资料的直线回归方程:⑶计算2个三级数据:
6、意义:◆若积温x=0,则一代三化螟蛾的盛发期在6月27-28日◆当3月下旬至4月中旬的积温(x)每提高1旬·度时,一代三化螟蛾的盛发期平均将提早1.1天iii计算线性回归的估计标准误回归值和实测值存在着一定的偏差,可用估计标准误来度量:由线性回归方程所估计的公式表明:①Sy.x值愈小,各个观察点愈靠近回归直线,估计愈准确②Sy.x值愈大,各个观察点离回归直线愈远,估计愈不准确例如:计算上例的回归估计标准误解:结果表明,当用回归方程预测一代三化螟蛾盛发期时,有一个3.266天的估计标准误4线性回归的假设测验若变数x和y所属总体并不存在直线回归关系,但由其中的一个样本总可以得到一个直线回归方
7、程,显然这样的回归方程是靠不住的,因此必须进行显著性检验i、t测验︱t︱﹥t0.01,7=3.50,否定H0:,接受即积温和一代三化螟蛾盛发期是有真实的直线回归关系的例如:试测验例7.1资料回归关系的显著性解:ii、F测验(1)Y变异的分解Y的总变异=因X所引起的变异+误差变异因而有:(2)F测验例如:试测验例7.1资料回归关系的显著性解:Q=74.6670U=SSy-Q=249.5556-74.6670=174.8886F﹥F0.