欢迎来到天天文库
浏览记录
ID:22863807
大小:452.02 KB
页数:14页
时间:2018-11-01
《直线相关与回归分析》由会员上传分享,免费在线阅读,更多相关内容在应用文档-天天文库。
1、第十章一元回归与相关分析概述:许多问题需要研究多个变量之间的关系,例如生物的生长发育速度就与温度,营养,湿度等许多因素有关。相关关系:两变量X,Y均为随机变量,任一变量的每一可能值都有另一变量的一个确定分布与之对应。回归关系:X是非随机变量(如施肥)或随机变量(如穗长),Y是随机变量,对X的每一确定值xi都有Y的一个确定分布与之对应。区别:1.相关中的两个变量地位对称,互为因果;回归中X是自变量,Y是因变量。两种意义不同,分析的数学概念与推导过程不同,但如果使用共同标准即使y的残差平方和最小(最小二乘法),可得到相同的参数估计式。因此主要讨
2、论X为非随机变量(不包含有随机误差)的情况,所得到的参数估计式也可用于X为随机变量的情况。2.分析目的不同。回归分析是建立X与Y之间的数学关系式,用于预测;而相关分析研究X与Y两个随机变量之间的共同变化规律,例如当X增大时Y如何变化,以及这种共变关系的强弱。分类:从两个变量间相关(或回归)的程度分三种:(1)完全相关。一个变量的值确定后,另一个变量的值可通过公式求出(函数关系);生物学研究中不太多见。(2)不相关。变量之间完全没有任何关系。一个变量的值不能提供另一个变量的任何信息。(3)统计相关(不完全相关)。介于上述两情况之间。知道一个变
3、量的值通过某种公式就可以提供另一个变量的均值的信息。一个变量的取值不完全决定另一个变量的取值,但可或多或少地决定它的分布。科研中最常遇到。研究“一因一果”,即一个自变量与一个依变量的回归分析称为一元回归分析;研究“多因一果”,即多个自变量与一个依变量的回归分析称为多元回归分析。一元回归分析又分为直线回归分析与曲线回归分析两种;多元回归分析又分为多元线性回归分析与多元非线性回归分析两种。对两个变量间的直线关系进行相关分析称为直线相关分析;研究一个变量与多个变量间的线性相关称为复相关分析;研究其余变量保持不变的情况下两个变量间的线性相关称为偏相
4、关分析。注意:1.相关与回归只是一种工具,不是不相干的数据拼凑在一起。2.除X、Y等需研究的因素外,其他的要严格控制一致。(身高与胸围的关系要控制体重)3.对子一般在5对以上4.需限制自变量范围,结果不能随意外延。第一节一元线性回归(一)直线回归方程的建立对于两个相关变量,一个变量用x表示,另一个变量用y表示,如果通过试验或调查获得两个变量的n对观测值:(x1,y1),(x2,y2),……,(xn,yn)为直观看出x和y间的变化趋势,可将每一对观测值在平面直角坐标系描点,作出散点图例11.1对大白鼠从出生第6天起,每三天称一次体重,直到第1
5、8天。数据见表11.1。试计算日龄X与体重Y之间的回归方程。表11.1大白鼠6-18日龄的体重序号12345日龄xi69121518体重yi1116.5222629散点图对X、Y之间的关系有直观的、整体上的印象,但是否有某种规律性,是接近一条直线还是一条曲线等,哪一条直线或曲线可以最好地代表X,Y之间的关系,不能做出判断。图11.1大白鼠日龄—体重关系图一、一元正态线性回归统计模型:对于每个Y的观察值yi来说,由于总是带有随机误差,观察值就应该是在均值的基础上再加上一个随机误差,即:(11.2)其中。随机误差服从正态分布。这是一元正态线性回
6、归的统计模型。二、参数α和β的估计模型中的α和β是参数,一般不知道。由于只能得到有限的观察数据,无法算出准确的α与β的值,只能求出估计值a和b,并得到yi的估计值为:(11.3)a和b应使残差最小。为了避免使正负ei互相抵消,定义使残差平方和达到最小的直线为回归线,即令:,且SSe对a、b的一阶偏导数等于0得:整理后,得(11.4)解此方程,得:这种方法称为最小二乘法记,称为X的校正平方和;,称为Y的总校正平方和;,称为校正交叉乘积和,则:(11.7)a叫样本回归截距,是回归直线与y轴交点的纵坐标,当x=0时,=a;b叫样本回归系数,表示x
7、改变一个单位,y平均改变的数量;b的符号反映了x影响y的性质,b的绝对值大小反映了x影响y的程度;叫做回归估计值,是当x在在其研究范围内取某一个值时,y值平均数α+βx的估计值回归方程的基本性质:1最小2=03.直线通过(,)转化后得到回归方程的另一种形式(中心化形式):在实际计算时,可采用以下公式:例11.1对大白鼠从出生第6天起,每三天称一次体重,直到第18天。数据见表11.1。试计算日龄X与体重Y之间的回归方程。表5.1大白鼠6-18日龄的体重序号12345日龄xi69121518体重yi1116.5222629解:把数据代入上述公式
8、,得:即:所求的回归方程为:y=2.6996+1.5167x带有统计功能的计算器,只需把数据依次输入,然后按一下键就可得到上述结果。根据直线回归方程可作回归直线,并不是所有的散点
此文档下载收益归作者所有