欢迎来到天天文库
浏览记录
ID:57020071
大小:619.00 KB
页数:32页
时间:2020-07-26
《生物统计学课件--15回归分析与检验.ppt》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库。
1、两个或两个以上的变量相互制约相互依存的现象在自然界很多,它们之间的关系大致可分为:确定的(函数)关系:例:S=r2,只要有一个半径,就有唯一的圆的面积与其对应。不确定的关系:例:人的血压和年龄玉米的穗长与穗重身高与体重树木的胸径与树木的高度上述变量之间既存在联系,又不是确定的函数关系对上述不确定的变量关系需要特殊的分析方法第七章回归与相关分析第一节回归与相关的概念一、相关关系设有两个随机变量X与Y,对于任意随机变量的每一个可能的值,另一个随机变量都有一个确定的分布与之对应,则称这两个随机变量间存在相关关系(correlation)
2、。血压与年龄,玉米的穗长与穗重之间的关系,属于相关关系。在研究相关关系时,由于两个随机变量是平行变化的,没有因果关系,我们只能定性地研究它们相关的密切程度和性质,这一过程称相关分析。二、回归关系若对于任意变量X的每一个可能的取值,随机变量Y都有一个确定的分布与之对应,则称Y存在依X的回归关系。在回归关系中,对于任意xi,都不会有一个确切的yi与之相对应,但可以选当X=xi时的Y的平均数与之对应,称为Y的条件平均数。如何估计就是回归分析。三、两个变量的散点图在做两个变量X与Y的关系分析时,首先要搜集数据,从变量X中得到x1,从变量Y中
3、得到y1,我们可以得到n对数据数据(x1,y1)、(x2,y2)、……(xn,yn),为了对X、Y的关系进行初步的考察,并且直观地将其描述出来,我们可以把这些数据作为直角坐标上的点描述出来,称为散点图。例:两个变量的散点图可以提示下列问题:1、两变量相关的性质和密切程度2、两变量之间的关系是否线性3、是否有一些特殊的不规则的点表示着其它因素的干扰四、注意事项:1、变量之间是否存在相关关系及在什么条件下会发生相关是由具体学科决定的2、由于各种事物之间的相互联系和相互制约的普遍存在,因此在研究变量之间的关系,时要求试验条件的均匀性必须得
4、到控制第二节直线回归方程一、一元正态线性回归模型在具有回归关系的两个X与变量Y间,对于任意xi,都不会有一个确切的yi与之相对应,但可以选当X=xi时的Y的条件平均数与之对应。若X是可以控制的变量,在试验无限重复之后,则可以得到在各个xi上的Y的条件平均数,这些平均数构成一条直线:上式的含义是,在X的每一个水平上,都有一个Y的分布,这个分布的平均数是给出的线性函数。试验无限重复的假设是无法实现的,因此,直线的两个参数和是两个未知的常数。对于Y的每一个观察值,可以用以下模型描述:i=1,2,3,……,n其中i在散点图上,表示在x
5、i处Y的观察值yi与之差,该差是个随机误差。对于各个xi,i是相互独立且服从同一正态分布的N(0,2)的随机变量。对于xi,Y是相互独立且服从正态分布的N(+x,2)的随机变量。二、参数和的估计及回归方程由于我们只能通过n次调查获得有限对数据,因此,得不到真正的和,只能求出它们的估计值a和b,从而得到一条估计的直线:我们用估计Y的条件平均数Y·X,“^”的意思是估计值。称为y对x的回归方程。根据所画出的直线,称为回归直线,b是直线的斜率,称为回归系数;a是直线的截距,称为回归截距。要使能最好地代表Y和X在数量上的
6、关系,应使每一个实际观察值yi与的差值最小。由于它们之间的差值有正有负,代数和为零,所以取达到最小值时的回归线,为最好的回归直线。由于所以有:若使L最小,则必使有最小值,根据二元函数求极值的原理因此,必有:所以有:于是我们得到正规方程:{解正规方程,得:SSxy或SP称为X与Y的矫正交叉乘积和。SSx称为X的矫正平方和。SSy称为Y的矫正平方和。例:土壤中NaCl的含量对植物生长有很大的影响,为了研究土壤中NaCl的含量对植物生长的影响,我们进行了测验,测量1000克土壤中所含的NaCl的不同克数(x),对植物单位叶面积干物重(y)
7、的影响。所得数据列于下表,试作回归分析。由散点图可见,两个变量呈线性关系,求回归方程。先根据原始数据计算出二级数据:求出a、b,写出回归方程:三、直线回归方程的图示一般以横轴表示自变量x,以纵轴表示依变量y。纵轴:横轴=4:5或5:6。将原始数据布满整个数轴。以一个较小的x1和一个较大的x2分别代入回归方程求出y1和y2,以点(x1,y1)和点(x2,y2)在直角坐标上连接直线,即为回归线。回归线为一在求得回归方程自变量范围内的线段,不是可以任意外延的直线!超出自变量范围,可能导致荒谬的结论。将散点标于回归图上。例如:某麦田施肥量与
8、产量的关系:y=300+15x四、直线回归方程的估计标准误差称为离回归平方和或误差平方和,以SSe表示。由于在求回归方程时,使用了a、b两个统计量,所以SSe的自由度dfe=n-2,那么,误差的方差:Se2是对2的无偏估计值。i
此文档下载收益归作者所有