欢迎来到天天文库
浏览记录
ID:58833560
大小:47.00 KB
页数:4页
时间:2020-09-24
《第十章直线回归和相关分析.doc》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库。
1、第十章直线回归和相关分析v英国生物学家高尔顿(FrancisGalton,1822—1911)提出“回归”一词。1889年出版的《自然遗传》(Naturalinheritance)一书中首次提出并阐明了“相关”的概念及计算两个变数相关程度的“相关系数”(Correlation)的概念。第一节回归和相关意义v一、基本概念v一般变量之间的关系可以分为两类:一类是函数关系,另一类是统计关系。v函数关系是一种确定性的关系,一个变量的取值和变化完全取决于另一个或几个变量的取值和变化。v统计关系是一种非确定性的关系,即一个变量的取值受到另一
2、变量的影响,两者之间既有关系,但又不存在完全确定的函数关系。v对具有统计关系的两个变量的资料进行初步考察的简便而有效的方法,是将这两个变量的n对观察值(x1,y1)、(x2,y2)、…、(xn,yn)分别以坐标点的形式标记于同一直角坐标平面上,获得散点图(scatterdiagram)。v根据散点图可初步判定双变量X和Y间的关系,包括:v①X和Y相关的性质(正或负)和密切程度;v②X和Y的关系是直线型的还是非直线型的;v③是否有一些特殊的点表示着其他因素的干扰等。二、回归分析和相关分析v1.回归分析v对两个变量进行回归分析是定量
3、地研究X和Y的数值变化规律,根据这种规律可由一个变量的变化来估计另一个变量的变化。v在回归模型中,两个变量有因果关系,原因变量称自变量(independentvariable),一般用X表示;结果变量称依变量(dependentvariable),以Y表示。X是已知的或是可控制的,没有误差或误差很小,而Y则不仅随X的变化而变化,还要受到随机误差的影响。v2.相关分析v对两个变量进行相关分析,其目的是研究X和Y间有无相关以及相关程度、相关性质(方向)。v在相关模型中,两个变量是平行的,没有因果关系的自变量和依变量之分,且皆有随机误
4、差。第二节直线回归v一、直线回归方程(linearregressionequation)v1.直线回归方程与参数估计v上式读作“y依x的直线回归方程”。vx是自变量;v是和x的量相对应的依变量y的点估计值;va是x=0时的值,即回归直线在y轴上的截距;vb是x每增加一个单位数时,平均地将要增加(b>0时)或减少(b<0时)的单位数,叫回归系数。v分别对a和b求偏导数并令其为0,即可获得正规方程组(normalequations):v算得的b、a值带入方程式,即可保证v2.直线回归方程的计算v〔例10.1〕某地一年级12名女大学生
5、的体重与肺活量的关系数据列于表10.1,试求肺活量(L)对体重(kg)的直线回归方程。表10.1体重与肺活量关系v散点图解:首先由表10.1算得回归分析所必须的6个一级数据:v然后,由一级数据算得5个二级数据:v故得表10.1资料的回归方程为:v上述方程中回归系数和回归截距的意义为:当体重(x)每增加1kg时,则肺活量平均增加0.558L;若体重为0,则肺活量为0.0004L。限定x的区间为[42,58];如要在x<42或>58的区间外延,则必须有新的依据。v3、直线回归方程的图示v4.直线回归的估计标准误v回归方程的估计标准误
6、sy/x为:v恒等式v[例10.2]试计算由表10.1资料获得的回归方程的估计标准误。代入(10.5)式有:v它的统计意义是:在范围内约有68.27%个观察点,在范围内约有95.45%个观察点等。v5.直线回归的数学模型和基本假定vY总体的每一个值由以下三部分组成:v①Y的总体平均数v因此,总体直线回归的数学模型可表示为:v其中,v相应的样本线性组成为:v直线回归的基本假定v(1)Y变量是随机变量,而X变量则是没有误差的固定变量,至少和Y变量比较起来X的误差小到可以忽略。v(2)在任一X上都存在着一个Y总体(可称为条件总体),它
7、是作正态分布的,其平均数是X的线性函数:v(3)所有的Y总体都具有共同的误差方差v这一方差不因X的不同而不同,而直线回归总体具有试验所得的一组观察值(xi,yi)只是中的一个随机样本。v(4)随机误差相互独立,并作正态分布,具有v二、直线回归的假设检验v1.回归关系的假设检验v(1)t检验v遵循v=n-2的t分布v[例10.3]试检验例10.1资料回归关系的显著性。在例10.1和10.2已算得b=0.,SSx=306.66667,sy/x=0.288,故有:查附表4,t0.05,10=2.228,t0.01,10=3.169。现
8、实得
9、t
10、=3.580大于t0.01107,表明在的总体中因抽样误差而获得现有样本的概率小于0.01。所以应否定H0:b=0,接受H0:b≠0,即认为一年级女大学生体重和肺活量是有真实直线回归关系的,或者说是极显著的。v(2)F检验vSSy将分解成两个部分,即:
此文档下载收益归作者所有