欢迎来到天天文库
浏览记录
ID:48714968
大小:482.50 KB
页数:47页
时间:2020-01-26
《k第十一章 回归及相关分析.ppt》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库。
1、第十一章相关及回归分析§1相关与回归的意义一、相关(correlationanalysis)1.定义:研究两种或两种以上变数(事物)的相关变异的程度叫相关。2.意义:相关分析只能研究两事物或两个以上事物之间相互关系及其相互影响的程度。而不能说明它们之间具有因素或依存关系。3.相关分析的种类直线相关;曲线相关。(简单相关);(复相关)二、回归分析(regressionanalysis)1.定义:研究一种变数受一种或一种以上变种的影响程度的统计分析方法。2.意义:回归分析不仅研究事物间的关系,而且研究事物之间的依存关系。因而可用一种事物(自变量x)去推测另一种
2、事物(依变量)的变异规律。3.回归分析的种类直线回归;曲线回归。(一元回归);(多元回归)四、回归相关分析中几个注意的问题1.变数间是否存在相关,及在什么条件下发生什么样的相关,必须由各具体学科本身来决定。2.研究一个事物(y)和另一个事物(x)的相关或回归关系,则要求其余事物的均匀性必须得到尽可能的严格控制3.两个变数的成对观察值尽可能多一些,并且x取值范围尽可能大一些,一般应在10对以上观察值。Sr:相关系数标准误Sy/x:回归标准误§2直线回归一、直线回归方程的建立对于两个相关变量,一个变量用x表示,另一个变量用y表示,如果通过试验或调查获得两个变量
3、的n对观测值(x1,y1),(x2,y2),……,(xn,yn)x变量和y变量散点图从上图中可以看出:散点图直观地、定性地表示了两个变量之间的关系。①、两个变量间有关或无关;若有关,两个变量间关系类型,是直线型还是曲线型;②、两个变量间直线关系的性质(是正相关还是负相关)和程度(是相关密切还是不密切)1、直线回归方程:在x、y直角坐标平面上可以作出无数条直线,我们把所有直线中最接近散点图中全部散点的直线用来表示x与y的直线关系,这条直线称为回归直线。用一个数学表达式来描述这条回归直线,这个数学表达式叫做回归方程。其中:a、b为两个参数;为依变量估计值。2、
4、回归方程的性质:①、离回归和等于0。即:其中:y为观察值;为拟合方程的理论值②、离回归平方和最小。③、回归直线必须通过P()坐标点,3、最小二乘法求参数a,b根据第二个性质,用微积分学中的求极值的方法,令Q对a、b的一阶偏导数等于0即:整理得正规方程:这种求正规方程的方法叫最小二乘法解方程组得:式中的分子是自变量x的离均差与依变量y的离均差的乘积和,分母是自变量x的离均差平方和,,记作SSX。简称乘积和,记作;a叫做样本回归截距,是回归直线与y轴交点的纵坐标,当x=0时,=a;b叫做样本回归系数,表示x改变一个单位,y平均改变的数量;b的符号反映了x影响y
5、的性质,b的绝对值大小反映了x影响y的程度;叫做回归估计值,是当x在在其研究范围内取某一个值时,y值平均数①②③①、a﹥0,b﹤0②、a﹥0,b﹥0③、a﹤0,b﹥0直线回归方程的图像xy从上图可以看出,由于两个参数(a,b)不同,回归直线在坐标中的位置不同。二、回归方程的拟合步骤:例:P160例9.11、将原始观察值在直角坐标上描散点,看该散点是否大致在一条直线上,若在,可拟合成直线。累积温和一代三化螟盛发期的关系注:y以5月10日为0x(积温)35.534.131.740.336.840.231.739.244.2333.7y(盛发期)12.016.0
6、9273139-170P(,)累积温和一代三化螟盛发期的关系的散点图及回归直线2、计算回归系数b3、将计算的参数,b,a代入方程中得到拟合的方程。4、绘制直线回归方程①、在直角坐标中找到P(②、用原始资料中x的最大或最小值,求算相对应的和,用点P()或P()这个坐标点)在坐标上标点,通过两点,则可得到回归直线。三、回归关系的显著性测定实际观察值y与估计值的差异,就是回归误差1.回归标准误Sy/x是用来衡量实际观察值y与拟合方程计算的Sy/x与回归方程估计的准确度成反比。值差异大小的统计量。为离回归平方和;n-2为自由度2.回归标准误的计算离回归平方和SS
7、y:y观察值的平方和;SPxy:x与y乘积和;SSx:x观察值的平方和:离回归平方和3.回归关系的显著性检验(F检验):若x和y变量间并不存在直线关系,但由n对观测值(xi,yi)也可以根据上面介绍的方法求得一个回归方程=a+bx。显然,这样的回归方程所反应的两个变量间的直线关系是不真实的。如何判断直线回归方程所反应的两个变量间的直线关系的真实性呢?这取决于变量x与y间是否存在直线关系。我们先探讨依变量y的变异,然后再作出统计推断。上式两端平方,然后对所有的n点求和,则有:从图看到:1)平方和的分解:=0因为:所以:反映了y的总变异程度,称为y的总平方和,
8、记为SSy反映了由于y与x间存在直线关系所引起的y的变异程度,称为
此文档下载收益归作者所有