资源描述:
《第9.2节 回归分析原理——概率论与数理统计李长青版》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库。
1、第九章方差分析与回归分析第二节回归分析原理一个过程中多个变量之间的关系分为两类:确定性关系是指当一些变量的值确定以后另一相关关系是指变量之间有一定的依赖关系,但确定性关系也就是通常所说的函数关系;非确定性关系即所谓的相关关系。些变量的值也随之完全确定的关系。当一些变量的值确定以后,另一些变量的值虽随之变化却并不能完全确定,这时变量间的关系不能精确地用函数来表示。回归分析是数理统计中研究一个响应变量与若干回归分析的任务主要有三个:(1)给出建立具有相关关系的变量之间的数学关个预报变量之间相关关系的一种有效方法;一个预报变量的回归分析称为一元回归分析,个预报变量的回归分析称为多
2、元回归分析。系式(通常称为经验公式)的一般方法;(2)判别所建立的经验公式是否有效;判别哪些预报变量对响应变量的影响是显著的,哪些是不显著的;(3)利用所得到的经验公式进行预测和控制。其中只有多于一一、一元线性回归模型当随机变量Y与普通变量x之间有线性关系时,可假设…………(1)其中a,b,σ2为不依赖于x的未知参数,上式称为一元线性回归模型,简称一元线性模型.此时有称Y的期望为Y关于x的线性回归函数,a,b为回归系数,x为回归变量.Y与x间有线性相当Y与x间满足这种关系时,关关系.设是取自总体的一组样本,而是该样本的观察值.则有其中相互独立.回归分析就是根据样本观察值寻求
3、a,b的估计对于给定x值,取作为的估计.…………(2)方程(2)称为Y关于x的线性回归方程或经验公式,其图形称为回归直线,称为回归系数.二、参数的估计对于样本观测值记为了研究变量x与y之间的线性关系,考察由所作的散点图与直线的偏离程度.令是点则到直线的距离的平方和,称其为偏差平方和.显然,偏差平方和越小的直线,越能较好地反映变量x与y之间的关系.因此,问题归结为求参数b,a的估计估计值越小的直线,越能较好地反映变量x与y之间的关系.因此,问题归结为求参数b,a的估计估计值使得取得最小值,即满足满足上式的称为a,b的最小二乘估计,可用微分法求得.将Q(a,b)对a,b求偏导并
4、令偏导数为零由此可得规范方程为其中解此方程组得由此可得规范方程为其中记解此方程组得记而回归方程为而的计算公式为例1某种物质在不同温度下可吸附另一种物质,如果温度x(单位:℃)与吸附重量y(单位:)的观测值如下表所示:重量温度4.85.77.08.310.912.413.113.615.31.51.82.43.03.53.94.44.85.0试求吸附重量y和温度x的回归方程.解直接计算可得解直接计算可得所求的回归方程为二、回归方程的有效性检验当且仅当a≠0时,变量Y与x之间存在线性相关关系,为了检验Y与x之间的线性相关的显著性,应当检验检验原假设H0:a=0是否成立。若拒绝H
5、0,则认为Y与x之间存在线性关系,所求得得线性回归方程有意义;若接受H0,则认为Y与x的关系不能用一元线性回归模型来表示,所求得的线性回归方程无意义。方差分析法(F—检验法)考察样本y1,y2,……yn的偏差平方和,或称总平方和注意到及对上式中的交叉项,有注意到及它反映了观测值偏离回归直线的程度,这种偏离是由此得平方和分解公式如下:其中由于观测误差等随机因素引起的.回归平方和反映回归值的分散度,这种分散是由于Y与x之间得线性相关关系引起的;Q剩与Q回的比值反映了这种线性相关关系与随机因素对y的影响的大小;比值越大,线性相关性越强.回归平方和…………基于此,构造检验统计量关系
6、显著.反之认为y对x没有线性相关关系,所求的线性回归方程无实际意义.给定显著性水平若则拒绝假设H0,即线性例2小麦基本苗数x及有效穗数y(单位:万)的5组观察数据如下:49.243.141.041.939.4有效穗数yi44.436.630.025.815.0基本苗数xi试求线性回归方程,并检验y与x之间的相关性解由已知数据直接计算得解由已知数据直接计算得由此得回归方程为回归系数的检验检验假设计算回归平方和与剩余平和查表得临界值因为所以,拒绝H0,可以认为y与x之间具有线性相关关系,回归方程显著有效.三、可线性化的非线性回归分析问题(1)双曲线型令(2)指数型若c>0,令若
7、c<0,令(3)幂函数型若c>0,令若c<0,令(4)对数曲线型令(5)逻辑曲线型令