欢迎来到天天文库
浏览记录
ID:41356851
大小:852.50 KB
页数:65页
时间:2019-08-22
《第8章 回归分析》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库。
1、现代高等工程数学电子教案第8章回归分析数学学院应用数学系王国富2012年9月引例:某厂生产的圆钢,其屈服点Z受含碳量x和含锰量y的影响,现做了25次观察,测得如下数据x16181917201616151918y39383939384845484848Z2424.524.5242524.5242424.524.5x18171717181820211618y46484946444548485555Z24.524.52524.524.524.525252525x1919211921y5658584949Z25.525.526.
2、524.526试通过上述数据建立起它们之间的关系?回归分析回归分析是数理统计的一个应用分枝,它主要研究变量与变量之间的某一种相依关系,其主要内容包括线性回归与非线性回归.一元回归与多元回归.这一节介绍一元线性回归.回归的含义变量与变量之间的关系有两种:一种是函数关系;当一组变量取定一个值时,另一个变量也有确定的值与它对应这是一种函数关系。另一种关系不能用函数关系来描述,比如人的身高与体重之间的关系;农作物的产量与施肥量之间的关系就不能用函数关系来描述.变量可以分为可控变量与不可控变量(随机变量)在回归分析中,讨论的是随机
3、变量与可控变量之间的关系.随机变量作为因变量(响应变量),可控变量作为自变量.当自变量只有一个变量时的回归分析为一元回归,否则称为多元回归.假设随机变量Y与x有一元回归关系.当选定x时,Y的数学期望应为x的函数,记回归分析的一般步骤:(1)求取试验数据(2)选取回归模型(3)对回归模型中的未知参数作估计(4)对模型进行检验(5)预测与控制(1)求取试验数据(2)选取回归模型当选取的是一元线性回归函数时,其回归模型可写为(3)对回归模型中的未知参数作估计当选取回归模型为(4)对模型进行检验我们是根据经验和散点图选定模型的,
4、模型是否切合实际,需要对模型进行检验。(5)预测与控制一元线性回归模型先假定一元线性回归模型要使L达到最大,只要等式右边的平方和的部分达到最小即可。通过求导,并令其为零,可得方程组注意:当随机误差服从正态分布时,参数的最小二乘估计就是极大似然估计,当随机误差不服从正态分布时,参数的最小二乘估计一般与极大似然估计不同。一元线性回归模型中回归系数的最小二乘估计为为了对模型及模型参数进行检验,我们需要知道估计量的分布,下面对随机误差服从正态分布的情况下给出了一些统计量的分布:我们有我们仅证明(1)(2)。证明(1)证明(2)假
5、设检验假设检验包括参数检验和线性模型的检验。t-检验F-检验r-检验(样本相关系数检验)预测与控制我们可以得到由预测区间可以看出:控制:控制是预测的反问题,当因变量y在某一范围内取值时,x应控制在什么范围之内。这个问题比预测要复杂。例.为研究温度对某个化学过程的生产量的影响,收集到如下数据(规范化形式):温度x-5-4-3-2-1012345生产量y1547108913141318(1)求Y对X的线性回归方程。(结果保留小数点后两位。)(2)对回归方程的显著性进行检验。(检验水平=0.01,)(3)对规范温度在0.5时,
6、对其规范生产量作95%的预测区间。解(1)(2)采用T检验:选用,故回归方程显著(3),故规范温度在0.5时,其规范生产量的95%的预测区间为(6.43,13.55)多元线性回归模型记则有因此有了上面的结论,我们可以导出检验的检验方法.在这里就不讨论了,参见讲义预测回到引例:某厂生产的圆钢,其屈服点Z受含碳量x和含锰量y的影响,现做了25次观察,测得如下数据x16181917201616151918y39383939384845484848Z2424.524.5242524.5242424.524.5x181717171
7、81820211618y46484946444548485555Z24.524.52524.524.524.525252525x1919211921y5658584949Z25.525.526.524.526试通过上述数据建立起它们之间的关系?记则解:设检验线性模型是否显著和检验假设故因为取所以故线性模型显著又因为故显著地不成立9.2.4变量选择及多元共线性性问题在多元线性回归模型是,由于有多个自变量,存在一些有一元线性回归模型中不会遇到的问题。本节讨论两个涉及到变量之间关系的问题。第一个问题是关于自变量与因变量之间的关
8、系。当我们就一个实际问题建立多元线性回归模型时,可能会考虑到多个对因变量有潜在影响的自变量,但在对数据进行分析之前无法事先断定哪些变量是有效的(对因变量有显著影响),哪些是无效的(对因变量没有显著影响)。有效变量应该保留在模型中,而无效变量应该从模型中去掉。因为无效变量在模型中会对分析结果产生干扰,从而产生误导。那么
此文档下载收益归作者所有