《简单线性回归》PPT课件(I)

《简单线性回归》PPT课件(I)

ID:39656271

大小:793.10 KB

页数:72页

时间:2019-07-08

《简单线性回归》PPT课件(I)_第1页
《简单线性回归》PPT课件(I)_第2页
《简单线性回归》PPT课件(I)_第3页
《简单线性回归》PPT课件(I)_第4页
《简单线性回归》PPT课件(I)_第5页
资源描述:

《《简单线性回归》PPT课件(I)》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、第十二章简单线性回归对于考察变量与变量之间关系时,我们采用回归分析的方法建立模型或方程进行变量间关系的分析。因变量:被预测的变量自变量:进行预测的变量简单线性回归模型(对总体而言)为未知参数,为随机误差项,反映其它未列入回归模型的变量对因变量的影响。关于简单线性回归模型的标准假设:1.,可推知,该方程称为回归方程。2.对于所有的X,误差项的方差一样:即同方差假定。3.误差项独立。其协方差为零,4.自变量是给定的变量,与误差项线性无关。5.误差项服从正态分布,从而说明Y服从正态分布对于总体的线性回归模型,由于

2、总体参数未知,我们只能利用样本数据进行估计,得到样本回归模型(对样本而言)。分别为的估计。其中真实值与估计值之间的差距用e来表示:是y的一个估计值。我们称下式为估计回归方程:估计回归方程与总体回归模型之间的区别。总体回归模型是未知的,它只有一个。而估计回归方程则是根据样本数据拟合的,每抽取一组样本,便可以拟合一个样本估计方程。总体回归模型中的1和2是未知的参数,表现为常数。而回归估计方程中的和是随机变量,其具体数值随所抽取的样本观测值不同而变动。总体回归模型中的E是Y与未知的总体回归线之间的纵向距离,它

3、是不可直接观测的。而样本回归模型中的e是Y与估计回归线之间的纵向距离,当根据样本观测值拟合出估计回归方程之后,可以计算出e的具体数值。最小二乘估计法该法的目的:使残差平方和达到最小残差:因变量y的观察值与估计值之间的距离求该式对应的b0,b1可以根据微分的方法求解最优解。令披萨连锁店的销售量与学生人数的回归方程连锁店12345678910学生人数2688121620202226销售收入5810588118117137157169149202序号xyx-x均值y-y均值(x-x均值)*(y-y均值)(x-x均

4、值)^21258-12-7286414426105-8-25200643888-6-422523648118-6-127236512117-2-132646161372714472015762716236820169639234369221498191526410262021272864144x均值y均值SUMSUM141302840568x求和y求和1401300模型的拟合度判定系数:用来判断估计回归方程的拟合程度。误差平方和SSE总平方和SST回归平方和SSRSST=SSR+SSE判定系数SST=SSR

5、+SSEWHY?序号xyy估计x-x均值y-y均值(x-x均值)*(y-y均值)(x-x均值)^2(y-y均值)^2(y-y估计)^2125870-12-7286414451841442610590-8-25200646252253888100-6-4225236176414448118100-6-127236144324512117120-2-1326416996161371402714449972015716062716236729982016916063923436152181922149170819

6、15264361441102620219012728641445184144x均值y均值SUMSUMSUMSUM14130284056815730142001530x求和y求和SSTSSRSSE1401300判定系数=SSR/SST0.902734在该披萨店的例题中,由样本估计得到的回归方程的判定系数为:0.9027我们认为:该估计回归方程有90.27%的总平方和可以通过估计回归方程来解释,我们认为该模型较好的拟合了学生人数与销售额之间的线性关系。判定系数与相关系数的关系:从而有:判定系数=SSR/SST=

7、回忆相关系数的计算公式:本例中:r=0.9501模型的显著性检验在模型进行估计以后,得到了估计回归方程。由于估计回归方程是由样本信息得到的,具有随机性。为了由样本推及总体,我们需要对估计参数进行显著性检验。因此可以利用之前介绍的假设检验的统计方法来判断。1.估计回归模型中残差项的方差之前的假设中,令误差项的方差记为可得,因此也代表了y值的方差。数学上可以证明,方差的无偏估计为MSE(meansquareerror)其中SSE的自由度为n-2,受两个约束(b0,b1)MSE=SSE/(n-2)s称为估计量的标

8、准误差pizza店的例子中,计算得到SSE=1530,因此方差的一个无偏估计,2.T检验及相应的抽样分布T检验:用来判定是否显著为零。H0:=0;Ha:≠0如果x和y相关,则有≠0.如果通过假设检验,我们拒绝了H0,可以相应得到≠0的结论。由于是唯一的,是未知总体的参数,我们需要借助样本计算得到的斜率b1来进行判断。考察b0,b1的抽样分布:可以证明,在标准假定能够得到满足的条件下,回归系数的最小二乘估计量的期望

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。