线性回归模型 毕业论文

线性回归模型 毕业论文

ID:345147

大小:380.00 KB

页数:15页

时间:2017-07-26

线性回归模型  毕业论文_第1页
线性回归模型  毕业论文_第2页
线性回归模型  毕业论文_第3页
线性回归模型  毕业论文_第4页
线性回归模型  毕业论文_第5页
资源描述:

《线性回归模型 毕业论文》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、线性回归模型摘要:建立线性回归模型是建立Y与X的适当的线性回归关系,通过及最小二乘估计和有关的统计推断可以预测未来的数据。关键词:多元线性回归模型,多元线性回归模型的矩阵表示,及的最小二乘估计,统计推断。15线性回归模型1、线性回归模型及其矩阵表示设Y是一个可观测的随机变量,它受到p-1个非随机因素和随机因素的影响。若Y与有如下线性关系:称此模型为线性回归模型,其中是未知参数(回归系数);是应变量或响应变量;称自变量或回归变量;称为随机误差项并假定是不可观测的随机变量,而Y与是可观测的变量。要建立多元线性回归模型,首先要估计未知参数进行n(n>p)次独立观测,得到n

2、组数据(样本)其中相互独立且均服从分布。令其中Y称为观测向量,X称为设计矩阵。并假定X为列满秩的,即,是对估计的未知参数商量,是不可观测的随机误差商量。是多元线性回归模型的矩阵形式。152、参数估计2.1的最小二乘估计如果Y与满足线性回归模型侧误差应是比较小的,因此,选择使误差项的平方和达到最小,其中,为此,将分别对求偏导并令其等于零,得K=0,1,…,P-1即K=0,1,…,P-1矩阵形式是称此方程为正规方程。因为故存在,解正规方程即得的最小二乘估计为2.2误差方差的估计将自变量的名组观测值代入回归方程,可得因变量的各估计值(称为拟合值)为称15为残差向量,其中为

3、n阶对称幂等矩阵,I为n阶单位矩阵,称数为残差平方和(SSE)注意到且,故因此可得其中表示矩阵的迹,从而为的无偏估计。3、有关的统计推断3.1回归关系的统计推断给定因变量Y与自变量的n组观测值,利用前述方法可得到未知参数和的估计,从而可给出Y与之间的线性回归方程,但所求得的回归方程是否有意义,也就是说Y与之间是否存在显著的线性关系,还需要对回归方程进行检验。3.1.1建立方差分析表我们知道观测值之所以有差异是由下述两个原因引起的,一是当Y与之间确定有线性关系时,由于取值的不同,而引起值的变化;另一方面是除去Y与15的线性关系以外的因素,如对的非线性影响及随机因素的影

4、响等,记则数据的总的离差平方和反应了数据波动性的大小残差平方和反应了数据除去Y与之间的线性关系以外的因素引起的数据的波动。如果回归平方和反应了线性拟合值与它们的平均值的总偏差即由变量的变化所引起的的波动。若SSE,SST和SSR有如下形式的矩阵表示15J表示一个元素全为1的n阶方阵。自由度:自由度是指平方和中独立变化项的数目。由于有一个关系式即彼此不是独立变化的,故SST的自由度是n-1,SSE的自由度为n-p,SSR的自由度为p-1,它们的自由度关系是:n-1=(n-p)+(p-1)方差分析表方差来源平方和(SS)自由度(F)均方(MS)回归p-1误差n-p总和n

5、-1利用方差分析表,可对回归方程的显著性做检验。3.1.2线性回归关系的显著性检验为检验Y与之间是否存在显著的线性回归关系,即检验。假设15给定显著性水平查分布表得临值,计算F的观测值。若:3.2回归参数的统计推断回归关系中不一定每个自变量X对Y的影响都显著的。因此,我们对自变量对的显著性关系进行检验。检验假的最小二乘估计为则而所以由于为的无偏估计,从而自然地以作为的估计。所以的估计其中为的全对角线上的第k个元素的平方根,t(n-p)为自由度为n-p的分布15若:为真不真有偏大的趋势4、实例摸公司在各地区销售一种特殊的化妆品,该公司观测了15个城市在某个月内对该化妆

6、品的销售量Y及各地区适合使用该化妆品的人数和人均收入的数据如下。化妆品销售的调查数据地区i销量人数(千人)人均收入(元)11622742450212018032543223375380241312052838567862347616926537827819830088192330245091161952137105553256011252430402012232372442713144226266014103157208815212370260515假设误差服从分布,试建立与之间的线性回归方程并研究相应的统计推断问题。解:我们先看以下这些数据的用MATLAB程序来得

7、到的图形。化妆品销售数据的MATLAB程序是:clearx1=[274,180,375,205,86,265,98,330,195,53,430,372,236,157,370];x2=[2450,3254,3802,2838,2347,3782,3008,2450,2137,2560,4020,4427,2660,2088,2605];y=[162,120,223,131,67,169,81,192,116,55,252,232,144,103,212];scatter3(x1,x2,y)程序结果是:设与,的观测值之间满足关系,其中15相互独立,均服从正太分布

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。