欢迎来到天天文库
浏览记录
ID:27270186
大小:1.09 MB
页数:45页
时间:2018-12-01
《《多元线性回归分析》ppt课件》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库。
1、第6.2节 多元线性回归分析一、多元线性回归模型二、参数的估计三、参数估计量的分布与性质四、回归系数与回归方程的显著性检验五、最优回归方程的选择六、稳健回归一、多元线性回归的数学模型称其为多元线性回归模型为了表述方便,引入矩阵这里In表示阶单位阵。对式(6.15)给出的多元线性回归模型,通常所考虑的问题是,对未知参数和2进行估计,对的某种假设进行检验,对Y进行预报等。在下述讨论中,一般总假定n>m和矩阵的秩等于m+1。二、参数的估计参数向量的最小二乘估计的最小二乘估计满足下式上式可以用矩阵表示为将上式可以改写为
2、此式可以用矩阵表示为其矩阵形式为:例1(p201例6.5)某种水泥在凝固时放出的热量Y与水泥中下列4种化学成份有关:通过实验得到下列数据:序号172666078.52129155274.331156820104.34113184787.6575263395.661155922109.27371176102.78131224472.59254182293.1102147426115.911140233483.8121166912113.3131068812109.4解可以得到回归方程为三、估计量的分布及性质由上一小节内容可
3、知:性质1性质2证由于又考虑到性质3证计算二者的协方差矩阵性质4证这是因为估计量的分布定理6.2证推论1四、回归系数及回归方程的显著性检验1.回归系数的显著性检验构造检验统计量又因为对于给定的显著性水平,拒绝域为:2.回归方程的显著性检验构造检验统计量原假设成立时,可证明对于给定的显著性水平,拒绝域为:例2(续例1)(p207例6.6)解由给定的数据可以计算得到例3(续例1)(p207例6.7)解由给定的数据可以计算得到但从例6.2得知,总的线性回归又是显著的,产生这种现象的原因主要是由于回归变量之间具有较强的线性相
4、关,这时不能简单地采用例6.5给出的线性回归方程,还需要进一步讨论。五、最优回归方程的选择选择最优回归方程的一般原则:(1)寻求一线性回归方程使其包含所有对Y有显著作用的回归变量,剔除不显著的回归变量.(2)估计的标准误差达到最小者为优.即以下介绍几种常用方法:1、穷举法对所有回归变量的所有可能组合,求出其关于Y的线性回归方程,并从中选出最优者.2、“只进不出”法这一方法是根据经验,先选定一个回归变量,然后逐个引入其他回归变量,“只进不出”,但不一定是最优方程.3、“只出不进”法先引入所有变量,然后逐个淘汰,“只出不进”
5、,但也可能遗漏最优方程.4、“有进有出”法-逐步回归法对所有回归变量,按照其对Y影响程度的大小,即统计量的数值的大小,从大到小逐次引入到线性回归方程,每引入一个回归变量,均讨论回归系数进行检验,剔除不显著回归变量,直到无法进入新变量为止.这一方法可以找到最优解.六、稳健估计在最小二乘估计时,如果观测值有异常点,将会影响估计结果,带来较大偏差.为了避免这种现象发生,需要引入其他估计方法弥补此缺陷,这类方法称为稳健估计.本章只介绍其中的一种-M估计法M估计法是最大似然型估计的简称.以下简单给出M估计法的结果(略)或者例4(p
6、209例6.9)在把氨氧化成硝酸的生产中收集了连续21组的数据,以探讨氨的损失率与生产工艺之间关系,这里回归变量是:解用21组数据,用最小二乘法得到计算各点残差,发现第21组数据残差较大,剔除其数据,用剩余的20组数据,用最小二乘法得到计算各点残差,发现第1,3,4组数据残差较大,剔除其数据,用剩余的17组数据,用最小二乘法得到用21组数据,用M估计法得到回归方程,其中函数再见
此文档下载收益归作者所有