资源描述:
《对体育科研中多元回归方程病态设计阵的分析及其LS 估计》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库。
1、对体育科研中多元回归方程病态设计阵的分析及其LS估计的改进彭大松(安徽师范大学体育学院芜湖241000)摘要:本文针对多元回归方程设计阵病态情况下LS估计失去优良性进行分析,讨论了体育科研中多元回归方程设计阵呈病态的原因及其识别方法。并从直观上分析了该种数据导致LS估计不理想的原因。从两个角度提出了有偏估计的办法对LS进行改进。关键词:体育科研多元回归设计阵病态有偏估计OntheAnalysisofAbnormalcasesinMultipliedRegressionEstimationinResearchofsportsSciencePengDaso
2、ng(CollegeofPhysicalEducation,AnhuiNormalUniversity,Wuhu,214000)Abstract:WiththeanalysisofthelossofexcellenceinLSestimationinabnormalcasesinmultipliedregressionequtionprogrammingmatrix,thispaperdiscussesthecausesfortheabnormalityinsportsresearchandthemeanstodistinguishit,withwhi
3、chtheauthordirectlyperceivesthecausesforthelossofexcellenceinLSestimation,andoffersthemeansofbiasedestimationasasolutiontotheimprovementofLSestimation.Keywords:PEresearch,Multipliedregressionequation,Programmingmatrix,Abnormality,Biasedestimation1前言在多元回归分析中,设计阵[5]X病态被表述为X´X中至少有一
4、个特征根非常小即接近于0(又称多元共线性)[1][3]。在体育领域里设计阵病态是一种常见的现象。对这种数据若不加考虑的任用LS方法对回归系数进行估计,会导致严重的后果,常见的是系数估计不稳定,误差过大,甚至出现与实际上相反的符号,此时的LS方法已失去其优良性。本文拟对体育领域中设计阵呈病态进行分析,从直观上说明其破坏LS估计优良性的原因,讨论了体育科研中识别病态数据的方法,并从应用的角度介绍了两种常用的对LS估计不佳的改进办法。2最小二乘估计(LS估计)考虑线性模型[1]:…………………………(1)当取得样本观测值后,回归系数β的最小二乘估计为:=……
5、……………………(2)其中,,是矩阵,,n是样本含量。将x,y标准化后,得到标准回归方程是:……………………………(3)经标准化后x`x变成了相关阵。若x是正常的那么LS估计将是优良的。3设计阵病态时对LS估计的影响在实际应用中,当出现设计阵病态(又称多元共线性),最小二乘估计不再具有优良的性质[1][3]。甚至让分析者得出错误的结论。常见的后果有以下几个方面:对系数的估计误差过大,系数估计不稳定,增减样本时系数改变特别大,甚至出现与实际相违背系数符号。理论上设计阵X呈病态时则
6、x´x
7、≈0。为了从直观上说明LS估计不理想,以及为后面的有偏估计的提出提
8、供理论基础而引进一个评价系数估计优劣的一个标准----均方误差[2]。3.1估计值的均方误差MSE()3.1.1均方误差的定义:若为参数的估计值则MSE=E(
9、
10、-
11、
12、2)称之为估计值的均方误差。(数理统计上符号
13、
14、a
15、
16、表示向量α的长度[3])63.1.2MSE的分解MSE=E(
17、
18、-
19、
20、2)是估计值与参数真值偏离大小的一个度量。具体地,对于一个好的估计,MSE不应该过大。为了更清楚的说明问题,我们对MSE进一步分解:MSE=E[(-)´(-)]=E[(-E)+(E-)]´[(E-)+(E-)]=tr[cov()]+
21、
22、E-
23、
24、2…………………………
25、…………(4)若记´为(1,2,…p)那么(4)式的第一项又可以写成度量的是i各分量估计值的方差。同样(4)式第二项可以写成度量的是估计值I各分量的偏差。理论上这两项均应达到较小才可以被认为是一个好的估计[3]。3.2最小二乘估计的均方误差MSE()在对MSE分解的基础上,来讨论一下最小二乘估计的均方误差MSE()。回归方程同(1)式标准化形式同(3)式,当y~N(xβ,σ2/n)有MSE()=E
26、
27、-β
28、
29、2在统计理论上已经证明了E
30、
31、-β
32、
33、2=σtr(x´x)-1 D
34、
35、-β
36、
37、2=2σ2tr(x´x)-2,其理论依据参见[3]。若x´x的特征根
38、分别是λ1λ2…λp由线性代数知识得到:和的特征根分别是:因而有:E(
39、
40、-β
41、
42、2)=σ2…