资源描述:
《对体育科研中多元回归方程病态设计阵的分析及其ls 估计的改进》由会员上传分享,免费在线阅读,更多相关内容在应用文档-天天文库。
1、对体育科研中多元回归方程病态设计阵的分析及其LS估计的改进彭大松(安徽师范大学体育学院芜湖241000)摘要:本文针对多元回归方程设计阵病态情况下LS估计失去优良性进行分析,讨论了体育科研中多元回归方程设计阵呈病态的原因及其识别方法。并从直观上分析了该种数据导致LS估计不理想的原因。从两个角度提出了有偏估计的办法对LS进行改进。关键词:体育科研多元回归设计阵病态有偏估计OntheAnalysisofAbnormalcasesinMultipliedRegressionEstimationinResearchofs
2、portsSciencePengDasong(CollegeofPhysicalEducation,AnhuiNormalUniversity,Wuhu,214000)Abstract:WiththeanalysisofthelossofexcellenceinLSestimationinabnormalcasesinmultipliedregressionequtionprogrammingmatrix,thispaperdiscussesthecausesfortheabnormalityinsportsre
3、searchandthemeanstodistinguishit,withwhichtheauthordirectlyperceivesthecausesforthelossofexcellenceinLSestimation,andoffersthemeansofbiasedestimationasasolutiontotheimprovementofLSestimation.Keywords:PEresearch,Multipliedregressionequation,Programmingmatrix,A
4、bnormality,Biasedestimation1前言在多元回归分析中,设计阵[5]X病态被表述为X´X中至少有一个特征根非常小即接近于0(又称多元共线性)[1][3]。在体育领域里设计阵病态是一种常见的现象。对这种数据若不加考虑的任用LS方法对回归系数进行估计,会导致严重的后果,常见的是系数估计不稳定,误差过大,甚至出现与实际上相反的符号,此时的LS方法已失去其优良性。本文拟对体育领域中设计阵呈病态进行分析,从直观上说明其破坏LS估计优良性的原因,讨论了体育科研中识别病态数据的方法,并从应用的角度介绍了两
5、种常用的对LS估计不佳的改进办法。2最小二乘估计(LS估计)考虑线性模型[1]:…………………………(1)当取得样本观测值后,回归系数β的最小二乘估计为:=…………………………(2)其中,,是矩阵,,n是样本含量。将x,y标准化后,得到标准回归方程是:……………………………(3)经标准化后x`x变成了相关阵。若x是正常的那么LS估计将是优良的。3设计阵病态时对LS估计的影响在实际应用中,当出现设计阵病态(又称多元共线性),最小二乘估计不再具有优良的性质[1][3]。甚至让分析者得出错误的结论。常见的后果有以下几个
6、方面:对系数的估计误差过大,系数估计不稳定,增减样本时系数改变特别大,甚至出现与实际相违背系数符号。理论上设计阵X呈病态时则
7、x´x
8、≈0。为了从直观上说明LS估计不理想,以及为后面的有偏估计的提出提供理论基础而引进一个评价系数估计优劣的一个标准----均方误差[2]。3.1估计值的均方误差MSE()3.1.1均方误差的定义:若为参数的估计值则MSE=E(
9、
10、-
11、
12、2)称之为估计值的均方误差。(数理统计上符号
13、
14、a
15、
16、表示向量α的长度[3])63.1.2MSE的分解MSE=E(
17、
18、-
19、
20、2)是估计值与参数真值偏离
21、大小的一个度量。具体地,对于一个好的估计,MSE不应该过大。为了更清楚的说明问题,我们对MSE进一步分解:MSE=E[(-)´(-)]=E[(-E)+(E-)]´[(E-)+(E-)]=tr[cov()]+
22、
23、E-
24、
25、2……………………………………(4)若记´为(1,2,…p)那么(4)式的第一项又可以写成度量的是i各分量估计值的方差。同样(4)式第二项可以写成度量的是估计值I各分量的偏差。理论上这两项均应达到较小才可以被认为是一个好的估计[3]。3.2最小二乘估计的均方误差MSE()在对MSE分解的基础上,来讨
26、论一下最小二乘估计的均方误差MSE()。回归方程同(1)式标准化形式同(3)式,当y~N(xβ,σ2/n)有MSE()=E
27、
28、-β
29、
30、2在统计理论上已经证明了E
31、
32、-β
33、
34、2=σtr(x´x)-1 D
35、
36、-β
37、
38、2=2σ2tr(x´x)-2,其理论依据参见[3]。若x´x的特征根分别是λ1λ2…λp由线性代数知识得到:和的特征根分别是:因而有:E(
39、
40、-β
41、
42、2)=σ2…