欢迎来到天天文库
浏览记录
ID:20265839
大小:73.00 KB
页数:10页
时间:2018-10-11
《论加权回归与建模》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、论加权回归与建模摘要:以加权回归估计方法为核心,对林业上常用模型的异方差性进行了研究,提出了能彻底消除异方差的最佳权函数。并对模型的评价指标进行了探讨,提出了评价通用性回归模型的3大指标,并分析了加权回归估计与这些评价指标之间的关系。最后对样本资料的收集进行了讨论,提出了收集建模样本应遵循的基本原则。关键词:加权回归建模异方差模型评价林业数表模型是森林经营决策必不可少的计量、预测、评价依据,保证模型质量至关重要,而样本组织、模型拟合方法和模型评价是保证质量的3个重要环节。实践证明,林业数表模型所描述的问题普遍存在异方差性,在模型拟合中若不采取消除异方差
2、影响的有效方法,必然导致模型有偏。为此,一般可采取加权最小二乘法拟合模型,但在权函数的选择上尚存在两个有待进一步解决的问题:一是权函数的形式因模型所描述的事物的性质不同而异,确定最佳权函数十分繁琐;二是到目前为止,尚未找出能完全消除异方差的权函数。本文旨在提出一种可以完全消除异方差影响的权函数通式,并给出正确评价模型的指标体系及组织建模样本的基本原则。 1 加权回归的概念 确定变量之间的回归关系,一般情况下是利用普通最小二乘法。假设随机变量y~,其中,E(y)=f(x)。也就是说,随机变量y与x满足下列模型:y=f(x)+ε (1)式中的ε有3
3、个基本假定,即“独立、正态、等方差”,它们是采用普通最小二乘法建立回归模型的先决条件。3个条件中的“独立”与“正态”在一般情况下都是基本满足的,而“等方差”这一条件,则在很多情况下都难以满足。为解决误差项ε的异方差性问题,应设法校正原有的模型,使校正后的模型其误差项具有常数方差,而模型的校正取决于方差σ2εi与自变量xi之间的关系。假设εi的方差与xi的函数g(xi)呈比例关系,即:σ2εi=g(xi)σ2 (2)这里σ2是一个有限常数。于是用去除原有模型,可使新模型的误差项具有常数方差。用这种方法估计模型中相应的参数,叫做加权最小二乘法(俞大刚
4、,1987)。2 权函数的选择2.1 异方差性的基本概念 根据回归估计理论,当建立的回归模型的误差项存在异方差时,必须采用加权最小二乘法来消除异方差对参数估计的影响。在林业上所涉及的许多数学模型,如材积模型、生物量模型、生长率模型、削度模型等,其误差项的方差都不为常数,而是随解释变量的变化而变化(骆期邦等,1992;曾伟生等,1992;曾伟生,1996)。一般而言,模型预估值随解释变量的增大而增大时,其误差项的方差也随解释变量的增大而增大,如材积模型和生物量模型;模型预估值随解释变量的增大而减小时,其误差项方差也随解释变量的增大而减小,如生长率模型。
5、在残差图上反映出来,二者都为喇叭型。另外,预估变量的变化范围愈大,异方差性一般也愈明显。因此,采用适当形式缩小预估变量的变动幅度,可在一定程度上消除异方差性。如将材积转化为形数来建模,可将预估变量的取值大致控制在0.35~0.65的范围,使预估值的最大相差倍数从数千倍缩小至2倍以内,从而基本上消除了异方差性。将生长量转化为生长率再建模,也在很大程度上缩小了预估值的变动幅度,可明显削弱其异方差性。2.2 权函数选择的研究现状 上面提到的一些常用模型,由于存在异方差,因此必须选用适当的权函数来进行加权回归估计。关于这一点,近几年已经逐步有了认识。如对材积
6、模型V=aDbHc的估计,一般认为选用权函数ARGIN-RIGHT:-34.65pt;TEXT-ALIGN:center"align=center>E(ε′)=E[ε/f(x)]=E[y/f(x)-1]由(6)式知,E[y/f(x)]=1,故E(ε′)=0。 方差:式中f(e′i)为频数(董德元等,1987)。可用建模样本对上述方差D(ε′) 作出如下无偏估计: 因此,新模型误差项的期望值为0,其方差为常数,即对所有xi来说,每个ε′i的方差都相同;满足等方差的条件。至此可以得出结论:以模型本身构造的权函数(3)式就是要寻找的最佳权函数。3 模型评
7、价与加权回归3.1 回归模型评价指标 建立回归模型,从一般的意义上讲有以下3个目的(刘璋温等,1983): 结构分析——对观测数据进行分析,以便描述存在于解释变量与目标变量之间的结构关系; 预测——以已知解释变量的值来预测目标变量的未来值或期望值; 控制——为使目标变量的值保持在一个理想的水平上,而适当调整解释变量中可调整的变量值。 在上述3个目的中,预测是最根本的。因为结构分析可以考虑为在更一般的条件下预测目标变量的变化问题,而控制可以考虑为针对解释变量的不同水平来预测相应的目标变量的值,以便从中选择最佳变量的问题。事实上,林业上的所有通用
8、性数表的编制都可以看成是用于预测的超总体回归模型的建立问题。如何评价这类模型的优劣,一直是林业
此文档下载收益归作者所有