欢迎来到天天文库
浏览记录
ID:62167379
大小:297.85 KB
页数:3页
时间:2021-04-20
《回归方程确定系数.docx》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库。
1、回归方程确定系数R2和调整的R2R2称为回归方程的确定系数,它取值在[0,1]之间。R2越接近1,表明方程中的变量对y的解释能力越强。通常将R2乘以100%表示回归方程解释y变化的百分比。当采用曲线拟合数据时,R2可以作为选择不同模型的标准。当模型中的变量是线性关系时,R2是方程拟合优度的度量。R2越大,说明回归方程拟合数据越好,或者说x与y线性关系越强。即回归方程中的自变量对y的解释能力越强。当R2等于1时,所有的观察值都落在拟合线(或拟合平面)上。R2越小。说明x与y的线性关系越弱,它们之间的独立性越强,或者说对x的了解无助于对y的预测。当线性方程的R2接近于0时,
2、说明x与y几乎不存在线性关系,但可能存在很强的非线性关系。R2的数学公式为(图1):R2=1-SSErrorSSTotal=1-Σ(Y-)Σ(Y-)式中:Y=第i个观察到的响应值=第i个拟合响应值=响应平均值图1第i个观察到的响应值这里需要验证Y第i个拟合响应值拟合线观察值落在拟合线上这里需要验证X随着自变量个数的增加,残差平方和逐渐减少,R2随之增大,尽管有的自变量与y线性关系不显著,将其引入方程后,也会使R2增加,R2倾向于高估实际的拟合优度。为了避免这种情形,常用调整的R2代替R2。一种调整的R2的数学公式为:R2=1-MSErrorSSTotal/DFTotal
3、但是R2高并不表示模型选择是正确的。有时我们所选取的部分数据所推断的拟合方程是非常正确的,其R2值也很高,但是当我们选取超出这部分的样本时拟合方程还有效吗?如图2所示,我们还能在红线部分确定方程的Y值吗?显然不行,我们的模型只在有限的数据部分是正确的!突破这个部分必须经过验证!对于回归方程所确定的拟合线,应当把它看作线段(图2上的黑线),而不能看作纯几何意义上的直线!图2在建立回归方程之前,通常应该先观察散点图以确定合适的模型,这时的R2才是有意义的。
此文档下载收益归作者所有