欢迎来到天天文库
浏览记录
ID:28873125
大小:344.50 KB
页数:8页
时间:2018-12-14
《excel回归结果地解读》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库。
1、实用标准文案Excel回归结果的解读利用Excel的数据分析进行回归,可以得到一系列的统计参量。下面以连续10年积雪深度和灌溉面积序列(图1)为例给予详细的说明。图1连续10年的最大积雪深度与灌溉面积(1971-1980)回归结果摘要(SummaryOutput)如下(图2):图2利用数据分析工具得到的回归结果精彩文档实用标准文案第一部分:回归统计表这一部分给出了相关系数、测定系数、校正测定系数、标准误差和样本数目如下(表1):表1回归统计表逐行说明如下:Multiple对应的数据是相关系数(correlationcoefficient),即R=0.
2、989416。RSquare对应的数值为测定系数(determinationcoefficient),或称拟合优度(goodnessoffit),它是相关系数的平方,即有R2=0.9894162=0.978944。Adjusted对应的是校正测定系数(adjusteddeterminationcoefficient),计算公式为式中n为样本数,m为变量数,R2为测定系数。对于本例,n=10,m=1,R2=0.978944,代入上式得标准误差(standarderror)对应的即所谓标准误差,计算公式为这里SSe为剩余平方和,可以从下面的方差分析表中读
3、出,即有SSe=16.10676,代入上式可得最后一行的观测值对应的是样本数目,即有n=10。第二部分,方差分析表方差分析部分包括自由度、误差平方和、均方差、F值、P值等(表2)。表2方差分析表(ANOVA)逐列、分行说明如下:第一列df对应的是自由度(degreeoffreedom),第一行是回归自由度dfr,等于变量数目,即dfr=m精彩文档实用标准文案;第二行为残差自由度dfe,等于样本数目减去变量数目再减1,即有dfe=n-m-1;第三行为总自由度dft,等于样本数目减1,即有dft=n-1。对于本例,m=1,n=10,因此,dfr=1,df
4、e=n-m-1=8,dft=n-1=9。第二列SS对应的是误差平方和,或称变差。第一行为回归平方和或称回归变差SSr,即有它表征的是因变量的预测值对其平均值的总偏差。lSSr又称组间离差平方和,反应出不同的因子对样本波动的影响第二行为剩余平方和(也称残差平方和)或称剩余变差SSe,即有它表征的是因变量对其预测值的总偏差,这个数值越大,意味着拟合的效果越差。上述的y的标准误差即由SSe给出。lSSe又称组内离差平方和,是不考虑组间方差的纯随机影响第三行为总平方和或称总变差SSt,即有它表示的是因变量对其平均值的总偏差。容易验证748.8542+16.1
5、0676=764.961,即有l总离差平方和=组间离差平方和+组内离差平方和l样本数据的波动有两个来源:一个是随机波动,一个是因子影响。样本数据的波动,可通过总离差平方和来反映。这个总离差平方和可分解为组间方差和组内方差两部分。而测定系数就是回归平方和在总平方和中所占的比重,即有显然这个数值越大,拟合的效果也就越好。l方差、均方差:表示一组数相对平均值的离散程度lR2:预测值与实际值相对平均值的分布情况比较,越接近1,说明预测值和实际值的分布情况越接近。第四列MS对应的是均方差,它是误差平方和除以相应的自由度得到的商。第一行为回归均方差MSr,即有第
6、二行为剩余均方差MSe,即有显然这个数值越小,拟合的效果也就越好。第四列对应的是F值,用于线性关系的判定。对于一元线性回归,F值的计算公式为精彩文档实用标准文案式中R2=0.978944,dfe=10-1-1=8,因此l方差、均方差:表示一组数相对平均值的离散程度lF检验完整公式llF检验法是英国统计学家Fisher提出的,主要通过比较两组数据的均方差,以确定他们的精密度是否有显著性差异。F7、内均方差,说明数据波动的主要来源是组间均方差,因子是引起波动的主要原因,可认为因子影响是显著的。第五列SignificanceF对应的是在显著性水平下的Fα临界值,其实等于P值,即弃真概率。所谓“弃真概率”即模型为假的概率,显然1-P便是模型为真的概率。可见,P值越小越好。对于本例,P=0.0000000542<0.0001,故置信度达到99.99%以上。第三部分,回归参数表回归参数表包括回归模型的截距、斜率及其有关的检验参数(表3)。表3回归参数表第一列Coefficients对应的模型的回归系数,包括截距a=2.356437929和斜率b=1.88、12921065,由此可以建立回归模型或第二列为回归系数的标准误差(用或表示),误差值越小,表明参数的精确度
7、内均方差,说明数据波动的主要来源是组间均方差,因子是引起波动的主要原因,可认为因子影响是显著的。第五列SignificanceF对应的是在显著性水平下的Fα临界值,其实等于P值,即弃真概率。所谓“弃真概率”即模型为假的概率,显然1-P便是模型为真的概率。可见,P值越小越好。对于本例,P=0.0000000542<0.0001,故置信度达到99.99%以上。第三部分,回归参数表回归参数表包括回归模型的截距、斜率及其有关的检验参数(表3)。表3回归参数表第一列Coefficients对应的模型的回归系数,包括截距a=2.356437929和斜率b=1.8
8、12921065,由此可以建立回归模型或第二列为回归系数的标准误差(用或表示),误差值越小,表明参数的精确度
此文档下载收益归作者所有