欢迎来到天天文库
浏览记录
ID:28025415
大小:54.50 KB
页数:6页
时间:2018-12-07
《基于回归模型的统计数据应用研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、基于回归模型的统计数据应用研究陈佳欣郭红霞陕西省武警工程大学理学院该文利用2010年W民体质监测报告中抽样得到的国民身体形态指标平均数,根据成年男性体脂率公式进行预处理,釆用相关分析与回归分析方法,结合SPSS软件建立冋归模型,并对其进行拟合优度分析,参数检验符合标准。结果表明男性脂肪含量与年龄呈高度正相关关系,且满足一元线性回归方程,进而对男性引发疾病的临界年龄进行反预测,为男性健康发展提供理论依据。一、引言随着社会不断发展,人们越来越关注身体健康。脂肪含量是衡量健康水平的重要指标,成年人随着年龄增长
2、,新陈代谢变缓,各方面机能逐渐下降,运动量也逐渐减少,容易造成脂肪堆积,从而引发各种疾病m。因此,需要对人体脂肪含量与年龄和关关系进行研宄,并据此实现预测与控制。目前国内大多数有关脂肪含量的文章主要是对其测定方法的阐述m,以及相应公式的建立拉1,或者是脂肪含量与多个指标变量间的关系研究,II并未给出具体的统计关系UL很少用统计学方法对其与某一单独指标进行定量关系研究,不能为临界健康年龄捉供预测模型。研宄变量间和关关系是统计学一项重要内容,目前w际上有很多解决单因素指标问题的相关关系研宄方法,最典型的两种
3、方法为相关分析与回归分析边1。由于研究男女二者关系的方法相同,所建线性模型除冋归系数外无显著不同,因此该文仅选取2010年国民体质公报屮有关男性身体指标平均数据(仅对年龄在18到80岁的成年男性),结合SPSS软件分析得出有益结论并建立一元回归模型,从而根据该模型进行相应预测和控制,为预测脂肪含量超过健康水平的男性年龄提供科学理论依据。二、相关分析(一)数据预处理数据资料来源于2010年W民体质监测报告中抽样得到的W民身体形态指标平均数包1,如表1所示。图1男性脂肪含量与年龄散点图下载原图由图1可知,脂
4、肪含量与年龄存在正和关关系,下面计算二者的和关系数。(二)相关系数计算相关表和相关图可反映两个变量之间的相互关系及其相关方向,但无法确切地表明两个变量之间相关程度,而相关系数r则是用以反映变量之间相关关系密切程度的统计指标m,其表达式为:表1成年男性身体形态指标样本均值下载原表利用公式(1),求得男性和应年龄的脂肪含量,如表2所示。Y其中,XI表示肩胛部皮褶厚度;X2表示上臂部皮褶厚度m。表2男性脂肪含量与年龄样本数据下载原表$便于直观了解表2中数据关系,利用SPSS软件绘制其散点图m,如图1所其中,X
5、表示年龄;y表示年龄为X的脂肪含量;n表示数据的样本容量。根据(2)式,利用SPSS软件计算得样本x和y和关系数的矩阵如下:可见,年龄x与脂肪含量y表示的相关系数为rxy=0.965,表明成年男性脂肪含量与年龄呈高度正相关关系。(三)相关系数检验相关系数检验是在线性统计推断中对相关系数的显著性检验。在线性相关分析中,相关系数显著性检验是根据样本相关系数r来估计总体相关与否的方法[10]。1.提出假设。对总体相关系数作如下假设:1.计算检验统计量。构造如下统计量:显然,该统计量服从自由度为民n-2的t分布
6、,然后将相关系数rxy=0.965代入上式得统计量2.给定显著性水平a,确定临界值当取显著性水平为0.05时,查t分布表得3.检验结果的判断。显然,t>ta/2(n=8),即男性样木相关系数的t统计量值大于临界值ta/2(n=8),可见落在祀绝域内,祀绝原假设。因此,成年男性脂肪含量与年龄之间确实存在线性相关关系。三、构建回归模型相关分析研究变量之间相关关系的性质和程度,在确定变量之间确实存在相关关系吋,可进一步建立冋归方程,从而进行预测和冋归。基于以上结论,进一步利用SPSS软件求得该问题的样本回归函
7、数,建立一元线性回归模型[11]。(一)模型参数估计为了使得观测点和估计点的距离的平方和达到最小,文章根据最小二乘准则[12],建立脂肪含量与年龄的一元线性冋归模型为:其中该线性模型的斜率和截距为根据(6)式和(7)式利用SPSS软件估计样本冋归方程冋归参数[8],可得将(8)式代入式(5),可得:式(9)表明:男性年龄每增加一岁,其体内脂肪含量增加0.528个单位。(二)拟合优度分析利用可决系数R来度量回归模型对样木观测值拟合优度,即[13]:将数据表2屮的年龄值代入式(9)得到男性脂肪含量的估计值整
8、理结果如表3所示。表3成年男性脂肪含量实际值与拟合值误差下载原表进一步计算可得:由该结果可知,样木回归方程对样木观测值拟合得很好。(三)回归参数检验求得的线性[Hl归方程是否具有实用价值,需要经过假设检验才能确定,因此进行如下假设[14]。1.提出假设。1.计算统计量。男性样木回归函数截距项的t统计量值为0.057,斜率系数的t统计量值为10.480。2.给定显著性水平a,确定临界值。当取显著性水平为0.05时,t分布表的自由度为8时临界值
此文档下载收益归作者所有