资源描述:
《8-统计回归模型》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库。
1、统计回归模型1、血压与年龄2、血压与年龄、体重指数、吸烟习惯收集一组包含因变量和自变量的数据;选定因变量与自变量之间的模型,利用数据按照最小二乘准则计算模型中的系数;利用统计分析方法对不同的模型进行比较,找出与数据拟合得最好的模型;判断得到的模型是否适合于这组数据,诊断有无不适合回归模型的异常数据;利用模型对因变量作出预测或解释。回归分析的主要步骤实例及其数学模型例1血压与年龄为了解血压随年龄增长而升高的关系,调查了30个成年人的血压(收缩压,mmHg)与年龄:用这组数据确定血压与年龄的关系;从
2、年龄预测血压可能的变化范围;回答“平均说来60岁比50岁的人血压高多少”。序号血压年龄序号血压年龄序号血压年龄1144391116264211363622154712150562214250313845131405923120394145471411034241202151626515128422516044例1血压与年龄记血压(因变量)y,年龄(自变量)x,模型作数据(xiyi)(i=1,2,30)的散点图由数据确定系数的估计值曲线拟合(求超定线性方程组的最小二乘解);从统
3、计推断角度讨论β0,β1的置信区间和假设检验;对任意的年龄x给出血压y的预测区间。y与x大致呈线性关系序号血压年龄体重指数吸烟序号血压年龄体重指数吸烟序号血压年龄体重指数吸烟11443924.20111626428.01211363625.0022154731.11121505625.80221425026.2131384522.60131405927.30231203923.5041454724.01141103420.10241202120.3051626525.91151284221.70
4、251604427.11例2血压与年龄、体重指数、吸烟习惯又调查了例1中30个成年人的体重指数、吸烟习惯:体重指数:体重(kg)/[身高(m)]2吸烟习惯:0~不吸烟,1~吸烟模型例2血压与年龄、体重指数、吸烟习惯记血压y,年龄x1、体重指数x2、吸烟习惯x3y与x2大致呈线性关系作数据y对x2的散点图由数据确定系数的估计值一元线性回归分析已知一组数据(xi,yi),i=1,2,n(平面上的n个点),用最小二乘准则确定一个线性函数(直线)问题1.血压与年龄2.合金
5、强度与碳含量怎样衡量由最小二乘准则拟合得到的模型的可靠程度?怎样给出模型系数的置信区间和因变量的预测区间?系数的计算二者没有什么区别;2的拟合效果比1好得多.一元线性回归的MATLAB实现b=regress(y,X)[b,bint,r,rint,s]=regress(y,X,alpha)输入:y~因变量(列向量),X~1与自变量组成的矩阵,alpha~显著性水平(缺省时设定为0.05)。输出:,bint~0,1的置信区间,r~残差(列向量),rint~残差的置信区间,s(3个统计量):决定
6、系数R2;F值;F(1,n-2)分布大于F值的概率p。当p<时拒绝H0,回归模型有效。例1血压与年龄模型xueya1.m回归系数回归系数估计值回归系数置信区间098.4084[78.7484118.0683]10.9732[0.56011.3864]R2=0.4540F=23.2834p<0.0001s2=273.7137模型检验1置信区间不含零点;p<;F(1,n-2),1-=4.19607、8665[85.4771108.2559]10.9533[0.71401.1925]R2=0.7123F=66.8358p<0.0001s2=91.4305数据由残差图剔除异常数据后例1血压与年龄模型xueya.mooo剔除异常点(x2,y2)对50岁人的血压进行预测:预测区间(=0.05):[124.5406164.5190][125.7887163.2708]简化(tu):又出现两个新的异常点.多元线性回归的MATLAB实现b=regress(y,X)[b,bint,r,rint,s]
8、=regress(y,X,alpha)与一元回归相同注意X的构造例2血压与年龄、体重指数、吸烟习惯年龄和体重指数相同,吸烟者比不吸烟者的血压(平均)高10.3剔除两个异常点后与例1“血压与年龄”的结果相比,年龄增加1岁血压的升高值(即1)为何有这么大的差别xueya2.m