资源描述:
《青年人的身高和体积的回归分析》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库。
1、《概率论与数理统计》课程设计摘要数理统计是具有广泛应用的数学分支,而区间估计和假设检验问题在其中占有很重要的地位。对于正态总体期望和方差的区间估计和假设检验问题已有完备的结论;对于非正态总体期望和方差的区间估计和假设检验问题,在大样本的情况下,可利用中心极限定理转化为正态总体来解决。但实际问题中常常碰到非正态总体,而且是小样本的情况,因此对它的区间估计和假设检验是一个值得研究的问题。本文利用概率论与数理统计基本原理对小样本常用分布参数置信区间和假设检验问题,进行了深入研究,提出了小样本常用分布参数的置信区间与假设检验的
2、解决方法。本文利用小样本情形的统计量法解决离散型的0-1分布、二项分布以及连续型的指数分布参数的置信区间与假设检验,对于泊松分布的参数的置信区间与假设检验则采用数学方法进行分析。关键字:区间估计;假设检验;置信区间;二项分布;IV《概率论与数理统计》课程设计目录1设计目的I2设计原理12.1模型回归系数的估计22.2回归方程显著性检验32.3回归系数的置信区间42.4利用模型预测43设计方法53.1输入数据,观察与的线性关系53.2作回归分析与检验65设计心得14致谢15参考文献16IV《概率论与数理统计》课程设计青年
3、人的身高和体积的回归分析1设计目的了解一元回归方程,回归系数的检验方法及应用一元回归方程进行预测的方法;学会应用MATLAB软件进行一元回归实验的分析方法。2设计原理在实际问题中,经常会出现两个变量之间的相关关系不是线性的(即直线型),而是非线性的(即曲线型)。设其中有两个变量X与Y,我们可以用一个确定函数关系式:y=u(x)大致的描述Y与X之间的相关关系,函数u(x)称为Y关于X的回归函数,方程y=u(x)成为Y关于X的回归方程。一元线性回归处理的是两个变量x与y之间的线性关系,可以设想y的值由两部分构成:一部分由自
4、变量x的线性影响所致,表示x的线性函数a+bx;另一部分则由众多其他因素,包括随机因素的影响所致,这一部分可以视为随机误差项,记为ε。可得一元线性回归模型y=a+bx+ε(1)式中,自变量x是可以控制的随机变量,成为回归变量;固定的未知参数a,b成为回归系数;y称为响应变量或因变量。由于ε是随机误差,根据中心极限定理,通常假定ε~N(0,σ²),σ²是未知参数。确定Y与X之间的关系前,可根据专业知识或散点图,选择适当的曲线回归方程,而这些方程往往可以化为线性方程或者就是线性方程,因此我们可以用线性方程:y=a+bx大致
5、描述变量Y与X之间的关系;16《概率论与数理统计》课程设计2.1模型回归系数的估计为了估计回归系数,假定试验得到两个变量x与y的n个数据对(x,y),i=1,2,3,….,n我们将这n对观测值代入式(1),得=a+b+ε,i=1,2,3,….,n这里ε,ε,……,ε互独立的随机变量,军服从正态分布,即ε~N(0,σ²),i=1,2,….n回归系数估计的方法有多种,其中使用最广泛的是最小二乘法,即要求选取的ab,的值使得述随机误差ε的平方和达到最小,即求使得函数Q(a,b)=²=取得最小值的a,b。由于Q(a,b)是a,
6、b的二元函数,利用微积分中的函数存在极值的必要条件,分别对Q(a,b)求a,b偏导数,并令其为0,构成二元一次方程组=0,=0,化简后得到如下正规方程组na+b)=,a)+b)=解方程组得到总体参数a,b估计量=-,=这里,x和y(i=1,2,…,n)均已有的观测数据。16《概率论与数理统计》课程设计由此得到回归方程=+x带入观测x,得到值y称为回归预测值。方程的直线称为回归直线。2.2回归方程显著性检验建立一元线性回归方程当且仅当变量之间存在线性相关关系时才是有意义的,因此必须对变量之间的线性相关的显著性进行检验,即
7、对建立的回归模型进行显著性检验。我们首先引入几个概念:(1)SS=(y-),称为SS总偏差平方和,它表示观测值y总的分散程度;(2)SS=(-),称SS为回归平方和,它是由回归变量x的变化引起的,放映了回归变量x对变量y线性关系的密切程度;(3)SS=(y-),称SS为残差(剩余)平方和,它是由观测误差等其他因素起误差,它的值越小说明回归方程与原数据拟合越好。可以证明下列关系成立SS=SS+SS即(y-)=SS=(-)+SS=(y-)16《概率论与数理统计》课程设计我们主要考虑回归平方和在总偏差和中所占的比重,记R=。
8、(0<=R<=1),称R为复相关系数,用R的大小来评价模型的有效性,R越大,则反映回归变量与相应变量之间的线性函数关系越密切。引入F统计量。定义F=,可知F~F(1,n-2).对于给定的显著水平a(一般这里取0.05或0.01),查表可得临界值F(1,n-2)如果F>F(1,n-2),则认为y与x之间的线性关系显著;如果F<=F(