统计建模多元回归分析

统计建模多元回归分析

ID:37495630

大小:352.10 KB

页数:26页

时间:2019-05-12

统计建模多元回归分析_第1页
统计建模多元回归分析_第2页
统计建模多元回归分析_第3页
统计建模多元回归分析_第4页
统计建模多元回归分析_第5页
资源描述:

《统计建模多元回归分析》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、Regressionanalysis回归分析数学与生物数学教研室蔡昌启回归分析在许多科研问题中,经常遇到一些同处于一个统一体中的变量,这些变量之间往往是相互依赖和相互制约的,根据实际问题的要求,我们往往需要找出描述这些变量之间依存关系的数学表达式(数学模型).(regressionanalysis)一、什么是回归分析变量之间的相互关系大致可分为两类:(1)确定关系-----函数关系.(2)不确定关系-----相关关系.在许多实际问题中,由于生产或试验过程不可避免存在着误差的影响,使得变量之间的关系具有某种程度的不确定性,并且不能用函数表示,这些变量其实是随机变

2、量或至少其中有一个是随机变量.为确定随机变量与随机变量(或非随机变量)之间的相依关系,需采用统计分析方法总结出隐藏在随机性后面的统计规律性(统计模型).这类统计规律称为回归关系.有关回归关系的计算方法和理论统称回归分析(regeressionanalysis).回归分析的目的是寻求一个随机变量Y(因变量)对一组随机变量X1,X2,…,Xp(自变量)的统计依赖关系.二、回归分析的目的一般来说,可通过直观的方法(如散点图)进行粗略判断.如只有一个自变量,则称为一元回归分析;如自变量个数多于一个,则称为多元回归分析.三、变量的确定及要求将一个需要预测的变量作为因变量

3、,它的取值是可观测的但不可控制的;将被认为对因变量的取值具有显著影响的哪些变量作为自变量.通常情况下,自变量的取值能得以控制,称为可控变量.例如,我们希望通过一些易测的指标去预测正常儿童的心象面积,由于心象面积是一个不易检测的指标,是一个需要预测的变量,根据专业知识,认为性别、年龄、身高、体重、胸围可能对心象面积都有影响。因变量(Y)------心象面积;自变量-----性别(X1)、年龄(X2)、身高(X3)、体重(X4)、胸围(X5)。四、回归分析的基本原理回归分析的实质是根据隐含统计规律性的观测值,求出因变量对自变量的具体表达式y=f(x1,x2,…,x

4、p).一般,自变量X1,X2,…,Xp是可控变量,控制它们取特殊值x1,x2,…,xp时,对不同个体,Y的取值依然不同(随机性),Y依然是随机变量,记为Y(x1,x2,…,xp).Y虽然不能完全确定(随机变量),但却有一个确定的条件分布p(Y│x1,x2,…,xp),从而有一个确定条件均值E(Y│x1,x2,…,xp),它是x1,x2,…,xp的函数.是否可用y=E(Y│x1,x2,…,xp)作为Y对X1,X2,…,Xp的回归方程?定义1(均方误差)设(Y,X1,X2,…,Xp)具有联合分布且二阶矩存在,f(X1,X2,…,Xp)是随机变量X1,X2,…,Xp

5、的函数,则称E[Y-f(X1,X2,…,Xp)]2为f(X1,X2,…,Xp)对Y的均方误差(meansquareerror).均方误差从平均意义上反映了函数f(X1,X2,…,Xp)与随机变量Y之间差别的大小,它可作为回归函数好坏的判断标准.如果某个函数与Y的均方误差最小,我们有理由认为在均方误差最小标准下将它作为回归函数进行预报是最好的.E[Y-f(X1,X2,…,Xp)]2定义2在定义1的条件下,函数E(Y│X1,X2,…,Xp)是所有X1,X2,…,Xp的函数中均方误差最小的函数,即对任意给定的函数f(X1,X2,…,Xp),总有E[Y-E(Y│X1,

6、X2,…,Xp)]2≤成立.定义2揭示用E(Y│x1,x2,…,xp)去预报Y在均方误差最小标准下是最好的,因此,y=E(Y│x1,x2,…,xp)就是我们寻找的回归函数.在(Y,X1,X2,…,Xp)的联合分布为多元正态分布时,E(Y│x1,x2,…,xp)为x1,x2,…,xp的线性函数,此时的回归函数为y=a0+a1x1+a2x2+…+apxp我们称它为多元线性回归方程.五、多元线性回归模型设p个自变量X1,X2,…,Xp的取值为x1,x2,…,xp时,随机Y变量满足其中a0,a1,a2,…,ap,σ2均为未知常数,a0,a1,a2,…,ap,称为“偏回

7、归系数”;σ2称为随机误差的方差。称上式为p元正态线性回归模型.对p元线性回归模型我们要解决如下问题:1.根据样本观测值去估计未知参数a0,a1,a2,…,ap,σ2,从而建立Y与X1,X2,…,Xp间的关系式(回归方程);2.对回归方程的回归效果进行统计检验;3.检验各变量X1,X2,…,Xp分别对指标(Y)是否有显著影响.按最小二乘估计的原理估计未知参数.实际问题:已知29例儿童的血红蛋白(hemoglo,g)与钙(Ca,μg)、镁(Mg,μg)、铁(Fe,μg)、锰(Mn,μg)、铜(Cu,μg)的含量如表,试建立一个钙、镁、铁、锰、铜预测血红蛋白的数学

8、模型。154.8930.86448.7

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。