第十二讲 回归分析.ppt

第十二讲 回归分析.ppt

ID:48145831

大小:1.01 MB

页数:46页

时间:2020-01-17

第十二讲 回归分析.ppt_第1页
第十二讲 回归分析.ppt_第2页
第十二讲 回归分析.ppt_第3页
第十二讲 回归分析.ppt_第4页
第十二讲 回归分析.ppt_第5页
资源描述:

《第十二讲 回归分析.ppt》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、回归分析9/9/20211回归分析在一组数据的基础上研究这样几个问题:(i)建立因变量y与自变量x,x,,xm之间的回归模型(经验公式);(ii)对回归模型的可信度进行检验;(iii)判断每个自变量x(i=1,2,…,m)对y的影响是否显著;(iv)诊断回归模型是否适合这组数据;(v)利用回归模型对y进行预报或控制。9/9/20212一元线性回归多元线性回归回归分析数学模型及定义*模型参数估计*检验、预测与控制可线性化的一元非线性回归(曲线回归)数学模型及定义*模型参数估计*多元线性回归中的检验与预测逐步回归分析9/9/20213一、数学模型例1测16名成年女子的身高与腿长所得数据如下:以身

2、高x为横坐标,以腿长y为纵坐标将这些数据点(xI,yi)在平面直角坐标系上标出.散点图9/9/20214一元线性回归分析的主要任务是:9/9/20215二、模型参数估计1、回归系数的最小二乘估计9/9/20216其中9/9/20217一个好的拟合方程,其残差应越小越好。残差越小,拟合值与观测值越接近,各观测点在拟合直线周围聚集的紧密程度越高,也就是说,拟合方程解释y的能力越强。另外,当剩余标准差越小时,还说明残差值的变异程度越小。由于残差的样本均值为零。所以,其离散范围越小,拟合的模型就越为精确。9/9/20218三、检验、预测与控制1、显著性检验一般地,回归方程的假设检验包括两个方面:一个

3、是对模型的检验,即检验自变量与因变量之间的关系能否用一个线性模型来表示,这是由F检验来完成的;另一个检验是关于回归参数的检验,即当模型检验通过后,还要具体检验每一个自变量对因变量的影响程度是否显著。这是由t检验完成。在一元线性分析中,由于自变量的个数只有一个,这两种检验是统一的,它们的效果完全是等价的。但是,在多元线性回归分析中,这两个检验的意义是不同的。从逻辑上说,一般常在F检验通过后,再进一步进行t检验。9/9/20219(Ⅰ)F检验法(Ⅱ)t检验法9/9/202110(Ⅲ)r检验法9/9/2021112、回归系数的置信区间9/9/2021123、预测与控制(1)预测9/9/202113

4、(2)控制9/9/202114四、可线性化的一元非线性回归(曲线回归)例2出钢时所用的盛钢水的钢包,由于钢水对耐火材料的侵蚀,容积不断增大.我们希望知道使用次数与增大的容积之间的关系.对一钢包作试验,测得的数据列于下表:9/9/202115散点图此即非线性回归或曲线回归问题(需要配曲线)配曲线的一般方法是:9/9/202116通常选择的六类曲线如下:9/9/202117一、数学模型及定义多元线性回归9/9/202118二、模型参数估计解得估计值9/9/2021199/9/202120三、多元线性回归中的检验与预测(Ⅰ)线性模型检验——F检验法(Ⅱ)回归系数检验——t检验法(残差平方和)9/9

5、/2021212、预测(1)点预测(2)区间预测9/9/202122四、逐步回归分析(4)“有进有出”的逐步回归分析。(1)从所有可能的因子(变量)组合的回归方程中选择最优者;(2)从包含全部变量的回归方程中逐次剔除不显著因子;(3)从一个变量开始,把变量逐个引入方程;选择“最优”的回归方程有以下几种方法:“最优”的回归方程就是包含所有对Y有影响的变量,而不包含对Y影响不显著的变量回归方程。以第四种方法,即逐步回归分析法在筛选变量方面较为理想.9/9/202123这个过程反复进行,直至既无不显著的变量从回归方程中剔除,又无显著变量可引入回归方程时为止。逐步回归分析法的思想:从一个自变量开始,

6、视自变量Y作用的显著程度,从大到地依次逐个引入回归方程。当引入的自变量由于后面变量的引入而变得不显著时,要将其剔除掉。引入一个自变量或从回归方程中剔除一个自变量,为逐步回归的一步。对于每一步都要进行Y值检验,以确保每次引入新的显著性变量前回归方程中只包含对Y作用显著的变量。9/9/202124统计工具箱中的回归分析命令1、多元线性回归2、多项式回归3、非线性回归4、逐步回归9/9/202125多元线性回归b=regress(Y,X)1、确定回归系数的点估计值:9/9/2021263、画出残差及其置信区间:rcoplot(r,rint)2、求回归系数的点估计和区间估计、并检验回归模型:[b,b

7、int,r,rint,stats]=regress(Y,X,alpha)回归系数的区间估计残差用于检验回归模型的统计量,有三个数值:相关系数r2、F值、与F对应的概率p置信区间显著性水平(缺省时为0.05)9/9/202127例1解:1、输入数据:x=[143145146147149150153154155156157158159160162164]';X=[ones(16,1)x];Y=[888588919

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。