欢迎来到天天文库
浏览记录
ID:57908102
大小:360.50 KB
页数:11页
时间:2020-04-03
《回归分析的基本思想及其初步应用.doc》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库。
1、回归分析的基本思想及其初步应用 本周题目:回归分析的基本思想及其初步应用 本周重点: (1)通过对实际问题的分析,了解回归分析的必要性与回归分析的一般步骤;了解线性回归模型与函数模型的区别; (2)尝试做散点图,求回归直线方程; (3)能用所学的知识对实际问题进行回归分析,体会回归分析的实际价值与基本思想;了解判断刻画回归模型拟合好坏的方法――相关指数和残差分析。 本周难点: (1)求回归直线方程,会用所学的知识对实际问题进行回归分析. (2)掌握回归分析的实际价值与基本思想. (3)能运用自己所学的知识对具体案例进行检验与说明. (4)残差变量的解释; (
2、5)偏差平方和分解的思想; 本周内容: 一、基础知识梳理 1.回归直线: 如果散点图中点的分布从整体上看大致在一条直线附近,我们就称这两个变量之间具有线性相关关系,这条直线叫作回归直线。 求回归直线方程的一般步骤: ①作出散点图(由样本点是否呈条状分布来判断两个量是否具有线性相关关系),若存在线性相关关系→②求回归系数→③写出回归直线方程,并利用回归直线方程进行预测说明. 2.回归分析: 对具有相关关系的两个变量进行统计分析的一种常用方法。 建立回归模型的基本步骤是: ①确定研究对象,明确哪个变量是解释变量,哪个变量是预报变量; ②画好确定好的解释变量和预报
3、变量的散点图,观察它们之间的关系(线性关系). ③由经验确定回归方程的类型. ④按一定规则估计回归方程中的参数(最小二乘法); ⑤得出结论后在分析残差图是否异常,若存在异常,则检验数据是否有误,后模型是否合适等. 3.利用统计方法解决实际问题的基本步骤: (1)提出问题; (2)收集数据; (3)分析整理数据; (4)进行预测或决策。 4.残差变量的主要来源: (1)用线性回归模型近似真实模型(真实模型是客观存在的,通常我们并不知道真实模型到底是什么)所引起的误差。可能存在非线性的函数能够更好地描述与之间的关系,但是现在却用线性函数来表述这种关系,结果就会产生
4、误差。这种由于模型近似所引起的误差包含在中。 (2)忽略了某些因素的影响。影响变量的因素不只变量一个,可能还包含其他许多因素(例如在描述身高和体重关系的模型中,体重不仅受身高的影响,还会受遗传基因、饮食习惯、生长环境等其他因素的影响),但通常它们每一个因素的影响可能都是比较小的,它们的影响都体现在中。 (3)观测误差。由于测量工具等原因,得到的的观测值一般是有误差的(比如一个人的体重是确定的数,不同的秤可能会得到不同的观测值,它们与真实值之间存在误差),这样的误差也包含在中。 上面三项误差越小,说明我们的回归模型的拟合效果越好。 二、例题选讲 例1:研究某灌溉渠道水的流
5、速与水深之间的关系,测得一组数据如下:水深1.401.501.601.701.801.902.002.10流速1.701.791.881.952.032.102.162.21 (1)求对的回归直线方程; (2)预测水深为1.95时水的流速是多少? 分析:本题考查如何求回归直线的方程,可先把有关数据用散点图表示出来,若这些点大致分布在通过散点图中心的一条直线附近,说明这两个变量线性相关,从而可利用我们学过的最小二乘估计思想及计算公式求得线性回归直线方程。 解: (1)由于问题中要求根据水深预报水的流速,因此选取水深为解释变量,流速为预报变量,作散点图: 由图容易看出,与
6、之间有近似的线性关系,或者说,可以用一个回归直线方程 来反映这种关系。 由计算器求得。 对的回归直线方程为。 (2)由(1)中求出的回归直线方程,把代入,易得 。 计算结果表示,当水深为时可以预测渠水的流速为。 评注: 建立回归模型的一般步骤: (1)确定研究对象,明确两个变量即解释变量和预报变量; (2)画出散点图,观察它们之间的关系; (3)由经验确定回归方程类型(若呈线性关系,选用线性回归方程); (4)按一定规则估计回归方程中的参数(如最小二乘法); (5)得出结果后分析残差图是否有异常(个别数据对应残差过大,或残差出现不随机的规律性,等等),若
7、存在异常,则检查数据是否有误,或模型是否合适等。 例2:1993年到2002年中国的国内生产总值(GDP)的数据如下:年份GDP199334634.4199446759.4199558478.1199667884.6199774462.6199878345.2199982067.5200089468.1200197314.82002104790.6 (1)作GDP和年份的散点图,根据该图猜想它们之间的关系应是什么。 (2)建立年份为解释变量,GDP为预报变量的回归模型,
此文档下载收益归作者所有