欢迎来到天天文库
浏览记录
ID:36095014
大小:2.14 MB
页数:78页
时间:2019-05-05
《《3.1回归分析的基本思想及其初步应用》课件1》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库。
1、第三章 统计案例3.1回归分析的基本思想及其初步应用问题引航1.什么是线性回归模型?2.怎样进行线性回归分析?3.有些非线性模型通过怎样变换可以转化为线性回归模型?1.线性回归模型(1)回归方程的相关计算对于两个具有线性相关关系的变量的一组数据(x1,y1),(x2,y2),…,(xn,yn).设其回归直线方程为,其中,是待定参数,由最小二乘法得=______________=____________,其中分别是a,b的估计值.(2)线性回归模型①线性回归模型其中a,b为未知参数,通常e为_________,称为_________.②x称为_____变量,y
2、称为_____变量.随机变量随机误差解释预报2.线性回归分析(1)残差对于样本点(xi,yi)(i=1,2,…,n)的随机误差的估计值=_____称为相应于点(xi,yi)的残差,_________称为残差平方和.(2)残差图利用图形来分析残差特性,作图时纵坐标为_____,横坐标可以选为样本编号,或身高数据,或体重的估计值等,这样作出的图形称为残差图.残差(3)R2=,R2越接近于1,表示回归效果越好.____________1.判一判(正确的打“√”,错误的打“×”)(1)残差平方和越小,线性回归方程的拟合效果越好.()(2)在画两个变量的散点图时,预报
3、变量在x轴上,解释变量在y轴上.()(3)R2越接近于1,线性回归方程的拟合效果越好.()【解析】(1)正确.残差平方和越小,说明样本数据与线性回归方程的偏离程度越小,即该方程的拟合效果越好.(2)错误.由于预报变量的值可类比为函数的函数值,解释变量的值可类比为函数的自变量的值,故预报变量在y轴上,解释变量在x轴上.(3)正确.由R2的计算公式可知这句话正确.答案:(1)√(2)×(3)√2.做一做(请把正确的答案写在横线上)(1)从散点图上看,点散布在从左下角到右上角的区域内,两个变量的这种相关关系称为.(2)在残差分析中,残差图的纵坐标为.(3)如果发现
4、散点图中所有的样本点都在一条直线上,则残差平方和等于,解释变量和预报变量之间的相关系数等于.【解析】(1)从散点图上看,点散布在从左下角到右上角的区域内,两个变量的这种相关关系称为正相关.答案:正相关(2)由残差图的定义知道,作图时纵坐标为残差,横坐标可以选为样本编号,或身高数据,或体重的估计值等,这样作出的图形称为残差图.答案:残差(3)设样本点为(xi,yi),i=1,2,3,…n,回归直线为;若散点图中所有的样本点都在一条直线上,则此直线方程就是回归直线方程.所以有yi=;残差平方和;解释变量和预报变量之间的相关系数R满足所以R=±1.答案:01或-1
5、【要点探究】知识点线性回归分析1.对线性回归模型的三点说明(1)非确定性关系:线性回归模型y=bx+a+e与确定性函数y=a+bx相比,它表示y与x之间是统计相关关系(非确定性关系),其中的随机误差e提供了选择模型的准则以及在模型合理的情况下探求最佳估计值a,b的工具.(2)线性回归方程中,的意义是:以为基数,x每增加1个单位,y相应地平均增加个单位.(3)线性回归模型中随机误差的主要来源①线性回归模型与真实情况引起的误差;②省略了一些因素的影响产生的误差;③观测与计算产生的误差.2.线性回归模型的模拟效果(1)残差图法:观察残差图,如果残差点比较均匀地落在
6、水平的带状区域中,说明选用的模型比较合适,这样的带状区域的宽度越窄,说明模型拟合精度越高,回归方程的预报精度越高.(2)残差的平方和法:一般情况下,比较两个模型的残差比较困难(某些样本点上一个模型的残差的绝对值比另一个模型的小,而另一些样本点的情况则相反),故通过比较两个模型的残差的平方和的大小来判断模型的拟合效果.残差平方和越小的模型,拟合的效果越好.(3)R2法:R2的值越大,说明残差平方和越小,也就是说模型拟合的效果越好.3.相关系数与R2(1)R2是相关系数的平方,其变化范围为[0,1],而相关系数的变化范围为[-1,1].(2)相关系数可较好地反映
7、变量的相关性及正相关或负相关,而R2反映了回归模型拟合数据的效果.(3)当
8、r
9、接近于1时说明两变量的相关性较强,当
10、r
11、接近于0时说明两变量的相关性较弱,而当R2接近于1时,说明线性回归方程的拟合效果较好.【微思考】(1)残差与我们平时说的误差是一回事儿吗?提示:这两个概念在某程度上具有很大的相似性,都是衡量不确定性的指标,二者的区别是:误差与测量有关,误差可以衡量测量的准确性,误差越大表示测量越不准确;残差与预测有关,残差大小可以衡量预测的准确性,残差越大表示预测越不准确.(2)R2与原来学过的相关系数r有区别吗?提示:它们都是刻画两个变量之间的的相关关
12、系的,区别是R2表示解释变量对预报变量变化的贡献率,
此文档下载收益归作者所有