欢迎来到天天文库
浏览记录
ID:43971753
大小:326.50 KB
页数:15页
时间:2019-10-17
《回归分析的基本思想》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库。
1、3.1回归分析的基本思想及其初步应用(一)选修2-3之第三章《统计案例》1温故知新两个变量的关系不相关相关关系函数关系线性相关非线性相关相关关系:对于两个变量,当自变量取值一定时,因变量的取值带有一定随机性的两个变量之间的关系.函数关系中的两个变量间是一种确定性关系。相关关系是一种非确定性关系。函数关系是一种理想的关系模型。相关关系在现实生活中大量存在,是更一般的情况。2表示有一组具体的数据估计得到的截距和斜率;我们一般用a,b,y表示真实值;表示由真实值a,b所确定的值.表示由估计值所确定的值.3这种方法称为回归分析.两个具有线性相关关系的变量的统计分析:(
2、1)画散点图;(2)求回归直线方程(最小二乘法):(3)利用回归直线方程进行预报;回归分析是对具有相关关系的两个变量进行统计分析的一种常用方法.为样本点的中心样本点:4什么是回归分析:“回归”一词是由英国生物学家F.Galton在研究人体身高的遗传问题时首先提出的。根据遗传学的观点,子辈的身高受父辈影响,以X记父辈身高,Y记子辈身高。虽然子辈身高一般受父辈影响,但同样身高的父亲,其子身高并不一致,因此,X和Y之间存在一种相关关系。一般而言,父辈身高者,其子辈身高也高,依此推论,祖祖辈辈遗传下来,身高必然向两极分化,而事实上并非如此,显然有一种力量将身高拉向中心
3、,即子辈的身高有向中心回归的特点。“回归”一词即源于此。虽然这种向中心回归的现象只是特定领域里的结论,并不具有普遍性,但从它所描述的关于X为自变量,Y为不确定的因变量这种变量间的关系看,和我们现在的回归含义是相同的。不过,现代回归分析虽然沿用了“回归”一词,但内容已有很大变化,它是一种应用于许多领域的广泛的分析研究方法,在经济理论研究和实证研究中也发挥着重要作用。5例1、某大学中随机选取8名女大学生,其身高和体重数据如下表所示.编号12345678身高/cm165165157170175165155170体重/kg4857505464614359求根据女大学生
4、的身高预报体重的回归方程,并预报一名身高为172cm的女大学生的体重.(在有的书籍上有体重=身高-110的计算方法)6解:取身高为解释变量x,体重为预报变量y,作散点图:样本点呈条状分布,身高和体重有较好的线性相关关系,因此可以用回归方程来近似的刻画它们之间的关系.7由得:故所求回归方程为:因此,对于身高172cm的女大学生,由回归方程可以预报其体重为:是斜率的估计值,说明身高x每增加1个单位时,体重y就增加0.849个单位,这表明体重与身高具有正的线性相关关系.如何描述它们之间线性相关关系的强弱?8相关系数r相关系数r的性质(1)
5、r
6、≤1.(2)
7、r
8、越接
9、近于1,相关程度越强;
10、r
11、越接近于0,相关程度越弱.注:b与r同号(见课本82页最后第2段)9某大学中随机选取8名女大学生,其身高和体重数据如下表所示.编号12345678身高/cm165165157170175165155170体重/kg4857505464614359求根据女大学生的身高预报体重的回归方程,并预报一名身高为172cm的女大学生的体重.故所求回归方程为:r=0.798表明体重与身高有很强的线性相关性,从而说明我们建立的回归模型是有意义的.认为她的平均体重的估计值是60.316kg.估计值P8310因为所有的样本点不共线,所以线性函数模型只能
12、近似地刻画身高和体重之间的关系,即:体重不仅受身高的影响,还受其他因素的影响,把这种影响的结果用e来表示,从而把线性函数模型修改为线性回归模型:y=bx+a+e.其中,e包含体重不能由身高的线性函数解释的所有部分(如:饮食/运动/遗传…).11线性回归模型:其中a和b为模型的未知参数,e是y与之间的误差,通常e为随机变量,称为随机误差.其中:均值E(e)=0,方差D(e)=σ2>0线性回归模型的完整表达式为:线性回归模型适用范围比一次函数的适用范围大得多.当随机误差e恒等于0时,线性回归模型就变成一次函数模型.即:一次函数模型是线性回归模型的特殊形式,线性回归
13、模型是一次函数模型的一般形式.12随机误差是引起预报值与真实值y之间的误差的原因之一,其大小取决于随机误差的方差.和为截距和斜率的估计值,它们与真实值a和b之间存在误差是引起预报值与真实值y之间的误差的另一个原因.其他因素的影响思考:相关系数r与随机误差e有什么关系?1314作业见B本第56页:1—11.课后作业15
此文档下载收益归作者所有