欢迎来到天天文库
浏览记录
ID:49410824
大小:1.24 MB
页数:48页
时间:2020-02-06
《ch7 回归分析.ppt》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库。
1、第七章回归分析一元线性回归的经验公式与最小二乘法一元线性回归效果的显著性检验一元线性回归的预测与控制教学目的与要求:掌握一元线性回归的作题程序,了解预测和控制的方法,会解一些简单的实际问题.重点与难点:重点是建立一元线性回归方程并进行相关性检验.难点是公式多且难记.教学方法,手段:在课堂教学中注重公式的推导以便于学生记忆.介绍一个统计软件.思考题,讨论题,作业:习题七.参考资料:见前言.回归分析产生的背景英国统计学家FrancisGalton(1822-1911)在他的有关父子间特征关系的研究中,首次发现了回归
2、现象。他在对1078个家庭中父母亲身高平均值X和其中一个成年儿子身高Y的相关关系研究中发现,从父亲的身高X预测出的儿子身高Y是向父亲们身高的平均数接近的,即从X预测的Y是向X的一种回归(Regression)。他建立的预测公式是Y=33.73+0.516x对回归的具体解释是:高个子父亲的儿子比他父亲的身高矮些,其身高比父亲们身高平均数大些,即儿子身高向父亲们身高平均数回归;矮个子父亲的儿子的身高,比他父亲高些,但其身高比父亲们身高平均数小,也是向父亲们身高平均数回归。当两种变量间存在一定的相关关系时,一种变量向
3、另一种变量的平均数逼近的现象称为回归。变量与变量之间的两种关系函数关系(Functionrelation);相关关系(Correletionrelation)。回归分析是研究变量间相关关系的一种数工具。它的特别点是:可给出变量间相关关系的数学表达式(经验公式);从概率统计的角度分析经验公式的有效性;利用有效的经验公式,对具体问题进行预测和控制。第1节一元线性回归的经验公式与最小二乘法在一元线性回归里,有两个变量x和Y,其中x是普通变量,而Y是随机变量。为确定x与Y的相关关系,在时,对Y进行试验,得出n对数据下面
4、,根据这组数据建立x与Y的相关关系。一,散点图(scatterdiagram)与回归直线例(217)从图中看出x与Y之间有线性关系存在,将它们的关系表示为称为回归方程(regressionequation)(回归直线),也称为一元线性回归,a称为回归常数(regressionconstant),b称为回归系数(regressioncoefficient)。现在的问题是如何确定a,b两个常数。下面介绍最小二乘法(mehtodofleastsquares)。注意到之间有关系式其中已知,未知,是误差项,现在的问题是如
5、何确定a,b的值,使误差项的平方和为最小,即显然现在进行一般性地讨论:设有n个观测值记为a,b的二元函数,则问题变为求使最小的原则称为平方和最小原则,习惯上称为最小二乘法。注意到是a,b的二元函数,求它的最小值应使用二元函数求极值的方法,求出使达到最小的由方程组整理后得其中上述方程称为正规方程。由线性代数的克莱姆法则,正规方程的系数行列式因此,正规方程有唯一解:因此,所求的回归方程是将代入得表明点在回归直线上。几个记号:则有求例1中人均生活费收入Y对时间x的回归程。回归方程为问题:能否利用该方程进行预测?第2节
6、一元线性回归效果的显著性检验一.平方和分解式引理:对任意n组数据恒有记则平方和分解式为是n个数据的偏差平方和,它的大小描述了这n个数据的分散程度。这三部分的含义是:是这n个数的平均值,也是的平均值,故是这n个数的偏差平方和,它描述了的分散程度。是回归直线上点的纵坐标,该点的横坐标是。因此,的分散性来源于的分散性,它是通过x对y的相关关系引起的,因此U称为回归平方和。表示除去x对y的线性影响以外的所有其他影响之和,称Q为残差平方和或剩余平方和。Q越小越好。二.F检验原假设在假设成立时,选取统计量服从自由度为1,n
7、-2的F分布。在给定的显著水平下,得到拒绝域为当时,否定假设,即为认x与Y之间存在线性相关关系,此时才能利用该回归方程进行预测和控制。相关性检验的程序:⑴计算U,Q并求出F值;⑵给定检验水平α查出自由度为1,n-2的F分布的临界值λ;⑶比较F与λ的大小,如果有F>λ,则否定原假设.即认为x与Y之间有线性相关关系.用Excel作回归分析(P220例2)Book1.xls输入数据:选择[插入]/[图表]任务,在子图表任务中选择散点图,选择数据框,单击下一步。在图表中数据点上单击右键,再弹出的窗口中选择“添加趋势线”
8、命令:返回工作表,选择[工具]/[数据分析]命令,打开数据分析对话框,在分析工具列表中选择“回归”选项,单击“确定”,打开“回归”对话框,将X,Y的数据所在的单元格输入对话框,选中输出区域的单元格,将“残差”,“正态分布”中的复选框全部选中,单击“确定”,所有的分析结果如下表。表中有三部分内容:第一部分是回归统计,包括相关系数(MultipleR)、判定系数、调整的判定系数、标准误差、
此文档下载收益归作者所有