补充:线性回归与方差分析电子教案.ppt

补充:线性回归与方差分析电子教案.ppt

ID:59805536

大小:1.08 MB

页数:71页

时间:2020-11-25

补充:线性回归与方差分析电子教案.ppt_第1页
补充:线性回归与方差分析电子教案.ppt_第2页
补充:线性回归与方差分析电子教案.ppt_第3页
补充:线性回归与方差分析电子教案.ppt_第4页
补充:线性回归与方差分析电子教案.ppt_第5页
资源描述:

《补充:线性回归与方差分析电子教案.ppt》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、补充:线性回归与方差分析例如,农作物的单位面积产量与施肥量之间有密切的关系,但是不能由施肥量精确知道单位面积产量,这是因为单位面积产量还受到许多其他因素及一些无法控制的随机因素的影响。又如,人的身高与体重之间存在一种关系,一般来说,人身高越高,体重越大,但同样高度的人,体重却往往不同。这种变量之间的不确定性关系称之为相关关系。对于具有相关关系的变量,虽然不能找到他们之间的确定表达式,但是通过大量的观测数据,可以发现他们之间存在一定的统计规律,数理统计中研究变量之间相关关系的一种有效方法就是回归分析。一、一元线性回归模型其中yi是x=

2、xi时随机变量Y的观测结果.将n对观测结果(xi,yi)(i=1,…,n)在直角坐标系中进行描点,这种描点图称为散点图.散点图可以帮助我们精略地看出Y与x之间的某种关系.假定我们要考虑自变量x与因变量Y之间的相关关系假设x为可以控制或可以精确观察的变量,即x为普通的变量。由于自变量x给定后,因变量Y并不能确定,从而Y是一个与x有关的随机变量我们对于可控制变量x取定一组不完全相同的值x1,…,xn,作n次独立试验,得到n对观测结果:(x1,y1),(x2,y2),…,(xn,yn)例1对某广告公司为了研究某一类产品的广告费x用与其销售

3、额Y之间的关系,对多个厂家进行调查,获得如下数据厂家123456789广告费6102140626290100120销售额3158124220299190320406380广告费与销售额之间不可能存在一个明确的函数关系,事实上,即使不同的厂家投入了相同的广告费,其销售额也不会是完全相同的。影响销售额的因素是多种多样的,除了广告投入的影响,还与厂家产品的特色、定价、销售渠道、售后服务以及其他一些偶然因素有关。画出散点图如图5-1所示.从图中可以看出,随着广告投入费x的增加,销售额Y基本上也呈上升趋势,图中的点大致分布在一条向右上方延伸的

4、直线附近.但各点不完全在一条直线上,这是由于Y还受到其他一些随机因素的影响.这样,Y可以看成是由两部分叠加而成,一部分是x的线性函数a+bx,另一部分是随机因素引起的误差,即Y=a+bx+oxy10020030040050020406080100120L*********这就是所谓的一元线性回归模型图5-1一般地,假设x与Y之间的相关关系可表示为(1)其中:a,b为未知常数为随机误差且未知,x与Y的这种关系称为一元线性回归模型y=a+bx称为回归直线b称为回归系数此时对于(x,Y)的样本(x1,y1),…,(xn,yn)有:一元线性

5、回归主要解决下列一些问题:(1)利用样本对未知参数a、b、进行估计;(2)对回归模型作显著性检验;(3)当x=x0时对Y的取值作预测,即对Y作区间估计.如果由样本得到式(1)中,a,b的估计值,则称为拟合直线或经验回归直线,它可作为回归直线的估计二、参数a、b、的估计最小二乘法就是选择a,b的估计,使得Q(a,b)为最小(图5-2)现在我们用最小二乘法来估计模型(1)中的未知参数a,b.记称Q(a,b)为偏差平方和图5-2为了求Q(a,b)的最小值,分别求Q关于a,b的偏导数,并令它们等于零:经整理后得到式(2)称为正规方程组.(2

6、)由正规方程组解得其中用最小二乘法求出的估计、分别称为a、b的最小二乘估计由矩估计法,可用估计此时,拟合直线为下面再用矩法求的估计由于,a、b分别由、代入而故可用作估计对于估计量、、的分布,有:定理1(1)(2)(3)(4)分别与、独立。例2在例1中可分别求出a、b、的估计值为:故经验回归直线为:Y=4.37+0.323x三、线性回归的显著性检验在实际问题中,事先我们并不能断定Y与x确有线性关系,Y=a+bx+只是一种假设.下面说明这一检验的方法.当然,这个假设不是没有根据的,我们可以通过专业知识和散点图来作出粗略判断.但在求出经验

7、回归方程后,还需对这种线性回归方程同实际观测数据拟合的效果进行检验.若假设Y=a+bx+符合实际,则b不应为零因为如果b=0,则Y=a+意味着Y与x无关所以Y=a+bx是否合理,归结为对假设:H0:b=0进行检验下面介绍检验假设H0的二种常用方法.且与独立1.t检验法若H0成立,即b=0,由定理7.1知,因而故为显著性水平即得H0的拒绝域为2.相关系数检验法取检验统计量通常称R为样本相关系数.类似于随机变量间的相关系数,R的取值r反映了自变量x与因变量Y之间的线性相关关系.可以推出:在显著性水平下,当时拒绝H0其中临界值在附表中给出

8、相关系数检验法是工程技术中广泛应用的一种检验方法(1)x对Y没有显著影响;(2)x对Y有显著影响,但这种影响不能用线性相关关系来描述;(3)影响Y取值的,除x外,另有其他不可忽略的因素.当假设被拒绝时,就认为Y与x存在线性关系,从而认

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。