第十一讲回归分析

第十一讲回归分析

ID:35430023

大小:104.85 KB

页数:6页

时间:2019-03-24

第十一讲回归分析_第1页
第十一讲回归分析_第2页
第十一讲回归分析_第3页
第十一讲回归分析_第4页
第十一讲回归分析_第5页
资源描述:

《第十一讲回归分析》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库

1、第十一讲回归分析一、数学模型例1测16名成年女子的身高与腿长所得数据如下:身高111114111111511111444495555575566635670345689024腿长8889999999999911008581233568768902以身高x为横坐标,以腿长y为纵坐标将这些数据点(x[,yj)在平面直角坐标系上标岀.■++-++-+-++-4-++-+-+-++-+1021009896949290888684140145150155160165一般地,称由尸仇+0以+£确定的模型为一元线性回归模型,记为"0。+处+£££=0,D£-G~固定的未知参数仇、01称为回

2、归系数,自变量X也称为回归变量.y=0()+0M,称为y对x的回归直线方程.一元线性回归分析的主要任务是:1、用试验值(样本值)对0。、A和<7作点估计;2、对回归系数0°、A作假设检验;3、在x二兀°处对y作预测,对y作区间估计.二、模型参数估计1、回归系数的最小二乘估计有n组独立观测值,(xi,yi),g,丫2),…,(Xn,yn),设=0o+曲+弓,,=1,2,...,/?[e©=0,Dei=(y2且£x£v...,£n相互独立记Q=Q(0o,0J=工屛-工(X一0o-0i兀J?,i=/=!最小二乘法就是选择0()和01的估计久,介使得2(A),A)=min0MQ(0

3、°,0J解得A=7-3.^入_xy-xy9或B卩'==立无一元)b—司1”1〃曰,其中壬=_£兀,歹二_£%,工k—元尸‘5mi=l/丄茁,承常栩9=Bo+=亍+B(兀一丘)。(经验)回归方程为:2、/的无偏估计记Q严q(B°,Bj二乞bi-瓦-BX)=X(x--z)i=l称Q「为残差平方和或剩余平方和.(J2的无偏估计为d}=0/(兄-2)称为剩余方差(残差的方差),分别与久、A独立。氏称为剩余标准差.三、检验、预测与控制1、冋归方程的显著性检验对回归方程丫=0()+0

4、兀的显著性检验,归结为对假设H°:0i=0;0:恥0进行检验・。假设心:0严()被拒绝,则回归显著

5、,认为y与x存在线性关系,所求的线性回归方程有意义;否则回归不显著,y与x的关系不能用一元线性回归模型来描述,所得的回归方程也无意义.(I)F检验法J]ft当H°成立时,F=—-—~F(1,n-2),其中U=Y(y.-y)2(回归平方Qe心-2)7T和),故F>Fm(l/-2),拒绝J/。,否则就接受Ho・(II)t检验法当H。成立吋,丁=匹庆(n-2),故T>t。⑺―2),拒绝Ho,否则就接受比).其中—二£(壬一元)—$>;-泾1=1/=!(HI)r检验法-无)(兀一刃./=!n记厂==当丨r

6、〉mu时,“_元)2£(牙•—刃2J=1/=1拒绝Ho;否则就接受H°•其中B

7、7a(n~2)为/AICT'的置信水平为1-"的置信区间为Qe力2)°2、彳1+(“—2)/艮(1,"—2)°回归系数的置信区间00和0i置信水平为1-a的置信区间分别为1x2_+——ns预测与控制3、(1)预测用%的回归值九=久+BX°作为yo的预测值.儿的置信水平为1-0的预测区间为[—(g+心,其中W孕一2)帆+气壬特别,当n很大且x。在无附近取值时,y的置信水平为1-"的预测区间近似为A.八AA.y—q巴小+6巴a1I22(2)控制要求:y=0°+0u+£的值以1_"的概率落在指定区间(/,/),只要控制X满足以下两个不等式y-<5(x)>y,y+^(x)

8、y"-y'»25(兀).若夕-<5(兀)=y;y-S{x}=y"分别有解x和x,即y一6(『)=yy+=y"・则X,/)就是所求的X的控制区间.四、可线性化的一元非线性回归(曲线回归)例2出钢吋所用的盛钢水的钢包,由于钢水对耐火材料的侵蚀,容积不断增人.我们希望知道使用次数与增大的容积之间的关系•对一钢包作试验,测得的数据列于下表:使用次数增大容积使用次数增大容积26.421010.493&201110.5949.581210.6059.501310.8069.701410.60710.001510.9089.931610.7699.991110.5109.58.57.56

9、.5-:6210121416此即非线性回归或曲线回归问题(需要配曲线)。配曲线的一般方法是:先对两个变量X和y作n次试验观察得a,开),i=1,2,...,77画出散点图,根据散点图确定须配曲线的类型•然后由n对试验数据确定每一类曲线的未知参数a和b.采用的方法是通过变量代换把非线性回归化成线性回归,即采用非线性冋归线性化的方法.通常选择的六类曲线如下:(1)双曲线丄=r/+-)'兀(2)幕函数曲线y=ax其中x>0,a>0(3)指数曲线y=a严其中参数a>0・(4)倒指数曲线y二a严其中a>0,(5

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。