资源描述:
《数据分析知识点》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库。
1、一.K.Pearson收集了大W:父亲身岛与儿子身岛的资料。其屮十对如下:父亲身高X(吋)60626465666768707274儿子身高y(吋)63.665.26665.566.967.167.468.370.170求Y关于X的线性回归方程。二乘估计为又,一(yi-y经计算得:y=67.01,66.8,It2=44794[x.y.=44842.4,5XX171.6,S=79.72.•o’故6Z,/?的最35.9768,b0.4646回归方程:y=35.9768+0.4646x.或写成:J=67.01+0.4646(%-66.8).误差方差的估
2、计例1中误差方差的估计计算得:7=67.01,[yf=44941.93,5yv=38.529.i又己矢口5vv=79.72,/T=0.4646.Qe=Syy-bSxy=A9,所以,cr2的无偏估计cf2=L(n-2)=0.186.误差方差估计的意义:误差方差的大小对模型的好坏有很大的影响。自变量对因变麓影响的大小是同误差对因变量•的影响相比较的。(C)如果自变量对因变量的影响不能显著的超过误差对因变量的影响,就很难从这样的模型中提炼出有效的、有足够精度的信息。显著性检验检验例1中回归效果是否显著,取C1=0.05。采用最小二乘法估计参数a和
3、b,并不需要事先知道Y与X之间一定具有相关关系,即使是平面图上一堆完全杂乱无章的散点,也可以用公式求出回归方程。因此P(x)是否为x的线性阑数,一要根据专业知识和实践來判断,二要根据实际观察得到的数据用假没检验方法來判断。即耍检验假设H0••b=0,H、b弇0,若原假设被拒绝,说明回归效果是显著的,否则,若接受原假设,说明Y与X不是线性关系,回归方程无意义。由刖面的结果知:八b=0.4646,S=171.6,(f2=0.186.査表得:,《/2(«-2)=’o.o25(8)=2.306.因此假设H。:b=0的检验拒绝域为:卜1=2.306.计算
4、得,=I0.4646
5、J7】6=14.1>2.306.1a/0.186故拒绝。:6=0,认为回归效果是显著的。二.合金钢的强度y与钢材中碳的含量x有密切关系。为了冶炼出符合要求强度的钢常常通过控制钢水屮的碳含量来达到目的,为此需要了解y与x之间的关系。其屮x:碳含量(%)y:钢的强度(kg/mm2)数据见下:X0.030.040.050.070.090.100.120.150.170.20y40.539.541.041.543.042.045.047.553.056.0(1)画出散点图;(2)设P(x)=a+bx,求a,b的估计;(3)求误差方
6、差的估计,画山残差图:(4)检验回归系数b是否为零(取(1=0.05):(5)求冋归系数b的95%置信区间;(6)求在x=0.06点,回归函数的点估计和95%置信区间;(7)求在x=0.06点,丫的点预测和95%区间预测。(1)合金钢的强度y与钢材中碳的含量x的散点图KTftH-O&0.050.070.090.110.130.150.17算得:=449,)二xz.=1.o2,y:=0.1338,涵031).19(2)计y/E、•I48.55555vr=0.02976,S”.=2.757.a,b的最小二乘估计为參•八a=—-八■TT?,nE(X一
7、X)(y,)Sb=•/=1□”.E(%/-%)2/=1SXX得a,诚丨勺最小二乘估计:八a=35.4506,6=92.6411回归方程:夕=35.4506+92.6411X.或写成:y=44.9+92.6411(^-0.102).:3)计算得:E•V/=449,Ey,2=20443,S),),=282.9.Qe=Syy-bSxy=27.4884,所以,cr2的无偏估计02=-2)=3.436.省oOOOOOO0O0.031■0.05I10.07110.091i0.11110.13110.15Ii0.17ii019合金钢的强度y与钢材中碳的含最x
8、的回归直线图•t7I•
9、IIIjI■III1■0.050.070.090.110.130.150.170.19(4)检验假设H():Z?=0,H:*0的显著性水平/b为汉的检验拒绝域:
10、叫=—JSxx>ta/2(n-2)o经计算t
11、=9j.6411^/002976=8.6217>ZoO25(8)=2.306,-436拒绝原假设,认为合金钢强度与炭含量的回归效果显著(5)回归系数办的置信水平95%的置信区间:a/2(67.8629,117.419341.00916)当x0=0.06时,j0=J十(x0-r)2.306x。品1々’):■1.70
12、6XX所以,/z(0.06)&^0.95的置信区间为:(39.303,42.715).(7)x0=0.06时,置信水平为0.95的预测区间为:(36.