资源描述:
《生物统计学十四ppt课件.ppt》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库。
1、因果关系:回归分析平行关系:相关分析四、直线回归的区间估计当直线回归关系显著之后,既可用样本统计数a、b来估计总体参数α、β,又可利用回归方程去估计某一x值对应y总体的平均数和预测单个y值所在的区间。(一)回归截距和回归系数的置信区间回归截距a的方差为:回归截距a的标准误和t值为:总体回归截距a的置信区间为:总体回归系数β的置信区间为:P141例7.5(二)的置信区间和单个y的预测区间由,故的标准误为:条件总体平均数的95%置信区间为:[L1=-t0.05,L2=+t0.05]单个y值的标准误为:保证概
2、率为0.95的y的预测区间为:[L1=-t0.05,L2=+t0.05]P142例7.6(三)和单个y观测值置信区间图示首先取若干个等距的x值(x取值愈密,作图愈准确),算得与其相应的、、和、的值;然后再由和算得各x上的L1和L2,并标于图上;最后将各个L1和L2分别连成曲线即可。试制作例1资料的y估计值包括和y在内有95%可靠度的置信区间图。表2例1资料的置信区间和y的预测区间的计算(2)(3)(4)(6)(7)(8)[,(1)x的95%置信区间计算y的95%预测区间计算(5)[L1,L2]]3032
3、343637384042444615.613.411.29.07.96.84.62.40.2-2.02.211.751.371.131.091.121.351.722.172.665.24.13.22.72.62.63.24.15.16.310.4,9.3,8.0,6.3,5.3,4.2,1.4,-1.7,-4.9,-8.3,20.817.514.411.710.59.47.86.55.34.33.952.723.533.463.433.463.533.693.924.219.38.88.38.28.1
4、8.28.38.79.39.96.3,4.6,2.9,0.8,-0.2,-1.4,-3.7,-6.3,-9.1,-11.9,24.922.219.517.216.015.012.911.19.57.9一代三化螟盛发期估计及其95%置信限画出的图像,依次标出(x,L1)和(x,L2)坐标点,再连接各(x,L1)得线,连接各(x,L2)得线。连接各(x,L2)得线。和所夹的区间即包括在内有95%可靠度的置信区间。称(x,)的连线,(x,)的连线。其所夹的区间即为y的95%的预测区间或预测带。3月下至4月中旬
5、平均温度累积值例1资料的y估计值及其95%置信带五、直线回归的应用及注意问题(一)直线回归的应用(二)应用直线回归时的注意问题第三节直线相关一、相关系数和决定系数二、相关系数的假设测验三、相关系数的区间估计四、应用直线相关的注意事项一、相关系数和决定系数(一)相关系数(X,Y)总体没有相关,则落在象限Ⅰ、Ⅱ、Ⅲ、Ⅳ的点是均匀分散的,因而正负相消,=0。当(X,Y)总体呈正相关时,落在象限Ⅰ、Ⅲ的点一定比落在象限Ⅱ、Ⅳ的多,故一定为正;同时落在象限Ⅰ、Ⅲ的点所占的比率愈大,此正值也愈大。当(X,Y)总体呈
6、负相关时,则落在象限Ⅱ、Ⅳ的点一定比落在象限Ⅰ、Ⅲ的为多,故一定为负;且落在象限Ⅱ、Ⅳ的点所占的比率愈大,此负值的绝对值也愈大。的值可用来度量两个变数直线相关的相关程度和性质。但是,x和y的变异程度、所取单位及N的大小都会影响其大小。这些因素的影响是可以消去的。方法就是将离均差转换成以各自的标准差为单位,使成为标准化离差,再以N除之。可定义双变数总体的相关系数为:上式中的已与两个变数的变异程度、单位和N大小都没有关系,是一个不带单位的纯数,因而可用来比较不同双变数总体的相关程度和性质。相关系数是两个变数
7、标准化离差的乘积之和的平均数。样本的相关系数r因为:在回归分析时分成了两个部分:一部分是离回归平方和Q,另一部分是回归平方和U=(SP)2/SSx。因此,又可有定义:r的取值区间是[-1,1]。双变数的相关程度决定于
8、r
9、,
10、r
11、越接近于1,相关越密切;越接近于0,越可能无相关。r的显著与否还和自由度有关,df越大,受抽样误差的影响越小,r达到显著水平的值就较小。正的r值表示正相关,负的r值表示负相关。而相关系数r的正或负和回归系数b是保持一致。决定系数决定系数(determinationcoeffic
12、ient)定义为由x不同而引起的y的平方和占y总平方和SSy=的比率;也可定义为由y不同而引起的x的平方和占x总平方和SSx=的比率,其值为:所以决定系数即相关系数r的平方值。决定系数和相关系数的区别在于:①除掉
13、r
14、=1和0的情况外,r2总是小于
15、r
16、。这就可以防止对相关系数所表示的相关程度作夸张的解释。例如,r=0.5,只是说明由x的不同而引起的y变异(或由y的不同而引起的x变异)平方和仅占y总变异(或x总变异)平方和的r2=0.25,