欢迎来到天天文库
浏览记录
ID:39228451
大小:534.50 KB
页数:57页
时间:2019-06-28
《两变量间相关与回归分析》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库。
1、第十一章两变量间相关与回归分析对一个变量的每个可能取值,另一个变量都有完全确定的值与之对应,则称这两个变量之间的关系呈现函数关系,称确定性关系。若两变量之间确实存在着某种关系,但这种关系不是一一对应的函数关系,称非确定性关系。第一节直线相关一、直线相关的概念描述两个变量相互关系最简单的统计方法就是直线相关分析:两个变量是否有直线相关关系?如果有直线相关关系,那么它们之间的关系是正相关还是负相关?相关程度如何?散点图图11-1两变量相关关系示意图二、相关系数的定义与计算相关系数(correlationcoefficient)又称
2、为积差相关系数(coefficientofproductmomentcorrelation)、皮尔逊相关系数(Pearson’scorrelationcoefficient)、简单相关系数(simplecorrelationcoefficient)等,以符号r表示样本相关系数,ρ表示总体相关系数。它说明具有直线关系的两个变量,相关关系的密切程度与相关方向的指标。其值为-1≤r≤1。计算公式三、相关分析的步骤例11-1某医师测得10名3岁儿童的体表面积(m2)与体重(kg)原始资料见表11-1第2、3栏,试分析三岁儿童体表面积与
3、体重间的相关关系。计算步骤如下:1、绘制散点图:2、相关系数的计算4、相关系数的假设检验四、相关分析中应注意的问题(1)进行相关分析的资料应有实际意义。(2)相关系数的计算适用双变量正态分布资料(3)进行相关分析前应先绘制散点图。图11-3异常点对相关分析的影响(4)相关关系不完全等同于因果关系。(5)实际工作中计算出的相关系数仅是样本相关系数(6)不要把相关系数的假设检验结果误认为两事物或现象间相关的密切程度。(7)要注意资料的同质性。图11-4样本来自不同总体时对相关性的影响datali11_1;inputxy@@;car
4、ds;11.00.528311.80.529912.00.535812.30.529213.10.560213.70.601414.40.583014.90.610215.20.607516.00.6411;proccorr;varxy;run;procplot;ploty*x='*';run;第二节直线回归相关分析是描述两变量之间相互关系回归分析是分析两变量间是否有依存关系一、直线回归方程a称为截距,b称之为斜率或回归系数,表示当自变量X每改变一个单位,因变量Y平均变动的单位数。最小二乘法:二、实例求解回归方程例11-2某地
5、测得10名3岁儿童的体表面积(m2)与体重(kg)资料见表11-1第2、3栏,试求3岁儿童由体重推算体表面积的回归方程。二、实例求解回归方程1、绘制散点图。2、计算77.55946-134.4×5.7266/10b=───────────────=0.023851831.24-(134.4)2/103.绘制回归线图11-5三岁儿童的体表面积与体重的回归线三、直线回归方程的假设检验1、回归系数的假设检验——方差分析F=89.024,P<0.01拒绝H0,接受H1,回归方程有统计学意义,故可认为小儿体表面积与体重之间有直线回归关系
6、存在。2、回归系数的假设检验-t检验SY.X为剩余标准差,P<0.01四、直线回归方程的应用1、描述两变量间的依存关系2、利用回归方程进行预测所谓利用回归方程进行预测就是把自变量代入回归方程,对应变量进行估计,可求出因变量取值的波动范围,即个体Y值的预测区间(predictioninterval,PI)。当X为某定值时,Y的1-α预测区间为:SY为总体中当X为某定值时Y的标准差,例12-3:例12-2所得的回归方程:若已知某3岁儿童的体重为13.5kg,试估计该儿童体表面积:3、利用回归方程进行统计控制统计控制是利用回归方程进
7、行逆估计,如要求因变量Y在一定范围内波动,可以通过控制自变量X的取值来实现。datali11_2;inputxy@@;cards;11.00.528311.80.529912.00.535812.30.529213.10.560213.70.601414.40.583014.90.610215.20.607516.00.6411;procreg;modely=x/stbP/*输出y的实测值、预测值及其误差、残差*/Clm/*输出预测值均值的95%的置信区间*/cli;/*输出y的95%的预测区间*/Run;五、直线回归分析中应
8、注意的问题1、进行回归分析要有实际意义。2、注意直线回归分析的条件。①线性②独立性③正态性④方差齐性3、结果的正确解释:不能混淆P值与回归系数的意义。4、线性回归应用时应考虑其实测范围。第三节直线回归与直线相关分析的区别与联系一、直线回归与直线相关分析的区别1.资料要求不同。
此文档下载收益归作者所有