资源描述:
《应用统计学第6章 相关与回归分析课件.ppt》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库。
1、第6章相关及回归分析相关分析与回归分析可以定量地建立一个变量关于另一个变量或另几个变量的数学模型,从而对变量进行预测或控制。主要内容6.1相关分析6.2一元线性回归分析6.3多元线性回归分析6.4非线性回归分析6.5用SPSS进行相关及回归分析§6.1相关分析6.1.1变量间的关系变量关系确定性关系:相关关系可用确定的函数表达式表达相关方向正相关负相关相关程度完全相关完全不相关不完全相关相关形式线性相关非线性相关变量的个数:单相关/复相关/偏相关例:现调查了15个地区化妆品的销量、地区人数与人均收入,试对销量与人均收入、地区人数的关系进行讨论6.1.2相
2、关分析相关分析(CorrelationAnalysis)是根据观察的数据资料,在具有相关关系的变量之间,对现象之间的依存关系的表现形式和密切程度的研究,它处理的是一种相互关系。两种方法散点图:相关系数:详细的定量分析之前,对变量之间存在的相关关系的方向、形式和密切程度进行大致判断(如上一例)定量分析相关系数的定义:又称Pearson相关系数,是根据样本数据计算的对两个变量之间线性关系强弱的度量值。样本相关系数的计算公式设(xi,yi)(i=1,2,…,n)是来自总体(X,Y)的样本,则样本相关系数的计算公式为:式中,相关系数的意义:r无单位,-1≤r≤1
3、①0<r<1表示两个变量间存在正线性相关关系。②-1<r<0表示两个变量间存在负线性相关关系。③r=0表示两个变量间不存在线性相关关系。④
4、r
5、=1表示两个变量间存在完全线性相关关系。⑤
6、r
7、越接近于0,表示两变量间线性相关程度越低。⑥
8、r
9、越接近于1,表示两变量间线性相关程度越高。相关系数等级划分表r的取值
10、r
11、<0.30.3≤
12、r
13、<0.50.5≤
14、r
15、<0.8
16、r
17、≥0.8相关程度不线性相关低度线性相关中度线性相关高度线性相关相关系数是无量纲的量,可以进行比较。两个变量相关程度的高低取决于
18、r
19、的大小,而不是r数值的大小。相关系数是一种对称测量,因
20、此相关关系≠因果关系计算相关系数要求样本容量n要大一些,否则不易做出正确判断;另外,极端值也可能影响相关系数。相关系数只度量变量间的线性关系。因此,当r=0或很小时,只能说明线性相关关系较弱,并不能说明变量之间没有任何关系,比如可能存在非线性相关关系。注意:相关系数的检验由于存在抽样的随机性和样本数量较少等原因,通常导致推断的可信程度不高。因此需要通过假设检验的方式对样本来自的两个总体是否存在显著的线性相关进行统计推断。相关系数检验的步骤如下:(1)提出假设:H0:ρ=0H1:ρ≠0(2)构造检验统计量。在H0成立时,检验统计量t=(3)给定显著性水平α
21、,查表确定临界点(4)确定拒绝域:(5)做统计决策:若拒绝H0,说明两总体之间线性关系显著;否则,认为两总体之间线性关系不显著。§6.2一元线性回归分析回归分析(RegressionAnalysis),是在分析变量之间相关关系的基础上,进一步考察变量之间的数量变化规律,并通过回归方程的形式加以描述和反映变量之间的关系,帮助人们准确把握变量受其他一个或多个变量影响的程度,进而为控制和预测提供依据。“回归”名称的由来回归名称的由来要归功于英国统计学F.高尔顿(F.Galton:1822~1911)。高尔顿和他的学生、现代统计学的奠基者之一K.皮尔逊(K.Pe
22、arson:1856~1936)在研究父母身高与其子女身高的遗传问题时,在观察了1078对夫妇后,以每对夫妇的平均身高作为x,取他们的一个成年儿子的身高为y,将结果绘成散点图后发现成一条直线。计算出回归方程为这种趋势说明父母平均身高x每增加一个单位,其成年儿子的平均身高增加0.516个单位。该结果表明:高个子父亲确实有生高个子儿子的趋势。子代人的身高有回归到同龄人平均身高的趋势。此例形象的说明了生物学物种的稳定性。分类6.2.2一元线性回归模型回归分析正是要建立Y关于X1,X2,…,Xn的回归方程,并在给定X1,X2,…,Xn的条件下,通过回归方程来预测
23、Y的平均值。回归分析中的两类主要变量解释变量(因变量Dependentvariable)记为Y被解释变量(自变量Independent~)记为X1,X2,…,Xn。回归分析一元回归分析—被解释变量只有一个多元回归分析—被解释变量有一个以上被解释变量的个数线性回归分析非线性回归分析回归分析回归方程的形式可以用相关分析或非线性回归分析1.一元线性回归模型的建立画出两个变量X和Y的散点图由X的变化引起的Y的线性变化部分Y=a+bXY=a+bX+ε由于其他随机因素引起的Y的变化部分ε,ε~N(0,σ2)观察散点是否呈直线趋势是否建立一元线性回归模型:Y=a+bX
24、+ε如何建立方程???最小二乘法根据距离观测值的各点平方和最小原则确定参数的方法