资源描述:
《【精品】相关分析》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库。
1、第七章相关分析任何事物的存在都不是孤立的,而是相互联系、相互制约的。在医学领域中,身高与体重、体温与脉搏、年龄与血压等都存在一定的联系。说明客观事物相互间关系的密切程度并川适当的统计指标表示岀来,这个过程就是相关分析。值得注意,事物Z间有相关,不一定是因果关系,也可能仅是伴随关系。但如果事物Z间有因果关系,则两者必然相关。由变量相依关系的特点,变量Z间的依存关系可分为两大类型:⑴确定性关系——函数关系,例如圆而积S="2,y£+兀2等。(2)确定性关系——相关关系,例如人的血压y与年龄xZ间的关系等。以往我们讨论过的许多数学学科,如分析几何、
2、代数等都是研究变量Z间确定性关系的,但非确定性关系在自然界和我们熟知的教育领域小大量存在,例如学习成绩与智力因素或与非智力因素Z间,数学成绩与物理成绩Z间,性别与学习成绩Z间等,都存在某种相互联系,相互制约的依存关系,这种关系不是那种严格的函数关系,而是一种非确定性的关系。相关关系和函数关系也有联系:rh于观察和测量中会产牛误差,函数关系往往通过相关关系表现出來,变量间相关关系非常密切时,通常又呈现出某种函数关系趋势。相关的种类按不同的分类标准,相关关系有多种分类1、简单相关和复相关「简单相关——两个变量之间的相关关系按涉及变量的多少分yI复
3、相关个变量与两个及以上个变量Z间的相关关系2、线性相关和非线性相关•线性相关(直线相关)按变量关系的表现形态,相关关系可分为YI非线性相关(曲线相关)3、正相关和负相关按变量数值变化方向的总趋势,相关关系可分为正相关、负相关正相关——两个变量变化方向的趋势相同(见教材P2,图1-2左)负相关——两个变量变化方向的趙势相反(见教材P2,图1・2右)4、完全相关、高度相关、低度相关和不相关按两变量联系的紧密程度分,相关关系可分为完全相关、高度相关、低度相关和不相关(零相关)相关分析的主要内容研究两个或两个以上变量之间是否存在相关关系,如果存在相关
4、关系,其相关的性质和程度如何,这个过程在统计学上称为相关分析,相关分析的主要内容包括:1、确定变量Z间有无相关关系存在,以及相关关系呈现的形态。2、确定相关关系的密切程度。断送相关关系密切程度的主要方法是绘制散点图和计算相关系数。3、对相关系数的显著性进行统计检验。数据类型性质数据顺序数据连续数据性质数据口-口质相关顺序数据等级相关SpearmanKendallWKendallU连续数据质量相关积差相关注意品质相关耍先学习卡方独立性检验。积差相关用于计算连续且总体服从正态的两变量间的相关。等级相关,指以等级次序农示的变皐Z间的相关。等级相关适
5、用这样两种情况:①虽然是连续数据,但变量总体上不服从正态分布,②或者数据是顺序的。当然在这两种情况下都要求变量间是线性关系,并且在将数据代入公式Z前,必须将原来的数据转化为连续编号的等级数据,这里的筹级数据必须是从1到N排列,若有和同的数据,则平分共同应该占据的等级,如,平时所说的两个并列第一名,他们应该占据1,2名,所以它们的等级应是1.5,又如一个第一名,两个并列第二名,三个并列第三名,则它们对应的等级应该是1,2.5,2.5,5,5,5,这里2.5是2,3的平均,5是4,5,6的平均。我们将介绍斯皮尔曼等级相关、肯徳尔W系数与肯徳尔U系
6、数三种计算等级相关的方法,前者用于只有两列变量的情况,后两者用于三列及三列以上变量的情况。质暈相关,指一列变暈为等比或等距的测量数据,另一列变量是按性质划分的类别。主要介绍三类质量相关,点二列相关、二列相关、多系列相关。SPSS的相关分析是借助于Statistics菜单的Coirelate选项完成的。第一节Bivariate过程7.1.1主要功能枳差相关,是计算两个变量线性和关的一种方法,山英国统计学家皮尔逊提出,因此也称为皮尔逊(Pearson)相关。要使用积差相关必须同时具备如下儿个条件:①两个变量都是由测量获得的连续性数据,即等距或等比
7、数据。②两个变量的总体都呈世态分布,或接近正态分布,至少是单峰对称分布,当然样本并不一定要止态。③必须是成对的数据,而且每对数据之间是相互独立的,即各向互不影响,木条件是难以检验的。④两个变量之间星线性关系。一般用描绘散点图的方式來观察,最好是先各口转化为Z分数,单位会统--些。若对(x、y)作了n次观测,得到n对数据(兀心),(兀njn)。则定义r为:.vy其中;=£(“-恥厂刃,—=£(兀-兀)2,仏=£(开-曲/=1/=!/=1n,=1由哥■席不等式易知lrl8、线性相关关系,丨厂1越小,兀与y存在线性相关的程度越小,=0,可以认为兀与y不相关(不存在线性相关),但不相关并不等于兀与y相互独立,x与),之间可能存在其它形式的