资源描述:
《心统12-15章复习提纲》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、心统12-15章复习提纲第十二章相关一、相关的概念相关是度量和描述两个变量之间关系的一种统计技术。数据要求:一定要有至少两个变量,两组分数。应用相关的研究情境:预测效度-如果两个变量间有强相关,我们就可以根据一个变量的值,预测另一个变量的值。例如,如果知道某些人格特征,可以预测员工绩效。相容效度–如果发明新的心理测验(测验A),想知道它是否测量了X,就需要知道测验A是否与X相关。效标关联效度--如果发明新的量表,管理潜能量表来预测晋升所需时间,这个量表分数应当与晋升所需时间相关。重测信度–如果对同一组被试两次
2、用相同的测验,将两组分数做相关。如果测验是可信的,两次测验应当得到相似的结果,产生高相关。理论验证(构想效度)–比如验证社交技能与焦虑的相关。相关表明变量X和Y之间关系的3个特征:1)关系的方向:正相关(正数)意味着两个变量向相同的方向变化。亦即一个变量增加,另一个变量也增加。负相关(负数)意味着两个变量向相反的方向变化。亦即,一个变量增加,另一个变量反而减少。2)关系的形式:本课集中讨论线性(直线)相关,但两变量的关系也有其他形式。3)关系的程度:相关也度量了X和Y间关系的强度.相关系数的值在-1和+1之间
3、。0相关意味着没有关系.+1意味着完全的正相关,-1意味着完全的负相关。0.7+意味着较强相关,0.3-0.5也认为有相关。考察相关应先看散点图,获得直观的结果。二、相关的解释数值的大小形容关系密切程度,但不能定量描述,正负表示相关的方向。解释关系强度应考虑r^2(等于回归和方/总和方),不只是r。----------原理见卡方检验部分Y方差的分解。它表明了:一个变量的方差中,由X和Y间的相关解释的方差的比例。当r=0.7时,r2=0.49,即Y变量49%的变异能够由X推出。积差相关的效应大小——Cohen’
4、sConvention:r=.10小的效应r=.30中等效应r=.50大的效应积差相关的相关系数与统计效力(检验是否相关)换算表:(双尾)N相关系数0.10.30.5100.060.130.33200.070.250.64300.080.370.83400.090.480.92500.110.570.971000.170.861相关描述两个变量之间的关系,但并不能解释变量相关的原因。在相关研究中,研究者没有操纵一个(或几个)变量而保持其他变量不变。因此,相关计算绝不能得到因果性推论。伪相关(第三变量):一位
5、研究者发现某月洒咖啡的次数和空难次数呈强的正相关。(飞行次数多所以空难多,洒咖啡多)一位研究者发现警察局的规模X和犯罪量Y呈强的正相关。(城市大,所以警察局大,犯罪量大)这里我们发现另一个变量Z,同时导致X和Y,X和Y其实并不是因果关系,而是共变关系。数据中的分数范围对相关有非常大的影响:----奇异值是否可靠?极端的分数对相关有非常大的影响:显著性与n有关,相关性与n关系不大。将相关的概念数量化:我们主要讨论两种相关,Pearson积差相关,Spearman等级相关。r=X和Y共同变化的程度/X和Y各自变化
6、的程度=X和Y的协方差/X和Y各自的方差共变意味着随着X变化,Y也变化。r=1.0(或-1.0),即完全的相关。意味着分子分数等于分母分数。三、离差的乘积和SP:求积差相关的数据资料的要求:要求成对的数据,每对数据之间相互独立,数据不宜少于30对,否则会没有代表性;两列变量各自的总体分布均为正态分布;两个相关变量是连续变量;两列变量之间的关系是直线型的。定义公式:SP=∑(X-Xbar)(Y-Ybar)——对于每一点与X和Y的平均值的差,即离差,求两个离差的乘积,再求和。SP的计算公式:∑XY-∑X∑Y/n四
7、、Pearson相关的计算:也称积差相关------不受数据单位转换的影响r=SP/sqrt(SSxSSy)——分子SP是X和Y协方差的指标,分母是X和Y各自的变异。计算时列表:X,X^2,Y,Y^2,XY五、相关系数的显著性考验:-----------推论统计,n较小,r又不很大时需要检验总体参数ρ,样本统计量r。虚无假设和备择假设:双侧:H0:ρ=0,X和Y之间无相关H1:ρ≠0单侧:H0:ρ=0,没有正相关H1:ρ>0df=n-2--------------与t检验无关在论文中报告相关:对数据的相关分析
8、显示受教育年限与年收入有显著相关,r(474)=+.66,p<.01,双尾。六、等级相关-----数据不是等距或等比的,而是顺序等级,或者总体不是正态,不满足积差相关的要求Spearman相关(斯皮尔曼相关)-----可以为负,是从积差相关推出的,可以认为是积差相关的一种特殊形式一种非参数检验;---------保守,不敏感用于顺序型数据、非线性数据;要求只有两列变量,具有等级变量的性质和线性关系。