欢迎来到天天文库
浏览记录
ID:27587794
大小:411.51 KB
页数:13页
时间:2018-12-01
《分类变量相关系数》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库。
1、分类变量分类变量的定义指地理位置、人口统计等方面的变量,其作用是将调查响应者分群。其变量值是定性的,表现为互不相容的类别或属性。分类变量的分类(1)无序分类变量(unorderedcategoricalvariable)无序分类变量是指所分类别或属性之间无程度和顺序的差别。它又可分为①二项分类,如性别(男、女),药物反应(阴性和阳性)等;②多项分类,如血型(O、A、B、AB),职业(工、农、商、学、兵)等。对于无序分类变量的分析,应先按类别分组,清点各组的观察单位数,编制分类变量的频数表,所得资料为无序分类资料,亦称计数资
2、料。(2)有序分类变量(ordinalcategoricalvariable)有序分类变量各类别之间有程度的差别。如尿糖化验结果按-、±、+、++、+++分类;疗效按治愈、显效、好转、无效分类。对于有序分类变量,应先按等级顺序分组,清点各组的观察单位个数,编制有序变量(各等级)的频数表,所得资料称为等级资料。分类变量的相关系数系数系数系数G系数系数r系数系数测定法系数适用于两个定类变量的相关测定,具有消减误差比例的意义,取值范围在0-1之间。值越大,表明X和Y两变量的相关程度越大;反之,则越小。测定法的计算公式为:——x每
3、一类别中Y分布的众数次数;——Y边缘分布中的众数次数;——总体单位数。系数测定法适用于两个定类变量,或一个定类一个定序变量的相关测度。取值范围在0-1之间。计算公式为:——因变量Y边缘分布次数平方和。系数系数适用于两个定序变量的相关测定,取值范围-1—+1之间,不具备消减误差比例意义。当计算值为正,表示变量间正相关;计算值为负,表示变量间负相关。讨论定序变量的相关测度时,就是从两变量的变化顺序是否一致或等级之间的差别去考虑。系数便属于等级相关。其计算公式为:D——两变量中,每对X和Y等级之差,这个差的正值之和应等于负值之和
4、。G系数G系数适用于两个定序变量的相关测定,取值范围在-1—+1之间,具有消减误差比例意义。这种测定方法主要是从两变量的变化顺序是否一致去思考问题。其计算公式为:——X和Y两变量变化顺序一致的数目,即同序对数目;——X和Y两变量变化顺序相反的数目,即异序对数目。系数系数适用于一个定序变量一个定距变量的相关分析。取值范围在0-1之间,具有消减误差比例的意义。计算公式为:——每一类X的单位数;——全部单位数;——每一类X中Y值得算术平均数;——全部Y值得算术平均数。r系数两个定距或定比变量之间的相关测定,最常用的是积差系数。它
5、是由英国统计学家皮尔逊(Pearson)用积差方法推导出来的,也称皮尔逊相关系数,用符号r表示。相关系数r本身不具有消减误差意义,但是有这一意义。r的取值范围在-1—1之间。用它判断两变量间的相关程度,一般有四个标准:r的计算公式为:—x变量的平均数;—y变量的平均数;—x变量的标准差;—y变量的标准差;—全部单位数。因为所以上式又可以变为:谢谢!
此文档下载收益归作者所有