欢迎来到天天文库
浏览记录
ID:39417742
大小:233.60 KB
页数:42页
时间:2019-07-02
《《分类数据分析》PPT课件(I)》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库。
1、Analysisofnominaldata分类数据分析分类数据分析简介分类数据也称名义数据,是社会科学研究的组成部分,其数据信息仅代表数据类别。例如种族,1=白种人,2=黄种人,3=黑人。根据每个类别的数量,可以分析它们之间的关系。分类数据的分析要求研究者应首先决定如何分类。分类数据分析的应用范围政治学领域:研究政治立场是否影响政治派别。社会学和心理学领域:分析不同类别的人不同的心理特征。公共政策分析领域:研究不同政策在不同地区产生的效果。文化传播领域:研究人们对媒体的看法。分类数据分析是社会科学中最重
2、要的课题之一。一方面因为它的用途广泛,另一方面因为它解决的是基本问题一些简单概念的解释分类:最理想的分类是这些类别相互区别并且没有遗漏。统计过程中都假设分类是有意义的。自变量和因变量:区别在于是否引起另外一个变量的变化。取样:从总体抽取的简单随机样本。符号:I、J表示表格的行数和列数,X、Y、Z表示变量。表1:党派和立场间的关系民主党独立党共和党革命的33%(193)30%(161)11%(46)400中立的41%(241)37%(199)33%(134)574保守的26%(153)34%(182)56
3、%(229)564100%(587)100%(542)100%(409)1538X:党派Y:立场表2:受党派和地区影响的立场民主党独立党共和党革命的26.8%(62)26.8%(37)10.0%(10)109中立的40.7%(94)33.3%(46)33.3%(33)173保守的32.5%(75)39.9%(55)56.6%(56)186100%(231)100%(138)100%(99)468Z:地区=西部X:党派Y:立场民主党独立党共和党革命的36.8%(131)30.7%(124)11.6%(36
4、)291中立的41.3%(147)37.9%(153)32.6%(101)401保守的21.9%(78)31.4%(127)55.8%(173)378100%(356)100%(404)100%(310)1070Z:地区=非西部X:党派Y:立场表3:标准I×J表格X:自变量Y:因变量12jJTotals1n11n12…n1j…n1Jn1+2n21n22…n2j…n2Jn2+………………ini1ni2…nij…niJni+………………InI1nI2…nIj…nIJnI+Totalsn+1n+2…n+j…n
5、+Jn相关程度的测量相关程度的测量方法是用一个系数来表示变量间的相关程度。选择何种方法要考虑三个方面:测量方法是否对称:是否可以确定自变量和因变量。系数如何解释:取决于不同的测量方法制定的标准。测量方法的敏感度:尽量使用敏感度较低的方法。表5:完全相关的三种类型X500000500500505050YTotalsX500050005050501505050YTotalsX050050Y5000000500Totals50505050a严格完全相关b隐含完全相关c弱完全相关干扰因素和解决办法边际分布不均匀
6、(如表6):调整数据将表格标准化选择对边际总数不敏感的测量方法行列不相等:选择可以达到最大值的测量方法。表6:不同边际分布,相同相关程度XTotals60%(60)20%(200)10%(10)270Y30%(30)60%(600)30%(30)66010%(10)20%(200)60%(60)270Totals100%(100)100%(1000)100%(100)1200XTotals60%(180)20%(120)10%(30)330Y30%(90)60%(360)30%(90)54010%(30
7、)20%(120)60%(180)330Totals100%(300)100%(600)100%(300)1200(a)(b)2×2表格的测量方法1、百分比法2、差额比率法3、Yule’sQ4、Yule’sY5、6、相关系数百分比法如果因变量在自变量的一个分类中的百分比发生了变化,那么这两个变量就是相关的;如果不发生变化,就是独立的。百分比法的性质:对因变量的边际总数不敏感。需要较大的样本容量。百分比法X0.9(45)0.4(20)Y0.1(5)0.6(30)1.0(50)1.0(50)0.9-0.4=
8、0.5差额比率法X:党派民主党共和党革命的19346239保守的153229382346275621Y:立场差额比率法的性质ab10050251002520020050125250225150差额比率法的性质abXX751575015Y10100Y10010085115850115差额比率的性质abXX20002000Y0200Y200200200200400200差额比率的性质差额比率的取值范围是从0到∞,等于1.0说明独立,小于1.0表
此文档下载收益归作者所有