欢迎来到天天文库
浏览记录
ID:9176022
大小:61.00 KB
页数:12页
时间:2018-04-20
《社会调查研究方法考研资料15》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、第十五章:资料的统计分析1、统计分析的作用:(1)可对资料进行简化和描述。(2)可对变量间的关系进行描述和深入地分析。(3)可通过样本资料推断总体。2、统计分析的步骤:(1)对应用统计分析的前提条件进行考察。统计分析是建立在树立统计理论基础上的,因此他的应用必须满足一定的理论前提。(2)制定统计分析方案:<1>再次确定自变量与因变量。<2>定义复合变量。问卷或调查表上出现的各个变量,一般称为基本变量或原始变量。用基本变量组合而成的新的变量,称作复合变量。<3>变量分组:将类别或属性相同的变量组合成有意义的数组。<4>提出统计计算的要求并提出适当的统计方法。(3)选择统计
2、分析方法的原则。必须根据研究目的和资料本身的特点选择适当的统计分析方法。从研究目的考虑:是描述性研究还是解释性研究。描述性研究在于说明某种社会现象的状况;对于解释性研究,除了采用描述性研究的方法外,还要使用控制变量、建立因果统计模型和分类及综合变量等多种统计分析技术。研究资料的性质,主要考虑:<1>变量的测量尺度;<2>资料的收集方法;<3>数据的分布形态;<4>变量的个数。(4)对于统计结果的解释。统计分析是一种定量分析方法,但任何具体的两都是有质的规定性以及数量关系背后的社会背景情况,如果不了解这种质的规定性以及数量关系背后的社会背景情况,就可能做出肤浅、错误的甚至
3、荒谬的解释。因此,对于统计结果的分析,有赖于对事物作深入地观察和了解,决不能凭表面的数据就轻易的下结论。3、单变量的统计描述:(1)变量的分布:<1>频次分布:就是变量的每一取值出现的次数。对于连续性变量,如定距变量,频次的计算必须分组进行。其中每组上限即下一组的下限,通常将下限包括在本组中,每组用组中值表示。<2>频率分布:用变量每个取值的频次数除以总个案数,他是一个相对指标,派出了样本规模的影响,因而可以用来比较不同的样本。一般频率分布使用比率的形式表示的。(2)统计图与统计表。<1>统计表就是以表格形式来表示变量的分布。在制作统计表时,如果有未回答或回答不符合要求
4、的情况,可以有两种处理方法:(A)仍以调查总数为基础计算频率,这时应加入一类:未详。(B)以有效回答为基数计算频率,这时应在表的下面、紧接着表的地方注明:未详****户。<2>统计图:是以图形表示变量的分布情况。统计图虽然不如统计表精确,但是更直观、生动、醒目。(A)圆瓣图:是用一个圆代表现象总体,每一瓣代表现象中的一类,其大小代表他在总体中所占的百分比频率。(B)条形图:多用于描述定类与定序变量的分布,他是以长条的高度表示变量不同取值的频率分布的,其中长条的宽度没有意义,一般均化成等宽长条。长条的排列可以使离散的,也可以使紧挨着的。(C)直方图:是由紧挨着的长条构成的
5、,与长条图不同的是,他的条的宽度是有意义的,实际上它不是用长条的高度而是用长条的面积表示频率的大小,长条的纵轴高度表示频率密度(频率密度=频率/组距),长条的宽度表示组距。直方图仅适用于定距变量。(D)折线图:是用直线连接直方图中条形顶端的中点而成的。当组距逐渐减小时,折线将逐渐变为平滑,趋向为曲线。(3)集中趋势分析:是从一组数据中抽象出的一个代表值,以代表现象的共性和一般水平。除可以说明某一社会现象在一定条件下数量的一般水平外;集中趋势还可以对不同空间的同类现象或同一现象在不同时间的状态进行比较;以及分析某些社会现象之间的依存关系。<1>众数(北大92<问>:试用分
6、布理论简述算术平均数、中位数和众数三者之间的关系):就是出现频率最高的变量值。众数可以适用于任何测量层次的变量,对于定类和定序变量,众数可直接从变量的频率分布中观察到;对于定距变量,如果变量是在第I组具有最高的频率密度,则用第I组的组中值表示变量的众数。<2>中位数:是将观察总数一分为二的变量值。若将数据从小到大顺序排列,则取值于(N+1)/2处的变量值。当N为偶数,由于(N+1)/2处无数值,取中间位置左右两数的平均值。对于经过分组的资料,中位数的位置则是通过计算累计百分比频率得到的。即首先计算出含有累积频率50%的区间,然后求出这个区间的上下限值(U、L)最后利用公
7、式计算中位数值。中位数一般用于描述定序及定序以上的测量尺度的变量的集中趋势。<3>平均数:仅适用于定距及定距以上变量,但有时也可用于定序变量。如求平均等级。对于分组值,一般用组中值来代替变量值,然后加权平均计算平均数。需要指出的是,用组中值计算的加权平均数知是用原始数据计算的平均数的近似值。由于分组是人为的,所以在变量分布不均匀的情况下,不同的分组会有不同的结果。<4>分布与三值的关系:正态分布时,三值重合;偏态分布中,三值不重合,在正偏态时,由于左边频次密集,这使得中位数偏向左方,但由于右侧的变量取值大,故平均数叫中位数偏右,即平均数>
此文档下载收益归作者所有