欢迎来到天天文库
浏览记录
ID:59466229
大小:285.50 KB
页数:42页
时间:2020-09-14
《调查资料的处理与分析ppt课件.ppt》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库。
1、调查资料的处理与分析第一节调查资料的处理一、资料的审核调查资料审核是指对资料的准确性、时效性、全面性和系统性进行审核。任务:对市场调研资料进行的筛选,剔除无价值资料。1.原始资料的审核⑴对缺失值的处理①利用一个样本统计量的值去代替缺失值。通常使用样本变量的平均值。②利用从一个统计模型计算出来的值去代替缺失值。③将有缺失值的个案整个删除。④将有缺失值的个案保留,仅在相应的分析中作必要的排除。⑵对明显错误答案的处理多数情况以“不详值”对待。⑶对被调查者缺乏兴趣回答答案的处理①个别问卷作为废卷处理。②如果数目较多,且集中于某个或少数几个
2、问题,作特殊编码处理。2.二手资料的审核⑴对文献资料的审核:客观性,真实性和时效性。⑵对引用统计资料的审核:指标口径和资料分组问题。二、调查资料的整理1.分组⑴分组及其原则分组是根据调查目的和所研究现象的本质特征,将现象按照一定的标志分成不同的组别。分组原则:①根据调查的目的来选择分组标志②选择最终能反映事物本质特征的标志③根据经济发展变化及历史条件选择分组标志⑵分组的作用①划分市场现象的类型②表明市场现象的内部结构③反映现象间的依存关系⑶分组标准与方法标准:①按品质标志分组是指按事物的特征进行分组。②按数量标志分组是指按事物量的特
3、征进行分组。方法:①简单分组②复合分组2.编码编码是将原始资料转化为易被计算机判读的数字规则,即用不同的数字代表不同的回答或资料。⑴编码的原则①与分类相适应原则②系统化原则③预留足够位置原则④标准化原则⑤兼容性和通用性原则⑵编码的类型①事前编码②事后编码3.汇总汇总是指按照调查的目的和要求,对分组后的调查资料、数据进行计算汇总和编辑,使之成为能系统、完整、集中、简明地反映调查对象客观情况的材料。任务:⑴按分组特征将总体各单位分别归类;⑵将总体单位的数量标志值分组汇总。方式:⑴手工汇总技术⑵计算机汇总第二节变量序列及其编制一、
4、变量序列及其种类1.变量序列的概念变量序列是按照某种数量特征对总体进行分组,将分组后所形成的变量值按大小顺序排列所得到的序列。构成要素:①按分组变量进行分组所形成的各组变量值(x);②总体单位在各变量组的分布次数(f);③频率:各组总体单位分布次数占总体单位总数比重(W)。调查对象按月收入分组所得变量序列2.变量序列的种类⑴单值序列:各分组变量都是一个具体的变量值。适合于变量变异幅度不大、变量值数目有限的情况。⑵组距序列:各组变量是由两个变量值所限定的一个变动区间,且这个变动区域涵盖了其区间内的所有总体单位数。组距序列分为等距序列和不等
5、距序列二、组距序列的编制1.确定变量的类型:⑴离散型变量:变量个数少、变动幅度不大,可编制单值序列;变量个数较多,变动幅度较大,应编制组距序列。⑵连续型变量:只能编制组距序列。2.确定组数和组距:⑴组数是指组距序列中分组的个数。组数的确定应以明确显示总体分布趋势为原则。数量标志变异范围越大,组数就应越多,反之就越少。⑵组距是每组变量的上限与下限之差。⑶确定组限和组中值①组限:位于各组组距两端的数值。A最小值为组的下限,最大值为组的上限B离散型变量采用顺序两个变量作为相邻织的上限和下限C连续型变量用一个数值作为两个相临组的上限和下
6、限D遵循“上限不在内”的原则。②组中值:各组变量范围的中间数值,代表各组变量值的一般水平。组中值=(上限+下限)/2开口组组中值的确定:缺上限的开口组组中值=下限+邻组组距/2缺下限的开口组组中值=上限-邻组组距/2三、累积次数与累积频率1.向上累计(以下累计或称较小制累计)将各组频数和比率,由变量值低的组向变量值高的组逐组累计。组距序列中的向上累计,表明各组上限以下总共所包含的总体频数和比率有多少。2.向下累计(以上累计或称较大制累计)将各组频数和比率,由变量值高的组向变量值低的组逐组累计。组距序列中的向下累计,表明各组下限以上
7、总共所包含的总体频数和比率有多少。家庭收入基本状况累积表某地区30户居民人均月收入基本情况表第三节交叉列表技术一、双向交叉列表双向交叉列表是指将两个或两个以上有一定联系的变量及其变量值按照一定的顺序交叉排列在一张统计表内,使各变量值成为不同变量的结点,从中分析变量之间相关关系的一种数据分析技术。年收入水平和受教育程度相关关系表二、三向交叉列表三向交叉列表是在双向交叉列表的基础上,加入第三个变量作进一步分析的方法。编制步骤:①选中一个变量,将其值稳定在各种变量值中的一个值上,②将另一个自变量和因变量作双向交叉分组;③将第一个变量稳定在其下
8、一个变量值上,作另外两个变量的交叉列表,类推,直到第一个变量的所有变量值被一一列举完毕。某药品主要品牌的人群分布情况表三、交叉列表分析变量的选择和确定第四节统计图的
此文档下载收益归作者所有