欢迎来到天天文库
浏览记录
ID:38366545
大小:22.97 KB
页数:4页
时间:2019-06-11
《数据分析 数据分析的预备知识》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库。
1、数据分析数据分析的预备知识1、数据编码①采用计算机进行数据分析,必须对采集的数据进行编码(数值化):●例:教师情况调查数据 工龄 性别年龄科目工资受教育等级男28语文 3390 15中等女37数学1050016优等女50数学3075012良等..............男25数学230012差等●设计编码表(变量值代码或值标记)性别 男(1) 女(0)科目 语(1) 数(0)评价等级优(1) 良(2) 中(3) 差(4)●根据编码数值化资料:性别年龄科目工龄工资受教育等级128133121530372104001610
2、50230600122122112401541431254801230321184401811572307601641532306401220301532816112522240124 2、数据处理前的准备 ●确定变量名: 性别 SEX 工资 PAY 年龄 AGE 受教育年限 EDU 科目 SUB 评价等级 RAT 工龄 WORK ●对没有按规范格式设计的问卷,也必须确定项目(变量)数,以及每个项目(变量)的最大字符数,并形成变量代
3、码表。 例:小学办学条件问卷调查(第16题)变量代码表 第16题:你校的合格教师数(合格教师是指学历达标且获得教师资格的教师) 正 式代 课总计男女男女 合格T1611T1612T1613T1614 不合格T1621T1622T1623T1624 总计 变量代码表(局部)题号变量名变量标记值域遗漏值值标记16T1611正式男教师0-9899 T1612正式女教师0-9899 T1613代课男教师0-9899 3、数据录入与数据清理 ●人工清理●用软件方法清理(剔出值域范围外的数值) (二)测量及变量分类 1、测量:依据法则为事件
4、(社会科学)或物体(自然科学)指派数字。测量尺度:进行测量活动的标准物,又称“量尺”或“量表”。按不同的水平分为:类别尺度、顺序尺度和等距尺度。2、变量分类依据测量尺度,在社会科学研究中一般将变量分为定类变量、定序变量和定距变量三大类(此外,还有所谓“定比变量”,社会科学研究不作区分)。分 类定 义举 例数学特征定类变量(名义变量)按照对象的某种特征划分类别性别科目 =、≠定序变量(有序变量)按照对象的某种特征,把类别按顺序、等级排列 评价等级 >、< 定距变量(刻度变量)对象不仅可按特征排序,而且还可以测量序列间的距离 年龄、工龄、工资
5、 +、—三种变量有层次之分:定距>定序>定类,高类可转化为低类,反之不可。 不同的变量类型必须采用不同的定量分析方法。 3、测量误差: 系统误差(效度) 随机误差(信度)(三)统计分析及其分类1、统计2、分类:描述统计与推断统计 (四)描述统计1、描述样本分布① 分布② 描述分布的基本方法:定类、定序、定距③ 描述分布的定位:集中趋势测量(集中量数)④ 描述分布的离散性:离散趋势测量(差异量数)⑤ 描述分布的形态⑥ 标准分(Z分数)2、变量间关系的描述① 相关分析② 回归分析 (五)推断统计1、基本概
6、念:统计量、参数与推断统计2、参数估计:点估计与区间估计3、假设检验的基本思路 (1)参数检验(定距变量)t检验:同体比较与配对比较F检验(方差分析) (2)非参数检验(定序或定类变量) Χ2检验 (3)对相关系数的检验
此文档下载收益归作者所有