数据分析 数据分析的预备知识

数据分析 数据分析的预备知识

ID:38366545

大小:22.97 KB

页数:4页

时间:2019-06-11

数据分析 数据分析的预备知识_第1页
数据分析 数据分析的预备知识_第2页
数据分析 数据分析的预备知识_第3页
数据分析 数据分析的预备知识_第4页
资源描述:

《数据分析 数据分析的预备知识》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、数据分析数据分析的预备知识1、数据编码①采用计算机进行数据分析,必须对采集的数据进行编码(数值化):●例:教师情况调查数据    工龄  性别年龄科目工资受教育等级男28语文 3390  15中等女37数学1050016优等女50数学3075012良等..............男25数学230012差等●设计编码表(变量值代码或值标记)性别        男(1) 女(0)科目    语(1) 数(0)评价等级优(1) 良(2) 中(3) 差(4)●根据编码数值化资料:性别年龄科目工龄工资受教育等级128133121530372104001610

2、50230600122122112401541431254801230321184401811572307601641532306401220301532816112522240124 2、数据处理前的准备     ●确定变量名:       性别  SEX         工资 PAY       年龄   AGE       受教育年限  EDU      科目  SUB         评价等级   RAT          工龄 WORK ●对没有按规范格式设计的问卷,也必须确定项目(变量)数,以及每个项目(变量)的最大字符数,并形成变量代

3、码表。 例:小学办学条件问卷调查(第16题)变量代码表     第16题:你校的合格教师数(合格教师是指学历达标且获得教师资格的教师) 正 式代 课总计男女男女 合格T1611T1612T1613T1614 不合格T1621T1622T1623T1624 总计     变量代码表(局部)题号变量名变量标记值域遗漏值值标记16T1611正式男教师0-9899  T1612正式女教师0-9899  T1613代课男教师0-9899 3、数据录入与数据清理 ●人工清理●用软件方法清理(剔出值域范围外的数值) (二)测量及变量分类 1、测量:依据法则为事件

4、(社会科学)或物体(自然科学)指派数字。测量尺度:进行测量活动的标准物,又称“量尺”或“量表”。按不同的水平分为:类别尺度、顺序尺度和等距尺度。2、变量分类依据测量尺度,在社会科学研究中一般将变量分为定类变量、定序变量和定距变量三大类(此外,还有所谓“定比变量”,社会科学研究不作区分)。分   类定  义举   例数学特征定类变量(名义变量)按照对象的某种特征划分类别性别科目 =、≠定序变量(有序变量)按照对象的某种特征,把类别按顺序、等级排列 评价等级 >、< 定距变量(刻度变量)对象不仅可按特征排序,而且还可以测量序列间的距离 年龄、工龄、工资

5、 +、—三种变量有层次之分:定距>定序>定类,高类可转化为低类,反之不可。 不同的变量类型必须采用不同的定量分析方法。 3、测量误差: 系统误差(效度) 随机误差(信度)(三)统计分析及其分类1、统计2、分类:描述统计与推断统计 (四)描述统计1、描述样本分布①    分布②    描述分布的基本方法:定类、定序、定距③    描述分布的定位:集中趋势测量(集中量数)④    描述分布的离散性:离散趋势测量(差异量数)⑤    描述分布的形态⑥    标准分(Z分数)2、变量间关系的描述①    相关分析②    回归分析 (五)推断统计1、基本概

6、念:统计量、参数与推断统计2、参数估计:点估计与区间估计3、假设检验的基本思路     (1)参数检验(定距变量)t检验:同体比较与配对比较F检验(方差分析)    (2)非参数检验(定序或定类变量)  Χ2检验     (3)对相关系数的检验

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。