第02讲 数据录入与数据管理.ppt

第02讲 数据录入与数据管理.ppt

ID:61748344

大小:1.18 MB

页数:32页

时间:2020-02-06

第02讲 数据录入与数据管理.ppt_第1页
第02讲 数据录入与数据管理.ppt_第2页
第02讲 数据录入与数据管理.ppt_第3页
第02讲 数据录入与数据管理.ppt_第4页
第02讲 数据录入与数据管理.ppt_第5页
资源描述:

《第02讲 数据录入与数据管理.ppt》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库

1、Lesson2数据录入与数据获取*如何将数据录入SPSS中*如何将其他格式的数据读入SPSS中可从报纸、电视、互联网、年鉴等方面看到各种数据,并且从这些数据可以提取对自己有用的信息。一.数据是怎样得到的?这些间接得到的(并非自己收集的)数据都是二手数据。获得第一手数据要困难得多某些在华的外资企业每年至少花三四千万元来收集和分析数据他们如同间谍,收集各种情报他们很舍得在这方面花钱。因为市场信息数据是企业生存所必需的,绝不是可有可无的。在自然的未被控制的条件下观测到的数据,称为观测数据(observationaldata)。在

2、人工干预和操作情况下收集的数据就称为试验数据(experimentaldata)。同学们自己可以举出大量的观测数据和试验数据的例子二.收集数据时的误差一勺八宝粥中的成分比例和整锅不尽相同,可能稍微多些或稍微少些。这是很正常的,因为样本的特征不一定和总体完全一样这种差异不是错误,而是必然会出现的抽样误差(samplingerror)。抽样调查中,人们因为种种原因没有对调查做出反映,这种误差称为未响应误差(nonresponseerror)。和抽样误差不一样,未响应误差和响应误差都会影响对真实世界的了解应该在设计调查方案时和进

3、行调查过程中尽量避免一些人因为各种原因回答时并没有真实反映他们的观点,这称为响应误差(responseerror)。统计工作的操守准则统计工作的操守准则三.数据录入基本原则1.不同观察对象的数据不能在同一条记录中出现,即同一观测数据应独占一行2.每一个测量指标/影响因素只能占据一列的位置,即同一个指标的测量数值都应当录入到同一个变量中去3.最终的数据集应当能够包含原始数据的所有信息注:有时可以出现违反这些原则的例外情况,如重复测量数据四.数据的直接录入数据录入三部曲{定义变量名指定变量各种属性录入数据{变量类型测量尺度变量

4、名与变量值标签缺失值其他1.变量类型(Type)◆数值型应用最为广泛,分为标准数值型(Nnmeric)、逗号数值型(Comma)、圆点数值型(Dot)、科学计数法型(ScientificNotation)、美元数值型(Dollar)、用户自定义型(CustomCurrency)。◆字符型(String)区分大小写字母,不能进行数学运算,所以分析、整理都较困难。◆日期型(Data)实际上是特殊的数值型变量,用来表示日期或时间。2.数据变量的测度(Measurement)◆定类尺度(NominalMeasurement)又称无

5、序分变量。其观测值既无大小之分,又无等级或次序之分,仅是按某种属性对其进行分类。像:性别、部门单位或国家地区等。数据可以是数值型及字符型。但不能进行加、减、乘、除等数学运算。这类变量是测度最低的变量。◆定序尺度(OrdinalMeasurement)又称有序分变量。其观测值尽管大小没有特定意义,但属于顺序计量类型,适合于按照顺序排列的变量。像:名次、级别、职务等变量。观测值彼此之间的次序是有一定意义的,打乱定义将产生错误。数据可以是数值型及字符型。但同样也是不能进行加、减、乘、除等数学运算的。◆定距尺度(IntervalM

6、easurement)区间变量。其观测值具有等级和次序之分。即观测值的大小和次序具有可比性,可以反映观测值之间的大小差异。但该类变量的观测值是在特定区间上有意义,超出该区间将没有意义。只可以用数值型变量表示。可进行加减运算。◆定比尺度(ScaleMeasurement)比例变量。按照一定间隔、比例计量数据的变量类型。如:长度、质量、重量等变量,其观测值“零”也是有定义的。观测值之间可以进行加、减、乘、除的四则运算。数值型变量。定距尺度与定比变量在绝大多数统计分析中无本质区别,在SPSS中合称为Scale,又称为连续型变量上

7、述四种测度的变量分别表示了不同的测量等级,等级高的应用范围广泛,等级低的应用范围受局限。测度低对事物属性的描述就是定性的,即只能研究到事物的某些属性的存在和分布情况,不能研究到事物属性的量化程度。测度高对事物属性的描述既可以是定性的,也可以是定量的。由于定类变量和定序变量的测度低,属于定性描述的变量。定距变量和定比变量测度高,属于定量描述的变量。定性描述通常仅分析到数据的频数、频率以及不同分布情况,还可以作为分组变量讨论其他变量的描述统计量。而定量描述则不仅可以分析其平均值、方差等分布参数,而且可以对不同的分组做比较性研究

8、和更高级的研究。8/2/20213.变量名与变量值标签用于对变量及变量值含义进行说明,使结果更易读懂。用Label项定义变量名标签,对变量名的含义进一步说明,用Values项定义变量值标签。4.缺失值(Missing)用于定义变量缺失值,SPSS中有系统默认缺失值与用户自定义缺失值两大类。除非问卷中有特

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。