欢迎来到天天文库
浏览记录
ID:37648024
大小:5.01 MB
页数:60页
时间:2019-05-27
《属性(定性)数据分析_SPSS应用方法(第一部分)》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库。
1、研究方法II第一章:数据的描述郑明郁文珍惜您的数据统计学是研究怎样去有效地收集、整理信息技术的发展使企业的各级管理人员都和分析带有随机性的数据,以对所考察面临巨大数量的数据的问题做出推断或预测,直至为采取一定的决策和行动提供依据和建议。现代化的管理离不开科学地积累和利用企业内外的各项数据理解统计学,了解统计基本概念、基本方法;了解和充分利用您的数据是企业管理水平的重要标志熟悉统计语言;并知道如何评价统计结果。利用您的数据就是要分析您的数据,将数据中的信息变成有用的知识,为决策支持服务1《纽约时报》(2009年8月6日)明确数据分析的目的统计是未来10年最炙手可热(
2、性一项数据分析任务在计划阶段就要明确以下几方面:感)的专业,即每10个工作岗位中9个岗位需要统计。分析的目的明确对象(总体)——Google的高管确定数据的由来,是否要抽样,要记录哪些指标采用的分析方法AFailedSurveyExample:1936U.S.presidentialelection,AlfLandonvsFranklinRoosevelt观测数据和实验数据•October1936,LiteraryDigestconductedlargestpollinhistory(10millionvoters).数据收集有两种主要的方法:观测数据(Observat
3、ionaldata):仅凭观•TheypredictedthatLandonwouldwinby4:3inshareofpopularvote.测而非通过操作或控制事物所得到的数据。例环境的数据,民意测验数据和证•Onemonthlater,Rooseveltwasre-electedwiththelargestmajorityinU.S.history.券交易的数据•Themagazinewentbankruptsoonafter.实验数据(Experimentaldata):在实验中控制实验对象而收集到的变量的数据。如:Whathappened?新药试验中各阶段的临床实验数
4、据2分析的对象—数据表分析的对象—数据表在一项研究中,数据被收集后(不管是实通常企业的数据往往存放在不同的数据验或观测的),由于它记录了许多对象的表中(尤其是记录日常运行的数据)。这各种属性,通常以表格的形式存放。时为了进行分析就必须将不同表中有用每一行表示一个个体(对象,观测)的数据拼接到新的一张表中。这项工作每一列表示一个变量(属性,指标)是必须的。而且往往需要花费很多精力。发现和剔除例外数据数据的缺失值在数据分析开始之前和过程中,发现(或剔除)在数据的收集过程中,有时无法得到关心例外数据(Outlier)是保证数据分析质量的重要对象的所有项目的记录。这时在汇总数环节。
5、据表中某些记录的字段无法填入。通常例外数据是指个别观测有别于其它多数数据其用某些特殊符号表示。也称它们为缺失取值特别的大或特别小值(missingvalue)。在数据处理和分析中分析的不同阶段可能发现不同的例外数据给以特殊的处理。例外数据需认真对待:记录错误的要剔除,有的例外数据正是改进分析方法的依据3变量的类型变量的类型数据表中各变量由其记录的形式来看可粗分为变量按其含义来看可作如下分类:数值的(价格)和字符的(行业)各变量连续的连续(区间)的由其表示的内容可分为定性的(地区)和定量的(Continuous)(Continuous(交易量)定量的{离散的或Interv
6、al)由其在分析中的作用又可分为区间型(interval)(Quantitative)和分类型(Categorical)(包括有序的(Ordinal)和(Discrete)名义型(nominal))有序的分类的区间型(Interval)—数量型(Metric)(连续型)定性的{(Ordinal)}(Categorical)有序的(Ordinal)—顺序型(Rank)(p.204)(Qualitative)名义的名义型(Nominal)—分类型(Categorical)(Nominal)13变量的类型—名义型变量的类型定量的:连续的(Continuous):取值充满区变量:饮料
7、的种类间。例产值、交易量、体重等离散的(Discrete):只取不多的几个数值。例年龄、事故次数、每周的第几个交易日等定性的:有序的(Ordinal):取值有自然的次序关系。例型号、疗效等名义的(Nominal):取值无自然的次序关系。变量的值之间无逻辑次序例性别、省份、品种等可按任何次序排序编码4变量的类型—有序型变量的类型—区间型变量:饮料杯的型号大变量:饮料的体积中小区间(连续)型变量的值有逻辑次序,且它们之间的距离也是有意义的有序变量的值有明确的逻辑次序,但各个值之间的
此文档下载收益归作者所有