欢迎来到天天文库
浏览记录
ID:38854332
大小:171.20 KB
页数:3页
时间:2019-06-20
《关于调查问卷中定性数据处理方法的探讨_魏捷》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库。
1、DOI:10.13546/j.cnki.tjyjc.2008.20.003理论新探关于调查问卷中定性数据处理方法的探讨魏捷(中南财经政法大学信息学院,武汉430072)摘要:调查问卷的答案中既有定性数据,又有定量数据。相对于定量数据的分析,定性数据的统计处理是难点。文章以某地区学生升学情况的问卷数据为例,对一些常用的定性数据的分析方法进行了探讨,同时列举了一些SAS的基本程序。关键词:问卷调查;关联性分析;LOGISTIC回归;SAS程序中图分类号:C811文献标识码:A文章编号:1002-6487(2008)20-0024-02为了便于进一步分析,在确定了数据的类型之后,须先1定
2、性数据类别的判定与数量化处理对数据进行基本分析。在此我们将主要以列联表分析为主,分析时以SAS作为工具软件。由以上所列的因素可以看出,问卷中定性数据的分析方法由数据的特点所决定,故定除COLLEGE以外,其它因素都是自变量,因而选用多变量交性数据的分析首先应该判定数据的类型。观察问卷中的定性叉表法来分析,主要程序如下所示:数据不难发现,有些数据的具体表现是无序的,有些数据的PROCFREQDATA=STUDENTPAGE;具体表现是有序的。无序的数据叫名义变量,它的变量值是TABLECOLLEGE*GENDER*GRADE*KEYSCH*几个没有次序之分的不同状态,例如,性别就是一
3、个名义变MEAGER;量,用“男”和“女”作为其取值。有序的数据叫有序变量,它的RUN:变量值是有严格次序的不同状态。例如,把产品按质量标准在一般情况下,在键入一长串由星号连接的变量时应谨分为:不合格品、合格品、优等品,有序变量的取值存在内在慎,因为这将会导致生成非常多的列联表。在PROCFREQ的顺序。如果选择的分析方法适用于该变量,那么该方法只语句中使用PAGE选顶,使每页尽可能多地输出几张表。另依赖变量值的顺序而与变量的数值无关。外使用“分析员应用”也可以很方便地生成多个变量的交叉为了使用定量分析的方法,须将定性数据人为地数量化表,只需在列联表分析主窗口中规定行变量和列变量,
4、以及处理。比如性别名义变量用数字“l”和“2”代表其取值,产品形成层的几个变量。质量有序变量用数字“1”、“2”、“3”代表其取值。注意:名义变采用以上方法对本问卷进行分析,得出基本结果如下:量和有序变量所赋的具体数字只是代表定性数据所处的状上大学的学生占33.5%,没上大学的占66.5%;毕业于重点中态,所赋数字的大小在数值上没有任何意义。如果选择的分学的学生有13.2%,毕业于其它中学的占86.8%;男生占析方法适合于该变量,那么该方法只依赖变量的类别而与变55%,女生占有45%;成绩低于80分的占18.3%,高于85分量的数值无关。的占38.4%,其余的占43.3%。在某地区
5、学生升学情况的调查中,调查对象主要为高中毕业生,共l000人,目的主要是了解影响高中毕业生继续进3定量分析方法的选择入大学学习的可能性因素。具体来说,在问卷中主要包括这几个变量:COLLEGE表示高中毕业生是否进入大学(1为进在确定了数据的类型与分布情况之后,就可以根据它们入,0为没进入);GENDER表示性别(1为男生,0为女生);的特征进行分析方法的选择。目前对定性数据进行统计处KEYSCH表示高中类型(1为重点中学,0为其它中学);理,比较流行的方法主要有:关联性的检验、关联性的度量、MEAGER表示各学生的高中平均分数与所有学生总平均分相对风险分析以及LOGISTIC回归。
6、它们各有自己的特色和数之间的离差。其中COLLEGE、GENDER、KEYSCH都是定分析的统计思想,为了便于使用,我们将对它们的工作机理性数据,是名义变量,而MEAGER则是连续型变量,是定量介绍如下。数据。3.1关联性的检验该检验的原假设H0:两个变量无关联,备择假设H1:两个2定性数据的描述变量有关联。统计上使用卡方统计量来对带有随机性的定性数据进行是否有关联性的检验。其公式如下:24统计与决策2008年第20期(总第272期)理论新探rQ1(n-nn)2(O-E)2来代替。χ2=Σiji++j=Σiji,j=1ni+n+j/nEiniPi(1-Pi)在实际使用中,还需要考虑
7、到一些特殊的情况,如L组其中Oi表示实际观测到的频数,Ei表示期望频数,当原实验结果中,有的r=0或ri=ni,那么Qi与Vi的计算都成了困假设成立时,Oi与Ei比较接近,其中大的卡方值是极端的情难,一般采用经验LOGISTIC变化对上述方法进行修正,即况。3.2关联性的度量①Qi=lnri-0.5;②Vi=(ni+1)(ni+2)ni-ri-0.5ni(ni-ri+1)(ri+1)用于检验的卡方统计量只提供了有无关联性的证据,它可以证明上述修正是较为合理的,原有的线
此文档下载收益归作者所有