欢迎来到天天文库
浏览记录
ID:39282720
大小:653.95 KB
页数:18页
时间:2019-06-29
《第四讲 定序回归》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库。
1、王存同回归分析在社会科学中的应用第四讲定序回归模型第一节定序回归模型(OLM)简介在社会科学研究的分类变量或离散变量中,一些变量在测量层次上被分为相对次序(或有自然的排序)的不同类别,但并不连续,这类变量称之为定序变量(ordinalvariable)或序次分类(简称为次序)变量(orderedcategoricalvariable),其对应的数据称之为排序数据(ordereddata)。一般来说,定序变量假定用数值型取值(numericalvalues)来代表某一特定属性的次序。但这些排序并不一定反映某一实质尺度上的实际大
2、小(actualmagnitudes)。即定序变量的相邻类别之间的距离未必就是其分布的不同部分之间的距离,也就是说类别间的距离并不绝对相等。定序变量在下述意义上可被看作介于定类变量与连续变量之间:定序变量在考虑相邻取值的不同距离方面比连续变量更具有一般性,而在包含序次信息方面则比定类变量更为严格。典型的例子包括李克特量表(Likertscale),对态度问题的回答选项分为坚决反对、反对、中立、赞成与坚决赞成等类别。序次变量的例子还包括对上学年限的离散测量(不到8年、8-11年、12年与13年及13年以上)(Winship&M
3、are,1984)与老年伴侣之间财产分割(propertydivision)情况(未分割、部分分割、全部分割)、或职业声望、阶层高低、政治态度、满意度(很满意、满意、不满意、很不满意)等。通过这类变量,我们可以知道不同类别之间有相对的大小或高低程度,但是无法从经验信息中获得不同类别之间明确而连续的距离。范例:问题:你觉得自己幸福吗?选项:1.很不幸福2.不太幸福3.还过得去4.有点幸福5.非常幸福问题:你的英语程度如何?选项:1.完全不会2.会一点3.好4.非常好感谢香港科技大学吴晓刚教授与密西根大学谢宇教授的课件支持。1王
4、存同回归分析在社会科学中的应用当我们对上述种类及序次进行赋值时,往往使用整数赋值法,该方法指定一些整数来体现序次。一般来说,数值越大,表示同意或行为的容忍程度越高。这种赋值法的背后隐含的关健假定是:相邻类别之间的距离完全相等。但研究者并不能清醒意识到这种假定的存在并对其保持敏感的态度,只是为了方便性的考虑。事实上,这种假定在实际测量中往往不能被满足,若对上述定序变量继续使用多分类logit模型(MNL),将无视数据内在的排序,会导致排序信息的缺失,从而使统计结果会因为遗漏掉排序信息而丧失统计效率;若使用OLS,则是将定序变量
5、视为连续变量处理,会导致人为的信息膨胀。同时,使用不当回归,回归偏倚问题及一致性问题无法解决。因此,针对定序因变量(ordinaldependentvariable)需采用对应的模型,即定序logit/probit模型(orderedlogit/probitmodel,OLM)。反之,若针对定类(nominal)变量采用定序回归,则意味着对不同类别强加了不适当的顺序,并假设其斜率彼此平行,此时的统计结果会存在偏误或出现无意义的估计值。不过,从本质上而言,定序logit/probit模型也是二分类logit/probit模型的
6、一种自然延伸运用,该种模型也被称为累积(cumulative)logit/probit模型。若假设随机扰动项符合logistic分布,则采用logit模型;若假设随机扰动项符合正态分布,则采用probit模型。需要特别说明的是,定序变量基本上是属于分类的,将结果处理成序次的而不是定类的是研究者必须根据研究目的而做的审慎选择。有时,某一既定结果既可以处理成定序变量,也可以将定序变量处理成定类变量,但会有信息不同程度的损失。若研究者的基本关注点在于结果上的差异和自变量对这些差异的影响,那么是可以采用多分类logit模型对定量变量
7、进行回归的,但估计精度上会有所差异;若研究者的基本关注点在于理解解释变量如何影响由定序变量所反映的概念维度(conceptualdimension),则选择定序变量模型较为适宜。当然,在某种特定情况下,定序因变量在某一特定条件下也可以勉强作为连续变量来处理,但并不建议如此处理。感谢香港科技大学吴晓刚教授与密西根大学谢宇教授的课件支持。2王存同回归分析在社会科学中的应用第二节定序(累积)logit模型一、定序(累积)logit模型(cumulativelogitmodel)原理假设我们有一个由J类别组成的定序因变量Y(Y=1,
8、…,J),令LXjjlogitFX,j1,J1logPYj
9、X/PYj
10、XlogPYj
11、X/1PYj
12、X其中,FX]PYj
13、X是J类别的累积概率函数(c.d.f.)。j若Y独立于X,则:LXjj
此文档下载收益归作者所有