欢迎来到天天文库
浏览记录
ID:36508054
大小:42.00 KB
页数:16页
时间:2019-05-11
《潜在类别模型及数据模拟分析》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库。
1、潜在类别模型及数据模拟分析作者:郭小玲裴磊磊张岩波【摘要】目的:介绍潜在类别模型的原理、方法及其分析过程,为医学模式转变所带来的病因关系的复杂性及其对统计分析方法的改进所提出的要求提供理论依据。方法:利用Mplus软件MonteCarlosimulationstudy模块,按照预先设定的模型产生模拟数据并赋予一定的含义,然后导入Mplus软件直接进行潜在类别分析及多样本分析比较,用图示直观地表现模型参数变化。结果:单样本潜在类别分析显示模型M1中潜在类别2作用大于潜在类别1的作用;模型M2中潜在类别1的作用明显大于潜在类别2的作用。多
2、样本潜在类别分析结果显示所有观察值区分为两类,模型M1与模型M2之间潜在类别具有差异性。讨论:潜在类别分析是描述一组分类变量间相互关系所形成的数学模型,综合了结构方程模型与对数线性模型的思想,可以做探索性研究,也可用于验证性研究,拓展了潜变量模型的应用范围。【关键词】潜在类别概率;条件概率;潜在聚类分析16在量化研究中有许多情况研究的数据是分类数据,例如社会学研究中测量社会经济地位的职业、教育水平、收入等指标,中医学中描述疾病症候的各种征象等。相应的潜变量也可以是分类变量,此时需采用基于分类潜变量构造的潜在类别模型。潜在类别模型综合了
3、结构方程模型与对数线性模型的思想,形成了自身的优势,其目的在于以最少的潜在类别数目来解释显变量之间的关联,来达到局部独立性。潜在类别模型的提出弥补了结构方程模型仅能处理连续潜变量的不足,尤其重要的是分类潜变量的引入提高了分类变量的分析价值,使得研究者能够透过概率更加深入地了解分类变量背后的潜在影响因素。 1潜在类别模型的基本原理 潜在类别模型又称潜类模型(latentclassmodel,LCM),是建立在概率分布原理与对数线性模型基础之上,引入因子分析与结构方程模型的思想而形成的。因此,掌握结构方程模型与对数线性模型有助于理解潜
4、在类别模型。潜在类别模型分析过程包括模型参数化、参数估计、模型识别、拟合优度评价、潜在分类与结果解释等[1~4]。 1.1概率参数化 LCM的概率参数化(probabilisticparameterization)包括两种类型的分类变量:观察变量或显变量(observedvariable,manifestvariable)和非观察变量或潜变量(latentvariable);两种类型的参数:潜在类别概率(latentclass16probabilities)和条件概率(conditionalprobabilities)。LCM假定
5、任意两个观测变量之间的关系可以由潜变量解释。现假定A、B、C、D为四个显变量(或条目),潜在类别模型可以表达为: πABCDXijklt=πXtπA
6、XitπB
7、XjtπC
8、XktπD
9、Xlt(1) 式(1)包含潜在类别概率(πXt)和反映潜在类别对各显变量影响大小的四个条件概率(πA
10、Xit、πB
11、Xjt、πC
12、Xkt、πD
13、Xlt)。在式(1)中,潜在类别概率πXt表示当观察变量局部独立时,潜变量X在第t个水平的概率,即从样本中随机选取的观察对象属于潜在类别t的概率,各潜在类别的概率总和为1,tπXt=1。条件概率,如πA
14、
15、Xit,表示属于潜在类别t的个体对观察变量A的水平i作出反应的概率。根据概率和条件概率的性质,有如下条件成立: iπA
16、Xit=jπB
17、Xjt=kπC
18、Xkt=lπD
19、Xlt=1.0 1.2模型估计与模型识别 提出假定模型后,接下来的重要工作就是求出模型中参数的终解(finalsolution)和参数估计时的识别问题。在潜在类别模型中常用的参数估计方法有EM(expectationmaximization)算法和NR(Newton16Raphson)算法。如果模型中的参数要顺利求出一组最佳解,那么参数数目必须小于自由
20、度。如果自由度小于0,将造成模型不能识别的问题,无法运用EM算法与NR算法进行迭代求解。相反自由度大于0也不一定能让模型具有可识别性。Goodman(1974)提出了一个局部识别(localidentifiability)原则,利用偏导矩阵(partialderivativematrix)来判断模型是否可以得到有意义的解。遇到模型无法识别的情况,可以限定部分参数,减少待估参数数目,提高模型估计的识别性。 1.3模型评价与潜在分类 模型评价的主要工作就是找出既简洁,具有最少的参数,又具有较好拟合优度的模型,其中4种指标Pearson
21、χ2、似然比χ2、Akaike信息准则(AIC)、Baysian信息准则(BIC)已经得到广泛使用。在确定模型后,最后要将各组观察值分类到适当的潜在类别当中,来说明观察值的后验类别属性(posteriormembersh
此文档下载收益归作者所有