欢迎来到天天文库
浏览记录
ID:37120023
大小:306.19 KB
页数:10页
时间:2019-05-18
《相应分析及其在多种疾病聚集性分析中的应用》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库。
1、中国卫生统计990219中国卫生统计CHINESEJOURNALOFHEALTHSTATISTICS1999年 第16卷 第2期 Vol.16 No.2 1999相应分析及其在多种疾病聚集性分析中的应用*陈峰 杨树勤 相应分析(correspondenceanalysis),又称对应分析,由法国数学家JP.Beozecri在1970年首次提出〔1〕,主要用于分析二维数据阵中行因素和列因素间的关系。传统的因子分析只能对数据阵单独进行R-型(列因素)或Q-型(行因素)因子分析(factoranalysis),不能同时对行因素和列因素进行分析。这就将行因素与列因素隔裂开来
2、了,从而遗漏了许多有用的信息。事实上,有时行因素与列因素是不可分割的。比如在研究不同地区,不同种类的出生缺陷发生率时,我们既关心不同种类出生缺陷间的关系,不同地区间的关系,又想了解出生缺陷与地区间的关系。此时需要对出生缺陷(列因素)和地区(行因素)同时进行因子分析,相应分析揭示了内在联系〔2〕。 在JP.Beozecri提出相应分析之初,该法并未引起学界的关注,直到1974年MO.Hill在AppliedStatistics杂志上以《相应分析——一种被忽视的多元分析方法》为题,再度介绍了该法及其优点之后才引起人们的兴趣。相应分析在医学上的应用也是成功的,如Hill(
3、1982)对5 387名中学生眼睛和头发的颜色的分析〔3〕;Greenacre(1984)对Israeli成年人关注的社会问题的分析〔4〕;Greenacre(1984)对止痛药的分类问题的分析〔5〕;Micciolo等(1985)用于复发性酒精胰腺炎手术的危险因素的分析〔6〕;Leclerc等(1988)用于医务人员的职业特点与健康状况关系的分析〔7〕等等,均取得较好的效果。 本文旨在介绍这一方法的基本思想,以及对结果的解释。基本思想 相应分析的基本思想是对数据阵进行适当的变换,使变换后的数据对行与对列是相对应的,从而可以同时对行和对列进行分析,以发现行列因素间
4、的关系。设有n×m的数据阵X={xij},行列分别表示两个不同因素的n个水平和m个水平。首先定义分布轮廓的概念。 各行在列变量上的分布(构成比)称为该行的分布轮廓(profile)或形象,即第i行的分布轮廓为:file:///E
5、/qk/zgwstj/zgws99/zgws9902/990219.htm(第1/9页)2010-3-2316:54:20中国卫生统计990219其和为1(或100%)。其中,xi.为第i行的合计。 对应地,第j列的分布轮廓为:其和亦为1(或100%)。其中,x.j为第j列的合计。 相应分析之目的是从数据阵中概括出行列因素的最基本的分布
6、特征,使之反映数据阵的主要信息,寻找行、列因素间的关系。 为同时对行和对列进行分析,首先对数据阵进行如下变换:(1) 再对变换后的数据阵Z进行R-型和Q-型因子分析。进行R-型因子分析是从矩阵Am×m=Z′Z出发,求其特征根和特征向量;进行Q-型因子分析是从矩阵Bn×n=ZZ′出发,求其特征根和特征向量。 由于矩阵Z′Z和ZZ′具有相同的非零特征根,且对同一特征根λ,如Φ是Z′Z的特征向量,则Ψ=ZΦ是ZZ′的特征向量。A与B的这种对应关系,使得变换后的数据对行与对列是对等的,从而可以将行因素和列因素相提并论。 将A的第1因子和第2因子绘在因子负荷图上可以进行
7、R-型因子分析;将B的第1因子和第2因子绘在因子负荷图上可以进行Q-型因子分析。又由于A和B的特征根相同,故相应的因子贡献率亦相同,因而可以将两者对应起来进行分析,即将A的第1因子和第2因子及B的第1因子和第2因子同时绘在同一坐标轴上,则可揭示行因素的不同水平及列因素的不同水平间的关系。 可见,变换是相应分析的关键所在。而其余的分析与因子分析类似,只是在因子的解释上,既可以对行因素及列因素单独进行分析,又可以同时进行分析。这是相应分析的优点。基本步骤 下面先从一个构想的例子来说明相应分析的计算步骤及结果的解释。 构想的例子:这个例子包含了5行4列,数据见表1。表
8、1 构想的数据y1y2y3y4合计file:///E
9、/qk/zgwstj/zgws99/zgws9902/990219.htm(第2/9页)2010-3-2316:54:20中国卫生统计990219x150202010100x2100404020200x3306060150300x4100100100100400x5140110110140500合计4203303304201500 其行轮廓和列轮廓分别为: 行轮廓(%): x1:50.0 20.0 20.0 10.0 x2:50.0 20.0 20.0 10.0 x3:10.
此文档下载收益归作者所有