欢迎来到天天文库
浏览记录
ID:37737254
大小:1.82 MB
页数:58页
时间:2019-05-30
《厦门大学《应用多元统计分析》第08章_相应分析》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库。
1、第八章相应分析第一节引言第二节列联表第三节相应分析的基本理论第四节相应分析中应注意的问题第五节实例分析与计算机实现第一节引言相应分析(correspondenceanalysis)也叫对应分析,其特点是它所研究的变量可以是定性的。通常意义下的相应分析,是指对两个定性变量(因素)的多种水平进行相应性研究,因而它的应用越来越广泛,现在这种方法已经成为常用的多元分析方法之一。在社会、经济以及其他领域中,进行数据分析时经常要处理因素与因素之间的关系,及因素内部各个水平之间的相互关系。例如,评价某一个行业所属企业的经济效益,我们不仅要研究因素A,即企业按照经济效益好坏的分类情况,以及要研究因
2、素B,即经济效益指标之间的关系,还要研究哪些企业与哪些经济效益指标更密切一些。这就需要相应分析的方法,将经济效益指标和企业状况放在一起进行分类、作图,以便更好的描述两者之间的关系,在经济意义上做出切合实际的解释。相应分析的思想首先由理查森(Richardson)和库德(Kuder)于1933年提出,后来法国统计学家让-保罗·贝内泽(Jean-PaulBenzécri)等人对该方法进行了详细的论述而使其得到了发展。为了把握相应分析方法的实质,本章将从列联资料入手,介绍一些基本概念和相应分析的基本理论,并让读者理解相应分析与独立性检验的关系,进一步明确对实际问题进行相应分析研究的必要性
3、所在。第二节列联表一列联表的概念二有关记号一、列联表的概念在实际中经常要了解两组或多组因素(或变量)之间的关系。设有两组因素A和B,其中因素A包含r个水平,即A1,A2,…,Ar;因素B包含c个水平,即B1,B2,…,Bc。又设有受制于这两个因素的载体(或客体)的集合总体¥。我们希望通过对总体¥关于这两组因素的有关资料(或抽样资料),来分析这两组因素的关系。例如,要考查在某个人群中关于吸烟或不吸烟(因素A)与得肺癌或不得肺癌(因素B)两组因素之间的关系。通常的作法是,随机地从该人群中抽样,对这两种因素进行调查,设调查了k个人,得到一个二维列联表,见表8.1。其中,kij为调查的k人
4、中出现因素A的第i个水平和因素B的第j个水平的人数。这样,我们就得到一个两因素,即吸烟与是否得肺癌的22列联表。表8.1二维列联表表8.2一般的二维列联表二、有关记号为了叙述方便,先引进一些基本概念和记号。设K=(kij)rc为一个rc的列联表(表8.2),称元素kij为原始频数。将列联表K转化为频率矩阵,记为F=(fij)rc,见表8.3。表8.3一般的二维频率表第三节相应分析的基本理论一原始资料的变换二基于矩阵的分析过程我们知道相应分析的主要目的是寻求列联表行因素A和列因素B的基本分析特征和它们的最优联立表示。为了实现行因素A与列因素B最优联立表示,进一步剖析行因素A内
5、部之间,列因素B内部之间,以及因素A和列因素B之间的关系,这里将介绍原始的列联资料K=(kij)rc变换成矩阵Z=(zij)rc的具体过程,这样使得zij对因素A和列因素B具有对等性,在此基础上进行相应分析。一、原始资料的变换二、基于矩阵的分析过程(8.14)式表明Zuj为相对于特征值λj的关于因素A各水平构成的协差阵∑r的特征向量。这样我们就建立了相应分析中R型因子分析和Q型因子分析的关系。也就是说,我们可以从R型因子分析出发而直接得到Q型因子分析的结果。这里需要强调的是,由于∑r和∑c有相同的特征根,而这些特征根又表示各个公共因子所提供的方差。那么,在因素B的c维空间Rc中
6、的第一公共因子,第二公共因子直到第m个公共因子与因素A的r维空间Rr中相对于的各个主因子在总方差中所占的百分比就完全相同。这样就可以用相同的因子轴同时描述两个因素各个水平的情况,把两个因素的各个水平的状况同时反映到具有相同坐标轴的因子平面上。一般情形,我们取两个公共因子,这样就可以在一张二维平面图上绘出两个因素各个水平的情况,即可以直观地描述两个因素A和因素B以及各个水平之间的相关关系。第四节相应分析中应注意的问题我们知道相应分析是分析两组或多组变量之间关系的有效方法,在离散情况下,它是从资料出发通过建立因素间的二维或多维列联表来对数据进行分析。在此我们要问,这种分析是否有意义,或
7、者说对于所给的数据是否值得做这种相应分析。这一节我们将介绍相应分析与独立性检验的内在关系,以此说明应用相应分析方法在解决实际问题时,避免盲目性。第五节实例分析与计算机实现一利用SPSS进行相应分析——实例1二利用SPSS进行相应分析——实例2一、利用SPSS进行相应分析——实例1数据来自SPSS软件自带数据集voter.sav,为1992年美国大选的部分数据。要求对选民的最高学历水平(degree)和所支持的总统候选人(pres92)进行相应分析。(一)操作步骤1.正
此文档下载收益归作者所有