资源描述:
《主成分分析中的统计检验问题.pdf》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库。
1、.4.统计教育2007年第9期主成分分析中的统计检验问题文/傅德印摘要:主成分分析已经越来越成为人们广泛应用的多性组合,是对原变量信息的一种提取,主成分不增加总信息元统计分析方法。但应用中盲目套用主成分分析方法的情量,也不减少总信息量,只是对原信息进行了重新分配。从况很多,而对主成分分析的适用性,主成分个数的合理性等主成分的应用上看,求解主成分可以解决原始数据的相关问题重视不够,更谈不上对主成分分析进行统计检验。为性问题,可以实现数据的降维。正因为上述情况,所以常导此,为了更好应用主成分分析,就应对主成分分析结果进行致人们认为:主成分分析的主成分数和原始变量数相等,它
2、统计检验并建立统计检验体系。主成分分析统计检验体系是将一组具有相关性的变量变换为一组独立的变量,严格主要包括:主成分分析的适用性检验;等相关性检验;主成上不能作为一个模型来描述,它只能作为通常的变量变换,分方差的假设检验和选取主成分数目检验。是一种变量变换行为,不涉及原来假设问题,所以不需要进关键词:主成分分析;假设检验;巴特莱特检验行假设检验。事实上,从理论上,主成分分析包括总体主成分分析和样本主成分分析,在实际问题中,总体协方差矩阵或相关矩阵都是未知的,都需要样本来估计,就必然涉及统计检验问主成分分析已经越来越成为人们广泛应用的多元统计题。而且在主成分分析的具体应
3、用中,变量变换是一种手分析方法。特别是在系统综合评价,变量子集合的选择以及段,变量变换的最终目的是为了根据实际情况,最终要选择主成分回归中都取得了大量的应用成果。但是,应用中盲目重要的信息量(即前几个主成分),以便在此基础上,进行进套用主成分分析方法的情况很多,而对主成分分析的适用一步的分析。要进行这样的分析,实际上隐含了原始变量中性,主成分个数的合理性等问题重视不够,更谈不上对主成存在着并且能够综合出重要信息的假设,为此就需要对相分分析进行统计检验问题。为此,本文拟对主成分分析的有应的假设进行统计检验。关统计检验问题,如主成分分析是否需要统计检验?若需要二、主成分分
4、析的统计检验体系则进行哪些检验?检验怎样的假设?如何进行这些统计检验(一)主成分分析适用性检验等问题进行探讨,以便抛砖引玉,供同行们做进一步研究。并非所有的截面数据都适用于主成分分析的。主成分一、主成分分析是否需要统计检验分析本身并不是目的,实际应用中主成分分析往往是一种主成分分析采取一种数学降维的方法,找出几个综合手段。目的是通过主成分分析简化数据结构,在此基础上进变量来代替原来众多的变量,使这些综合变量能尽可能地行进一步的分析。因此,使用主成分分析的前提条件是原始代表原来变量的信息量,而且彼此之间互不相关。这种将多数据各个变量之间应有较强的线性相关关系。如果原始变
5、个变量化为少数几个互不相关的综合变量的统计分析方法量之间的线性相关程度很小,它们之间不存在简化的数据就叫做主成分分析或主分量分析。结构,这时进行主成分分析实际是没有意义的。所以,应用从主成分的导出和计算上看,主成分是从原始数据的主成分分析时,首先要对其适用性进行统计检验。主成分分协方差矩阵或者相关系数矩阵出发,根据主成分应该满足析适用性检验的假设就是原始变量之间存在着较强的线性的条件导出的。即主成分的协方差矩阵应该是一个对角矩相关。具体检验方法有:阵,主成分表达式系数矩阵A应该是一个正交矩阵为条件,1、巴特莱特球性检验导出主成分的协方差矩阵的对角线元素是协方差矩阵或相
6、巴特莱特球性检验(Bartletttestofsphercity)是从整个关矩阵的特征值,主成分的方差就是原始数据协方差矩阵相关矩阵出发进行的检验,检验的原假设是相关矩阵为单或相关矩阵的特征值,主成分表达式系数就是协方差矩阵位矩阵,如果不能拒绝原假设,说明原始变量之间相互独或相关矩阵特征值对应的特征向量。主成分是原变量的线立,不适合进行主成分分析。事实上,如果原始数据的相关总第96期特稿.5.矩阵是一个单位矩阵,各个原始变量之间互不相关,这时进2、相关系数矩阵的直观检验行主成分分析,则得到的主成分就是各个原始变量自身,显相关系数矩阵的直观检验是直接根据相关系数矩阵中然
7、是不适合进行主成分分析的。所反映出的原始变量之间的线性相关大小来检验主成分分巴特莱特球性检验的统计量。巴特莱特球性检验的理析的适用性。具体使用有两种矩阵:论依据源于多元正态总体协方差矩阵的检验理论。协方差(1)根据简单相关矩阵进行直观检验。计算出简单相关矩阵的检验主要内容包括:对总体协方差矩阵∑与已知矩矩阵后,对各个变量之间的简单相关系数进行一般的分析阵∑0相等的检验,对总体协方差矩阵∑中的元素是否均为观察,如果相关矩阵的大部分相关系数都小于0.3,原始数已知协方差矩阵∑中元素的!2倍的检验,以及检验多个总据之间的相关关系不大,则不适合进行主成分分析