资源描述:
《多元统计分析new》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库。
1、第1章引论1.1多元统计分析多元统计分析的数据是由在若干个体或对象上的多组测量构成的.这个样本数据,可能是从某城市所有在校儿童中随机抽取的一些儿童的身高和体重;也可能是一个测量集族,比如两种鸢尾植物花瓣的长度和宽度以及萼片的长度和宽度;或者又可能是若干学生在一系列心理测试中的得分.可将一个个体上的多个测量写成一个列向量,我们把这个向量整体看做是来自某多元总体或分布的一个观测.当此个体是随机抽取时,我们认为其测量对应的向量是一个随机向量,它和总体有相同的分布或概率规则.样本中所有个体的观测组①成了向量样
2、本,将这些向量排成一行就形成了一个观测矩阵.从而那些需要分析的数据就表示为一个或若干个矩阵.我们将会看到,把每个观测向量当做欧氏空间里的一个点有助于直观地表示数据和理解方法,其中观测向量的每一个坐标相应于一个测量或变量.实际上,统计分析首先要做的就是用图表示数据.大多数统计学家仅限于二维作图,即将观测向量的两个坐标依次表示在图中.对于单变量分布,其重要的特征是作为位置测度的均值和作为变异性测度的标准差.同样,对于单变量的样本,其均值和标准差也是很重要的测度.在多元分析中,无论总体还是样本,不同测量的均
3、值和方差之间具有相应的相关性.多元分析的一个重要内容就是研究不同变量间的相依性.两个变量间的相依性可以用它们的协方差表示,即它们分别与各自均值离差之积的平均.用相应的标准差将协方差标准化,就得到了相关系数,它反映了这两个变量的相依程度.因此对于多元变量,可选择均值向量(由单变量的均值组成)和协方差阵(由单变量的方差和两两变量的协方差组成)作为一组描述统计量.或者也可以选择均值向量、所有单变量的标准差和相关阵作为一组描述统计量集合.这两组统计量包含相同的信息.这些参量描述了一个总体或概率分布的位置、变异
4、性和相依性.多元正态分布就是完全由其均值向量和协方差阵决定的,因此其样本均值向量和协方差阵就是一组充分统计量.多元分析的基本内容是刻画和分析变量之间的相依性、变量集之间的相依性①当在纸上列表记录数据时,会很自然地将一个个体的测量记为表上的一行,因此一个个体相当于一个行向量.但因为我们更喜欢用列向量进行代数运算,所以用列向量来表示一个观测.(在实际中,这些数据也可能记录在卡片、磁带或磁盘上.)2第1章引论以及变量与变量集之间的相依性.多重相关系数是相关系数的扩展,它刻画了一个变量和一组变量之间的关系.偏
5、相关系数刻画了两个变量在除去其他相关变量影响后的相依程度.从样本中得到的各种相关系数是用来估计总体分布中相应的相关系数.本书将讨论独立假设检验,以及从多元正态分布抽样的估计性质和检验方法.多元总体的许多统计问题是单变量总体问题的直接类比,解决这些问题的方法也是相似的.例如,在单变量情形下,我们可能希望检验一个变量的均值为零的假设;在多元情形下,我们就可能希望检验若干个变量的均值组成的均值向量为零向量的假设.前一个假设用到的学生t检验的类比是广义T2检验.单变量的方差分析也适用于观测值向量.在回归分析中
6、,因变量可能是一个变量向量.因此方差的比较就推广为协方差阵的比较.单变量统计量的检验方法推广到多元情形下需要考虑变量间的相依性,这些方法是不依赖坐标系的,即这些方法相对于那些关于原假设不变的线性变换是不变的.在一些问题中,可能会有很多族检验是不变的,这时则需要做出选择.因此需要考虑检验的最优性质.然而,在另一些情况下,选择一个坐标系是很重要的,它可使变量具有所希望的统计性质.有人会说它们具有正态分布或样本的固有特征.这些和矩阵的典范型的代数问题有很大关联.例如,找一组变量的具有极大方差或极小方差的正规
7、线性组合(找主成分)就相当于找一个坐标轴的旋转,使得协方差阵变成对角形式.另一个例子是刻画两个变量集之间的相依性(找典型相关).这些问题涉及不同矩阵的特征根和特征向量,也要考虑相应样本量的统计性质.一些统计问题产生于均值和协方差被限定的模型中.因子分析可能是基于一个(总体)协方差阵,这个协方差阵是一个正定对角矩阵与一个降秩的半正定矩阵之和;线性结构关系也有相似的形式.计量经济学中的联立方程组就是一个特殊模型的例子.1.2多元正态分布本书讨论的统计方法是针对多元正态分布的,但在抽样分布不是正态时,许多方
8、法也是有效的.基于正态分布进行统计分析的一个主要原因是,这个概率模型可以很好地近似很多抽样总体中连续测量的分布.事实上,大多数数据统计分析的方法和理论已经发展成熟.一些数学家,如Adrian(1808),Laplace(1811),Plana(1813),Gauss(1823)和Bravais(1846)研究了二元正态密度.遗传学家FrancisGal-ton在研究从一个父代上和一个子代上得到的成对测量时,引入了相关、回归和同方差性的思想.[例如,见Ga