资源描述:
《多维数据的数字特征及相关分析.ppt》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库。
1、1.3多维数据的数字特征及相关分析11.3多维数据的数字特征及相关分析基本内容均值协方差Pearson相关系数Spearman相关系数p维总体均值向量协方差矩阵相关系数矩阵随机向量的性质多维正态分布观测数据协方差Pearson相关矩阵Spearman相关矩阵proccorr过程实现1.3.1二维数据的数字特征及相关系数1.3.3多维数据的数字特征及相关矩阵1.3.2多维总体的数字特征、相关矩阵及多维正态分布21.3多维数据的数字特征及相关分析均值协方差Pearson相关系数Spearman相关系数1.3.1二维数据的数字特征及相关系数3复习:数据的
2、分布直方图、经验分布函数、QQ图、茎叶图nnijiaxaxaaxa)()(11)1(0-4一.二维总体的数字特征及相关系数1.3.1二维数据的数字特征及相关系数5二维数字特征的性质当X与Y相互独立时,(3)(2)(1)1.3.1二维数据的数字特征及相关系数6二.观测数据协方差、相关系数、检验——样本协方差——样本协方差矩阵——样本均值——样本方差1.3.1二维数据的数字特征及相关系数观测矩阵—1.3.1二维数据的数字特征及相关系数总体(X,Y)T,样本7—Pearson相关系数—Pearson相关系数矩阵注:1.Pearson相关系数反映两随机变量线
3、性相关强弱,散点图见书图1.11.2.由Schwarz不等式知1.3.1二维数据的数字特征及相关系数二.观测数据协方差、相关系数、检验3.n充分大时,8当(X,Y)T为二维正态二维随机变量相关性检验观测数据假设检验统计量,认为
4、t
5、过大,拒绝假设,认为X与Y相关.检验p值给定,当,拒绝H0.认为X与Y相关;否则,不相关.1.3.1二维数据的数字特征及相关系数二.观测数据协方差、相关系数、检验91.秩统计量三.Spearman相关系数秩统计量:例观测值-0.8,-3.1,1.1,-5.24.2如-0.8,-3.1,-0.8秩统计量2,1,3或3,1,2
6、记为2.51,2.5秩统计量规定:相同观测值,秩统计量取排序的平均值。1.3.1二维数据的数字特征及相关系数10注:当X,Y相关性较强,两组秩统计量相关性也较强2.Spearman相关系数秩统计量分别为Spearman相关系数:1.3.1二维数据的数字特征及相关系数11基于Spearman相关系数的假设检验统计量检验P值1.3.1二维数据的数字特征及相关系数12四.SAS系统proccorr过程1.3.1二维数据的数字特征及相关系数13四.SAS系统proccorr过程解:程序dataexamp1_9;inputxy@@;cards;68971638
7、9270112568265931911210162123212031530375334622735221305584142292733217185537036287265740;run;proccorrdata=examp1_9pearsonspearmancov;/*方差描述性过程,输出Pearson,Spearman相关矩阵,协方差阵*/run;1.3.1二维数据的数字特征及相关系数14例1.9结果输出CORR过程2变量:xy协方差矩阵S,自由度n-1=19xyx570.45007845.0789y7845.0789112404.2632简单统计
8、量变量N均值标准偏差中位数最小值最大值x2033.8500023.8841027.000005.0000070.00000y20477.50000335.26745342.0000082.000001125Spearman相关系数,N=20当H0:Rho=0时,Prob>
9、r
10、xyx1.00000=0.97366p<.0001y0.973661.00000<.0001Pearson相关系数,N=20当H0:Rho=0时,Prob>
11、r
12、xyx1.00000=0.97971相关性显著p<.0001y0.979711<.00011.3.1二维数据的数字特
13、征及相关系数15结果分析:(1)利用proccorr过程,得(2)数据的Pearson相关系数(3)数据的Spearman相关系数检验p值均X与Y的相关性高度显著.1.3.1二维数据的数字特征及相关系数161.3多维数据的数字特征及相关分析观测数据协方差Pearson相关矩阵Spearman相关矩阵proccorr过程实现1.3.2多维总体的数字特征、相关矩阵及多维正态分布171.3.2多维总体数字特征、相关矩阵及正态分布一.p维总体的数字特征、相关系数矩阵分布函数p维总体连续总体概率密度均值向量:总体协方差矩阵:18总体相关矩阵:1.3.2多维总体
14、数字特征、相关矩阵及正态分布19二.随机向量的性质(1)A—常量矩阵,常向量,则(2)B—常量矩阵1.3.2