欢迎来到天天文库
浏览记录
ID:38800795
大小:374.06 KB
页数:14页
时间:2019-06-19
《实验九 典型相关分析》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库。
1、课 时 授 课 计 划课次序号:22一、课 题:实验九典型相关分析二、课 型:上机实验三、目的要求:1.掌握典型相关分析的理论与方法、模型的建立与显著性检验;2.掌握利用典型相关分析的SAS过程解决有关实际问题.四、教学重点:典型相关分析的SAS过程.教学难点:相关分析的理论与方法、模型的建立与显著性检验.五、教学方法及手段:传统教学与上机实验相结合.六、参考资料:《应用多元统计分析》,高惠璇编,北京大学出版社,2005;《使用统计方法与SAS系统》,高惠璇编,北京大学出版社,2001;《多元统计分析》(二版),何晓群编,中国人民大学出版社,20
2、08;《应用回归分析》(二版),何晓群编,中国人民大学出版社,2007;《统计建模与R软件》,薛毅编著,清华大学出版社,2007.七、作业:4.94.10八、授课记录:授课日期班 次九、授课效果分析:实验九典型相关分析(CanonicalCorrelationAnalysis)(2学时)一、实验目的和要求能利用原始数据与相关矩阵、协主差矩阵作相关分析,能根据SAS输出结果选出满足要求的几个典型变量.二、实验内容1.典型相关分析的SAS过程—PROCCANCORR过程基本语句:PROCCANCORR3、STAT=SAS数据集>;VARvariables;WITHvariables;RUN;说明:此过程输入数据可以是原始数据,也可以是相关系数矩阵或协方差矩阵,输出结果包含相关系数矩阵、典型相关系数、典型变量的系数、典型变量对之间的相关性检验的F统计量值、自由度、p值、典型变量与原始变量的相关系数等.(1)proccancorr语句的<选项列表>:lOUT=SAS数据集——创建含原始数据和典型相关变量得分(观测值)的SAS集.lOUTSTAT=SAS数据集——创建含原始变量的样本均值、样本标准差、样本相关系4、数阵、典型相关系数和典型变量的标准化和非标准化系数等SAS集.lCORR(或C)——打印原始变量的样本相关系数矩阵.lNCAN=m——规定要求输出的典型变量对个数,默认为两组变量个数较小者.lEDF=n-1——针对输入原始数据集为样本相关系数矩阵或样本协方差矩阵,借此选项指定样本容量为观测个数减1.输入为原始观测数据时,省略此项.lall——所有输出项.lnoprint——不输出分析结果.lshort——只输出典型相关系数和多元分析统计数.lsimple——简单统计数.lvname=变量名——为var语句的变量定义名称.lvprefix=前缀名——为5、var语句的典型变量定义前缀.lwname=变量名——为with语句的变量定义名称.lwprefix=前缀名——为with语句的典型变量定义前缀.(2)VARvariables——VAR后列出进行相关分析的第一组变量名称.(3)WITHvariables——WITH后列出进行相关分析的第二组变量名称var与with语句经常同proccancorr语句一起使用.其他语句类似corr过程.2.典型相关分析步骤两组随机变量,取值组观测数据,标准化样本样本相关系数矩阵为总体相关系数矩阵的估计.样本典型相关分析步骤:(1)求()的特征值(2)求和对应的正交单位6、化特征向量和(3)第k对典型相关变量为,其中样本典型相关系数为,(4)典型相关系数的显著性检验统计量检验值为若,拒绝.依次就进行检验,若对某个,检验值首次满足,则认为只有前对典型变量显著相关,选取前对即可.注意:利用样本协方差矩阵,分析方法一样.不需要对数据标准化处理.3.实例分析例4.6为研究空气温度与土壤温度的关系,考虑六个变量日最高土壤温度;日最低土壤温度;日土壤温度积分值;日最高气温;日最低气温;日气温曲线积分值.观测了天,数据如表4.7.,做典型相关分析.解:(1)建立输入数据集,程序如下:dataexamp4_6;inputx1-x3y17、-y3;cards;85591518465147866115984651498364152796614283651588167147886918084681677767147746613178691597366131846815975671348971195846816191762068672169917620688731769476211907418794752118872171927020158721718768167816915483681627968149876617384691608768177847016088701698470168838、661707767147926719687671669272199896917194722048972180
3、STAT=SAS数据集>;VARvariables;WITHvariables;RUN;说明:此过程输入数据可以是原始数据,也可以是相关系数矩阵或协方差矩阵,输出结果包含相关系数矩阵、典型相关系数、典型变量的系数、典型变量对之间的相关性检验的F统计量值、自由度、p值、典型变量与原始变量的相关系数等.(1)proccancorr语句的<选项列表>:lOUT=SAS数据集——创建含原始数据和典型相关变量得分(观测值)的SAS集.lOUTSTAT=SAS数据集——创建含原始变量的样本均值、样本标准差、样本相关系
4、数阵、典型相关系数和典型变量的标准化和非标准化系数等SAS集.lCORR(或C)——打印原始变量的样本相关系数矩阵.lNCAN=m——规定要求输出的典型变量对个数,默认为两组变量个数较小者.lEDF=n-1——针对输入原始数据集为样本相关系数矩阵或样本协方差矩阵,借此选项指定样本容量为观测个数减1.输入为原始观测数据时,省略此项.lall——所有输出项.lnoprint——不输出分析结果.lshort——只输出典型相关系数和多元分析统计数.lsimple——简单统计数.lvname=变量名——为var语句的变量定义名称.lvprefix=前缀名——为
5、var语句的典型变量定义前缀.lwname=变量名——为with语句的变量定义名称.lwprefix=前缀名——为with语句的典型变量定义前缀.(2)VARvariables——VAR后列出进行相关分析的第一组变量名称.(3)WITHvariables——WITH后列出进行相关分析的第二组变量名称var与with语句经常同proccancorr语句一起使用.其他语句类似corr过程.2.典型相关分析步骤两组随机变量,取值组观测数据,标准化样本样本相关系数矩阵为总体相关系数矩阵的估计.样本典型相关分析步骤:(1)求()的特征值(2)求和对应的正交单位
6、化特征向量和(3)第k对典型相关变量为,其中样本典型相关系数为,(4)典型相关系数的显著性检验统计量检验值为若,拒绝.依次就进行检验,若对某个,检验值首次满足,则认为只有前对典型变量显著相关,选取前对即可.注意:利用样本协方差矩阵,分析方法一样.不需要对数据标准化处理.3.实例分析例4.6为研究空气温度与土壤温度的关系,考虑六个变量日最高土壤温度;日最低土壤温度;日土壤温度积分值;日最高气温;日最低气温;日气温曲线积分值.观测了天,数据如表4.7.,做典型相关分析.解:(1)建立输入数据集,程序如下:dataexamp4_6;inputx1-x3y1
7、-y3;cards;8559151846514786611598465149836415279661428365158816714788691808468167776714774661317869159736613184681597567134897119584681619176206867216991762068873176947621190741879475211887217192702015872171876816781691548368162796814987661738469160876817784701608870169847016883
8、661707767147926719687671669272199896917194722048972180
此文档下载收益归作者所有