欢迎来到天天文库
浏览记录
ID:47221355
大小:50.55 KB
页数:14页
时间:2019-08-28
《实验指导三主成分分析66834》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库。
1、上机实验指导二:主成分分析实验目的:能利用原始数据与相关矩阵、协主差矩阵作主成分分析,并能理解标准化变量主成分与原始数据主成分的联系与区别;能根据SAS输出结果选出满足要求的几个主成分。实验每组人数及学时:组人数1人,学吋数:2学吋实验要求:要求每位实验人员于课堂吋间完成相关练习实验环境:装有版本8.0以上的SAS系统的个人电脑实验类型:设计型实验内容:>多元统计分析处理的是多变屋(多指标)问题。>在实际问题中,为了尽可能完整地获収有关的信息,往往需要考虑众多的变量,这虽然可以避免垂要信息的遗漏,但增加了分析的复杂性。>同一问题所涉及到的
2、众多变量Z间会存在一定的相关性,这种相关性会使各变量的信息有所“重叠”。>人们自然希望通过克服相关性、觅叠性,即对这些彼此相关的变量加以“改造”,用较少的变量來代替原來较多的变量,而这种代替可以反映原来多个变量的大部分信息,从而通过对为数较少的新变虽的分析达到解决问题的H的。>这实际上是一种“降维”的思想。>成分分析也称主分量分析,是由Hotelling于1933年首先提出的。>由于多个变量Z间往往存在着一定程度的相关性。人们自然希望通过线性组合的方式,从这些指标中尽可能快地提取信息。>当第一个线性组合不能提取更多的信息时,再考虑用第二个
3、线性组合继续这个快速提取的过程,……,直到所提取的信息与原指标相差不多时为止。这就是主成分分析的思想>主成分分析着眼于考虑变量的“分散性”信息,主要目的是对原变量加以“改造”,在不致损失原变量太多信息的条件下尽可能地降低原变量的维数,即用较少的“新变量”代替原来的各变量,即:(1)变量的降维;(2)主成分的解释。>一般说来,在主成分分析适用的场合,用较少的主成分就可以得到较多的信息量。以各个主成分为分量,就得到一个更低维的随机向量;>因此,通过主成分既可以降低数据“维数”乂保留了原数据的大部分信息。>主成分的贡献率与累计贡献率:实用中,要
4、求累计达到80%~90%的前m个主成份,既能降维又不损失原始变量中的太多信息>实际应用一般是求样本主成分:五、实验步骤:(一)过程格式procprincomp选项;vai•变量表;partial变屋表;freq变量;weight变量;by变屋;(二)语句说明procprincomp语句选项DATA=输入数据集,可以用type=cov或type=corr指明数据类型,data=new(type=corr);表明new为一相关系数(corr)数据集.ou匸输出数据集,存储原始数据和主分量得分等•outstat=输出数据集,存储变量的平均数、标
5、准差、相关系数、特征值、特征向量等。Cov指定要求从协方差阵出发计算主成份。缺省为从相关阵出发计算。N=指要计算的主成份个数。缺省时全算。STD要求在OUT二的数据集中把主成份得分标准化为单位方差。不规定时方差为相应特征值。Noint不含截距;Noprint不输出分析结果.Vai•语句指明分析的数值变量.Partial语句指明偏相关或协方差矩阵迓行分析的数值变量.六、应用:1999年我国经济发展情况分析1999年我国的经济出现了良好的发展势头。下而我们选収全国31个省市自治区的八项指标(见表1),利川国际先进软件SAS对我国1999年经济
6、发展情况作主成分分析表11999年全国31个省市自治区经济发展基本情况国内生产总值居民消费水平固定资产投资职工平均工资货物周转量98屈民消费价恪指数商品零售价裕指数工业总产值省份亿元元亿元元亿吨公里%%亿元X1x2x3x4x5x6x7x8北京2174.465784117L1614054333.8100.698.91999.97天津1450.065551576.4511056365.998.997.52261.49河北4569.1923121770.4770221952.598.197.82994.58山西1506.781833477.57
7、6065762.499.696.81096.83内蒙1268.22279348.226347759.599.897.7640.68辽宁4171.6941281119.4778951229.99&696.13390.14吉林1669.563132500.027158464.89896.71366.92黑龙2897.413431751.66709484496.896.11854.57上海4034.96103281855.7616641206.3101.597.35452.91江苏7697.8235942441.8891711075」9&596
8、.98915.04浙江5364.8938771958.0511201897.998.597.75191.56安徽2908.592523703.456516887.297.596.61533.9
此文档下载收益归作者所有