多元统计分析——主成分分析法.ppt

多元统计分析——主成分分析法.ppt

ID:51561619

大小:911.02 KB

页数:59页

时间:2020-03-23

多元统计分析——主成分分析法.ppt_第1页
多元统计分析——主成分分析法.ppt_第2页
多元统计分析——主成分分析法.ppt_第3页
多元统计分析——主成分分析法.ppt_第4页
多元统计分析——主成分分析法.ppt_第5页
多元统计分析——主成分分析法.ppt_第6页
多元统计分析——主成分分析法.ppt_第7页
多元统计分析——主成分分析法.ppt_第8页
多元统计分析——主成分分析法.ppt_第9页
多元统计分析——主成分分析法.ppt_第10页
资源描述:

《多元统计分析——主成分分析法.ppt》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库

1、主成分分析PrincipalComponentAnalysis思考1反映地区社会经济发展的指标体系X1:国内生产总值(GDP)X2:人均GDPX3:第三产业产值占GDP比重X4:人均出口额X5:工业企业劳动生产率X6:人均社会消费品零售额X7:每万人拥有卫生技术人员数X8:每万人高等学校在校生数X9:教育经费投入占GDP比重X10:人均货运总量X11:人均邮电业务总量X12:每万人电话机装机数X13:人均固定资产投资X14:人均实际利用外资X15:地方财政收入占GDP比重X16:每万人科研机构数X17:科研经费占

2、GDP比重分析全国31个地区的社会经济发展水平。为了对常用的100种食品的生产进行经营决策,需要就消费者对食品的嗜好程度进行调查。要求每个消费者对食品进行评价,按对食品的喜好程度评分,最受欢迎的给予最高分9分,最不受欢迎的给予最低分1分。思考2为了较好地满足市场的需要,服装生产厂要了解所生产的一种服装究竟设计几种型号合适?这些型号的服装应按怎样的比例分配生产计划才能达到较好的经济效益?思考3——服装的定型分类问题大纲1.基本思想2.定义3.主成分的性质、计算等4.案例5.主成分回归E.g.Hotelling(19

3、39)用两个主成分反映入学考试成绩:文科能力数理能力预备知识:方差为零的变量不能区分总体中的个体成员;可以用一个变量的方差来度量其所传递的信息量。主成分分析的基本概念一个假设的例子:N=100均数101.6350.71方差109.6355.40标准差10.477.44的均数=0的均数=0x2X1预备知识:向量等方向都是同一个方向ab2a2b(1)创建使得尽可能大,即寻找一个方向,使得所有点在此方向上的投影的方差尽可能大(2)创建使得与不相关尽可能大。即寻找另一个方向垂直于所有点在上的投影方差最大。••••••••

4、•••••••••••••••••••••••••••••例1985年中国人口普查资料:各省汉族青年(19-22岁)形态学指标的平均值。如何综合多个随机变量?我们想要一个或几个综合变量,概括6个形态指标的大部分信息.注意:若某指标在人群中方差较大,它就是一个好的指标。寻找综合变量标准化(1)找第1个最佳的综合变量找适宜的系数,使得与其他线性组合相比,有最大的方差最大我们关心的是之间的比值故限定(2)找第2个最佳的综合变量找适宜的使得最大限定(3)找第3个最佳的综合变量最大限定原有6个变量,最多可找到6个独立的综合

5、变量主成分的一般定义一般地,样本均数样本标准差标准化(1)在所有线性组合中,限定使得最大的便是第1主成分。(2)在所有线性组合中,限定使得最大的便是第2主成分.………………类似地,我们可以定义第3,第4,直到第p个主成分。主成分的性质(1)主成分之间不相关Corr(Ci,Cj)=0(2)系数(ai1,ai2,…,aip)是单位向量ai12+ai22+…+aip2=1(3)方差递降Var(C1)≥Var(C2)≥…≥Var(Cp)(4)主成分的方差之和等于原变量的方差之和信息总量不增不减Var(C1)+Var(C2

6、)+…+Var(Cp)=Var(x1)+Var(x2)+…+Var(xp)=p主成分的计算和解释(1)计算的相关矩阵(2)计算R的特征根(特征值)即求解方程(3)计算特征向量即求解方程…………………得到表1例1的相关矩阵只有前几个才是名副其实的“主成分”表2例1的相关矩阵的主成分表4例1的特征向量主成分的个数实践中,(1)粗略地决定欲保留的方差百分比;——仅保留前几个主成分或(2)若某个主成分的方差大于1,就保留它——因为原变量的方差都是1究竟保留几个?——取决于课题本身的需要碎石图主成分与原变量的相关性和的关系

7、:………………:主要反映身体的大小;身高、坐高、体重、胸围:反映宽度肩宽和骨盆宽度总之,(1)主成分有助于综合多个变量(2)主成分的意义有时不易解释例:抑郁症问卷的综合得分 表1标准CESD问卷的主成分(抑郁症数据)C1:多数条目的加权和C2:反映懒散和精力状况C3:有关“别人怎样看待自己”的感觉例2关于下颚6个前齿的结石1.右犬齿2.右、侧门牙3.右、中门牙4.左、侧门牙5.左、中门牙6.左犬齿PC1:加权和,总的结石状况PC2:门牙与犬齿比较PC3:左右比较主成分分析的应用综合评价市场研究定型分类问题反映地区

8、社会经济发展的指标体系X1:国内生产总值(GDP)X2:人均GDPX3:第三产业产值占GDP比重X4:人均出口额X5:工业企业劳动生产率X6:人均社会消费品零售额X7:每万人拥有卫生技术人员数X8:每万人高等学校在校生数X9:教育经费投入占GDP比重X10:人均货运总量X11:人均邮电业务总量X12:每万人电话机装机数X13:人均固定资产投资X14:人均实际利用外资X15

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。