数.理.统.计.第六章.ppt

数.理.统.计.第六章.ppt

ID:52543438

大小:409.50 KB

页数:32页

时间:2020-04-10

数.理.统.计.第六章.ppt_第1页
数.理.统.计.第六章.ppt_第2页
数.理.统.计.第六章.ppt_第3页
数.理.统.计.第六章.ppt_第4页
数.理.统.计.第六章.ppt_第5页
资源描述:

《数.理.统.计.第六章.ppt》由会员上传分享,免费在线阅读,更多相关内容在PPT专区-天天文库

1、第六章:多元统计分析 简介研究生《数理统计》课程多元分析(MultivariateAnalyses)是多变量的统计分析方法。主要方法有:1)聚类分析(分类与组合)2)主成分分析(数据化简)3)相关分析(研究变量之间的依赖关系)4)判别分析*(根据已有的数据特征,对待判数据进行判断)例1)如何区分发达与不发达地区?2)对高校的排名;分类评价某市城镇居民的收入数据(2001年):x1:职工标准工资收入;x2:奖金;x3:津贴;x4:其它收入;x5:性别;x6:就业身份,x7:文化程度。x1x2x3x4x5x6x7540000男国有小学11371259

2、60女集体中学12363002700女国有高中10080960男集体高中17234194000男国有大学1080569147156男集体大学132603000女国有研究生1110110960女集体大学1012882980女国有高中120910217967男集体大学110121520139男集体高中间隔尺度、有序尺度、名义尺度。聚类分析将“相似”的样本或指标进行分类。(定量)数据矩阵(结构)第2列向量第n行向量聚类分析Feature1Feature2A类B类待判数据点怎样刻画点之间、类之间的“相似”?(xi1,xi2)样本的相似性度量两点间的距离函

3、数d(.,.):Ω×Ω→R+,满足性质:最常用的是Minkowski距离:当q=1,2或q→+∞时,则分别得到如下距离:注意:采用距离时,变量x和y要采用相同量纲.样本的相似性度量协方差矩阵1)指标yj与yk之间的相关系数2)指标yj与yk之间的夹角余弦yjyk指标的相似性度量矩阵:R=(rjk),p×p阶矩阵性质:①

4、rjk

5、≤1;②rjk=rkj;(对称性)③

6、rjk

7、→1,xj与xk相似强;④

8、rjk

9、→0,xj与xk相似弱;如果有两个样本类G1和G2,定义如下距离:类与类间的相似性度量系统聚类法基本思想1)计算n个样本之间的距离{dij}

10、,记为矩阵D=(dij);2)合并距离最近的两类为新类,并以两类间的距离值作为聚类图中的平台高度;(类距离也取最小!)系统聚类法3)计算新类与当前各类的距离,若类的个数为1,则画聚类图,否则重复2)。系统聚类法聚类图对十种品牌的家用小轿车调查了303户家庭,这些家庭对这十种类型的汽车的偏爱程度进行打分(满分为10分)。需分析哪些人群偏爱什么样的小轿车?哪些小轿车的性价比能得到绝大多数人的公认?序号x1x2x3x4x5x6x7x8x9x10168184544772873641678538236327444……数据表(n=303)例计算相似性系数矩阵

11、:(对指标进行分类)x1x2x3x4x5x6x7x8x9x101-0.10350.06620.08020.0627-0.05830.35020.08180.1856-0.15541-0.04450.4840.00490.0757-0.2079-0.0756-0.05260.02841-0.12120.44660.20120.24030.019-0.00190.02621-0.15820.0626-0.1647-0.037-0.02740.076410.16310.23550.00960.01070.120110.0651-0.0195-0.033

12、50.29931-0.01160.17370.058710.00280.20231-0.17041按指标进行分类,分成3类:车类型12345678910平均分数7545526564主成分分析1、基本思想用较少的变量去解释原来资料中的绝大部分变量。例如:同类行业排序问题(十几项指标)主成分的几何意义x1,x2压缩为y1,丢弃信息y2信息量的大小定义为D(y1)x1x2x1x2y1y2数据结构假定是一个p维向量,服从正态分布。主成分分析基本原理欲确定随机变量x1,x2,…,xp的线性变换,使得各主成分变异(方差)最大,且信息不重叠。线性变换:主成分分

13、析计算步骤:1)计算样本相关系数矩阵R;2)计算R的特征根和特征向量:特征值特征向量2)各主成分主成分分析3)计算累计贡献率(m

14、-0.527-0.0290.605-0.486-0.633-0.5963-0.392-0.035-0.114-0.3620.4610.2

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。