多元统计分析.ppt

多元统计分析.ppt

ID:52343953

大小:2.06 MB

页数:120页

时间:2020-04-04

多元统计分析.ppt_第1页
多元统计分析.ppt_第2页
多元统计分析.ppt_第3页
多元统计分析.ppt_第4页
多元统计分析.ppt_第5页
资源描述:

《多元统计分析.ppt》由会员上传分享,免费在线阅读,更多相关内容在PPT专区-天天文库

1、多元统计分析哈尔滨工业大学数学系葛虹多元统计分析内容简介第一章多元统计的基本概念第二章主成分分析第三章聚类分析第四章多元正态分布第五章多元回归分析第一章多元统计的基本概念第一节随机向量及其数字特征随机向量极其分布P维随机向量:联合分布函数:联合密度函数:特征函数一元随机变量:二元随机向量:P元随机向量例1条件分布与独立性两随机向量间的条件分布的D.F:;d.f;c.f的D.F:;d.f;c.f的D.F:;d.f;c.f给定,的条件密度函数:两随机向量独立的充分必要条件与相互独立随机向量的数字特征随机向量的数学期望随机向量的方差阵两随机向量间的协方差阵随机向量的相关系

2、数阵随机向量的数字特征的计算性质对称,非负定;例2求:第二节随机向量的样本及其数字特征P维随机样本P维随机向量的一个容量为n的样本:的样本的样本的样本样本均值样本离差阵与样本方差阵样本离差阵样本方差阵样本相关系数阵与的样本相关系数作业一1令(1)求c;(2)求;(3)证明:;(4)是否相互独立?2设三个随机变量x,y,z的联合密度函数为:(1)求常数k;(2)x,y,z是否相互独立?(3)试求在给定y=1/2,z=1的条件下x的分布。3设随机向量的协方差阵为:(1)求相关系数阵;(2)令,,求的协方差阵。实验报告一选择一组多维有意义的数据编写SAS数据文件利用SAS

3、作单变量的置方图,计算基本统计特征(均值、方差或标准差)并由此分析单变量的基本分布情况利用SAS计算多维随机变量的样本协方差阵、样本相关系数阵并由此分析变量之间的相关性要求打印SAS数据文件置方图计算结果分析结果第二章主成分分析第一节为什么要进行主成分分析消除自变量间的相关性与多维变量降维满足(1)(2)第二节数学模型与理论主成分前提条件:目标:寻找正交矩阵使(1)(2)且结论:是的特征值;的行向量分别为相应的特征向量;理论主成分的计算过程求非负定阵的特征值:求所对应的单位特征向量:写出主成分:第三节样本主成分的计算过程首先将原始数据标准化得到标准化数据

4、(消除量纲影响);求标准化数据的样本协方差阵(该矩阵是原样本数据的样本相关系数阵);求的特征值和所对应的单位特征向量:写出p个主成分的表达式:……是样本均值,是样本标准差选择主成分的方法贡献率:第i个主成分的贡献率为累积贡献率:前m个主成分的累积贡献率为选择法则:保留m个主成分第四节主成分的应用利用第一主成分进行综合评价若第一主成分满足:(1)其中(2)第一主成分的贡献率,则可以作为一个综合评价指标利用第一、二个主成分进行分类若第一、二个主成分的累积贡献率,则由第一、二个主成分在平面上的散点图,可以对样品进行分类。实验二主成分分析选取一组有意义的P维数据利用SAS的

5、“交互数据分析”对P维变量进行主成分分析,并选择主成分进行排序与分类。要求说明:1)主成分选择原理2)所选择主成分的表达式3)最后的排序与分类结果。第三章聚类分析第一节p维空间中的距离欧氏距离马氏距离B模距离明氏距离一点到总体的马氏距离第二节聚类方法简介问题:将n个p维样本分成m个类系统聚类法与聚类步骤流程图动态聚类法与聚类步骤流程图系统聚类法与聚类步骤流程图初始分类:若与距离最小,合并为一类no输出分类结果动态聚类法与聚类步骤流程图寻找m个凝聚点:若则;得计算各类的重心:若则;得计算各类的重心:重心改变输出分类结果yesno第三节五种系统聚类(cluster)方法

6、最短距离法(method=single)最长距离法(method=complete)重心法(method=centroid)类平均法(method=average)离差平方和法(method=ward)可以证明:半偏第四节系统聚类在SAS中的实现procclusterdata=citymethod=wardouttree=DD;Varx1-x8;idregion;proctreedata=DDhorizontalgraphics;idregion;title‘treeofcluster’;run;实验三聚类分析选取一组有实际意义的数据利用SAS的五种系统聚类方法将n

7、个样本进行分类,要求:1)说明每一种方法的分类结果2)利用主成分分析说明哪一种分类结果更合理第四章多元正态分布第一节多元正态分布第二节多元正态分布的函数-卡方分布第三节多元正态分布的参数估计第四节WISHART分布第五节正态分布均值向量的假设检验一元正态分布一元正态分布密度函数形式特征函数形式一般正态与标准正态之间的关系多个正态变量的线性组合仍为正态变量第一节多元正态分布定义1q维标准正态分布设独立同分布于,则称随机向量服从q维正态分布,记密度函数:特征函数:定义2p维一般正态分布设,B为实数矩阵,为维实数向量,则是维随机正态分布,记为:其中为非负定阵。定理1若

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。