欢迎来到天天文库
浏览记录
ID:55648936
大小:1.07 MB
页数:66页
时间:2020-05-22
《数学建模-主成分分析.ppt》由会员上传分享,免费在线阅读,更多相关内容在PPT专区-天天文库。
1、主成分分析法2021/7/31常见相关模型及其建模方法2.专题求解模型1.发散思维模型2021/7/31近几年赛题为例2009年A题制动器试验台的控制方法分析B题眼科病床的合理安排2010年A题储油罐的变位识别与罐容表标定B题上海世博会影响力的定量评估2011年A题城市表层土壤重金属污染分析B题交巡警服务平台的设置与调度2012年A题葡萄酒的评价B题太阳能小屋的设计近几年全国数学建模竞赛题2021/7/312010年B题上海世博会影响力的定量评估2009年B题眼科病床的合理安排2011年A题城市表层
2、土壤重金属污染分析2012年A题葡萄酒的评价均可归属为-基于数据分析的综合评价模型2021/7/31两类模型常用建模方法综合评价法测试分析法专题建模法信息合理运用法2021/7/31综合评价基本方法简易的方法有:常用的方法有:2021/7/31测试分析法回归分析曲线拟合计算机模拟与仿真2021/7/31专题建模法数学规划(线性规划与非线性规划)概率论与数理统计图论微分方程各学科实际问题2021/7/31信息合理运用法将与问题相关的论文合理运用将其他问题的论文合理运用07年选区的重新划分与统计物理202
3、1/7/31主成份分析法2021/7/31问题实际背景,在众多评价问题中,人们往往会对评价样品收集尽可能多的指标,例如人口普查往往要调查每个人的姓名、年龄、性别、文化程度、住房、职业、收入、消费等几十项指标;再如,2012年葡萄评价有24指标。从收集资料的角度来看,收集较多的数据有利于完整反映样品的特征,但是这些指标从统计角度来看相互之间具有一定的依赖关系,从而使所观测的数据在反映信息上有一定重叠,同时又使得问题变得复杂。2021/7/31思考:如何减少变量,但信息量保留得较多。由此产生了主成分分析法
4、。主成分分析也称主分量分析(principalcomponentsanalysis,PCA)是由美国的科学家哈罗德·霍特林(Haroldotelling)于1933年首先提出的。2021/7/31解决的问题之一:降维2021/7/31解决的问题之二:几何分析2021/7/31解决的问题之三:客观加权2021/7/31主成分分析的基本思想2021/7/31一、降维的两个准则准则1:信息量损失尽可能少。准则2:新主成分之间相关性低、重叠少。2021/7/31二、明确信息量的数学意义我们知道,当一个变量所取
5、数据相近时,这个变量(数据)提供的信息量较为单一,当这个变量取数据差异较大时,说明它对各种场景的“遍历性”越强,提供的信息就更加充分,从数学角度来论,变量的标准差或方差越大,变量涵盖的信息越足。2021/7/31三、明确重叠少数学意义我们知道,当一个变量与有关联时难免表达信息有重复,没关联反映在数学上最好是两变量独立,而这一要求过强,较难满足,这里我们就要求新主成分之间无线性关系就好,反映在概率理论上就是每两个主成分之间的协方差为“0”或相关系数为“0”。2021/7/31建立选取主成分分析模型202
6、1/7/31引例:假设共有n个样品,每个样品都测量了两个指标(X1,X2),在坐标系中,观察散点的分布,假设共有n个样品,每个样品都测量了两个指标(X1,X2),在坐标系中,观察散点的分布,假设共有n个样品,每个样品都测量了两个指标(X1,X2),在坐标系中,观察散点的分布,假设共有n个样品,每个样品都测量了两个指标(X1,X2),在坐标系中,观察散点的分布,2021/7/31引例:单独看这n个点的分量,它们沿着方向和方向都具有相近的离散性,如果仅考虑其中的任何一个分量,那么包含在另一分量中的信息将会
7、损失,因此,直接舍弃某个分量不是“确定主成分”的有效办法。2021/7/31结论:为第一主成分,为第二主成分。换个角度观察事实上,散点的分布总有可能沿着某一个方向略显扩张,这里沿椭圆的长轴方向数据变化跨度就明显大于椭圆的短轴方向。2021/7/31结论:为第一主成分,为第二主成分。换个角度观察结论:长轴方向变量为第一主成分;短轴方向变量为第二主成分。2021/7/31结论:为第一主成分,为第二主成分。当新旧变量间夹角为时,由坐标变换公式可得主成分获得的数学模型2021/7/31确定主成分的数学模型:2
8、021/7/31推广一般主成分确定的模型或其中T是正交矩阵2021/7/31主成分满足的约束要求:①Y的各分量是不相关的;②并且Y的第一个分量的方差是最大的;第二个分量的方差次之,……,等等。③为了保持信息不丢失,Y的各分量方差和与X的各分量方差和相等。2021/7/31主成分的方差及它们的协方差其中表示方差,Cov表示协方差,这里X是多维随机向量,D(X)则表述的是X的协方差阵,一般用其中表示方差,Cov表示协方差,这里X是多维随机向量,D(X)则表述
此文档下载收益归作者所有