主成分分析法(PCA)课件.ppt

主成分分析法(PCA)课件.ppt

ID:57389156

大小:261.50 KB

页数:23页

时间:2020-08-15

主成分分析法(PCA)课件.ppt_第1页
主成分分析法(PCA)课件.ppt_第2页
主成分分析法(PCA)课件.ppt_第3页
主成分分析法(PCA)课件.ppt_第4页
主成分分析法(PCA)课件.ppt_第5页
主成分分析法(PCA)课件.ppt_第6页
主成分分析法(PCA)课件.ppt_第7页
主成分分析法(PCA)课件.ppt_第8页
主成分分析法(PCA)课件.ppt_第9页
主成分分析法(PCA)课件.ppt_第10页
资源描述:

《主成分分析法(PCA)课件.ppt》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、维度规约主成分分析(PCA)在模式识别中,一个常见的问题就是特征选择或特征提取,在理论上我们要选择与原始数据空间具有相同的维数。然而,我们希望设计一种变换使得数据集由维数较少的“有效”特征来表示。主成分分析主成分分析(或称主分量分析,principalcomponentanalysis)由皮尔逊(Pearson,1901)首先引入,后来被霍特林(Hotelling,1933)发展了。在PCA中,我们感兴趣的是找到一个从原d维输入空间到新的k维空间的具有最小信息损失的映射X在方向w上的投影为主成分分析(PCA)一、主成分的定义及导出二、主成分的性质三、从相

2、关阵出发求主成分一、主成分的定义及导出设为一个维随机向量,主成分是这样的,样本投影到上之后被广泛散布,使得样本之间的差别变得最明显,即最大化方差。设希望在约束条件下寻求向量,使最大化写成拉格朗日问题现在关于求导并令其等于0,得到如果是的特征向量,是对应的特征值,则上式是成立的同时我们还得到为了使方差最大,选择具有最大特征值的特征向量,因此,第一个主成分是输入样本的协方差阵的具有最大特征值对应的特征向量第二个主成分也应该最大化方差,具有单位长度,并且与正交对于第二个主成分,我们有关于w2求导并令其为0,我们有上式两边乘以其中可知,并且可得这表明w2应该是的

3、特征向量,具有第二大特征值类似的,我们可以证明其它维被具有递减的特征值的特征向量给出我们来看另一种推导:如果我们建立一个矩阵C,其第i列是的规范化的特征向量,则,并且其中,是对象矩阵,其对角线元素是特征值,这称为的谱分解由于C是正交的,并且,我们在的左右两边乘以和,得到我们知道如果,则,我们希望它等于一个对角矩阵,于是,可以令在实践中,即使所有的特征值都大于0,我们知道,某些特征值对方差的影响很小,并且可以丢失,因此,我们考虑例如贡献90%以上方差的前k个主要成分,当降序排列时,由前k个主要成分贡献的方差比例为实践中,如果维是高度相关的,则只有很少一部分

4、特征向量具有较大的特征值,k远比n小,并且可能得到很大的维度归约总方差中属于主成分的比例为称为主成分的贡献率。第一主成分的贡献率最大,表明它解释原始变量的能力最强,而的解释能力依次递减。主成分分析的目的就是为了减少变量的个数,因而一般是不会使用所有主成分的,忽略一些带有较小方差的主成分将不会给总方差带来大的影响。前个主成分的贡献率之和称为主成分的累计贡献率,它表明解释的能力。通常取较小的k,使得累计贡献达到一个较高的百分比(如80%~90%)。此时,可用来代替,从而达到降维的目的,而信息的损失却不多。主成分分析的应用在主成分分析中,我们首先应保证所提取的

5、前几个主成分的累计贡献率达到一个较高的水平,其次对这些被提取的主成分必须都能够给出符合实际背景和意义的解释。主成分的解释其含义一般多少带有点模糊性,不像原始变量的含义那么清楚、确切,这是变量降维过程中不得不付出的代价。如果原始变量之间具有较高的相关性,则前面少数几个主成分的累计贡献率通常就能达到一个较高水平,也就是说,此时的累计贡献率通常较易得到满足。主成分分析的困难之处主要在于要能够给出主成分的较好解释,所提取的主成分中如有一个主成分解释不了,整个主成分分析也就失败了。支持向量机(补充讲义)上节课,我们讨论了SVM的分类,这里简略地讨论如何将SVM推广

6、到回归上我们还是使用线性模型:对于回归,我们使用差的平方作为误差:对于支持向量机的回归,我们使用这意味着我们容忍高达的误差,并且超出的误差具有线性而不是平方影响。这种误差函数更能抵制噪声,因而更加鲁棒类似的,我们引入松弛变量来处理超过的偏差其中C是一个训练误差和惩罚项之间的权衡受限于和我们做分类的方法一样,建立拉格朗日函数,然后取它的对偶问题(这里也可以使用核函数),与分类一样,我们也会得到一些支持向量,而回归线将用它们表示.

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。