Robust Principal Component Analysis

Robust Principal Component Analysis

ID:38584209

大小:520.00 KB

页数:7页

时间:2019-06-15

Robust Principal Component Analysis_第1页
Robust Principal Component Analysis_第2页
Robust Principal Component Analysis_第3页
Robust Principal Component Analysis_第4页
Robust Principal Component Analysis_第5页
资源描述:

《Robust Principal Component Analysis》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、论文阅读报告题目:RobustPrincipalComponentAnalysis?作者:EMMANUELJ.CAND`ES,XIAODONGLI,YIMA,JOHNWRIGHT摘要大数据的降维与减轻规模是科学工程社会等领域的热点也是难点之一.它具有广泛的应用前景和重要的理论研究价值.给定一个数据矩阵,它是低秩成分和稀疏成分的叠加.在适当的假设下,通过解决一个称为"PrincipalComponentPursuit"的非常恰当的凸规划,就可以精确地恢复低秩和稀疏成分.在所有可行的分解方法中,他们选择对核范数与范数的加权组合进行最小化.并表明了原则方法对鲁棒主成分分

2、析的可能性,因为他们的方法和结果证明可以恢复数据矩阵的主成分即使它的元素的正定部分是任意毁坏的.这还拓展到小部分元素丢失的情形中.然后他们讨论解决这种最优问题的算法,以及在视频监控领域的应用现状.这里他们的方法考虑了在混乱背景中的检测目标,在人脸识别领域,提供了一种去除阴影和改善图片中人脸变形的情况的原则方法.对以后的工作启示为开发更好的伸缩性算法来处理大规模数据集.关键词:低秩成分稀疏成分PCP伸缩性算法1、问题的提出最近的大量的高维数据在科学,工程和社会的爆炸给许多领域比如图片,视频,多媒体处理,关联网数据分析,搜索,生物医学成像和生物信息学带来了挑战和机遇.

3、在这样的应用领域中,都需要解决极高维以及广泛条件下矩阵的低秩和稀疏分解问题,本文主要是去解决这些问题.2、理论性研究PCA在今天已经证明是在数据分析与降维方面具有广泛应用的统计工具.然而,剧烈毁坏的观察值的脆弱性经常使他们处于危险状态.一些鲁棒PCA的方法在几十年前就被提议和开发了.那些代表性的方法包括影响函数法,多元切尾法和随机抽样法,交替最小化法.但是,没有一种方法提出关于广泛的条件下强保证的多项式时间算法.我们研究的这个问题可以被认为是鲁棒PCA的理想化版本.此外,这个问题已经被Chandrasekaran以及其他人研究着.他们以公式化为基础,因此结果会有一

4、些不同的性质.问题的解决:假设给定一个数据大型矩阵,它是低秩成分和稀疏成分的叠加,即.这里的是低秩矩阵,是稀疏矩阵.所有成分的大小任意,以及的低维行空间与列空间,维数,的非零项的位置和个数都是未知的.对于这种棘手的问题,文章采用了凸规划来解决,即对核范数与范数的加权组合进行最小化.在弱的条件下,利用低秩矩阵不稀疏这个特点,主成分追求(PCP)通过解决(1.1)来精确的恢复低秩矩阵和稀疏矩阵.这里的表示矩阵的核范数,表示级长向量的范数.以及的奇异值分解为这里的是矩阵的秩,是正的奇异值,,分别是矩阵的左奇异向量和右奇异向量,则参数的关系为,,(1.2)这里的,即把看成

5、长向量的无穷范数,并且假设稀疏成分的稀疏模式被均匀随机的选择.在这些微小的假设下,PCP方法很好的恢复了低秩成分和稀疏成分.当然低秩成分的秩不是很大,稀疏成分合理的稀疏.这篇文章中,,,下面给出主要结果证明的关键步骤,定理1.1假设是的,满足(1.2)式.修正每一个矩阵的符号.假设的支撑集在所有基数为的集中是均匀分布的,以及对于所有的.则存在一个数值常量使得PCP对于是准确恢复的概率至少为(超过支撑的选择),,即,,如果和在这个方程中,和是正的常数.在普通方形矩阵中,是的,PCP中取使得成功的概率至少为,如果和.换句话说,矩阵的奇异值向量或者主成分合理的分布着,它

6、能从任意和完全未知的毁坏模式中(只要它们是随机分布的)恢复的概率接近1.其中的奇异向量不能是尖的.为了避免不明确,关于的模型是,取任意一个矩阵,随机集的项设置零,这就是矩阵.这篇文章的思想主要来源于矩阵完成文献的几个方面,不同的结果是它拓展了矩阵完成的结果以及参数的问题.这里是一个普遍值,即,这对于的生成模型完全未知的情况具有很好的意义.定理1.1的证明依赖于双认证的两个临界性质.其中需要一个消去定理,解随机处理,以及双认证和高尔夫计划的双认证.为了解释本文的思想很容易适用于从欠采样的可能毁坏严重的数据中处理低秩矩阵恢复问题.给出下面的定理:定理1.2假设是的,满

7、足(1.2)式.在所有基数的集中是一致分布的.简单假设,每一个观察元素都是以概率为且独立于其他元素毁坏.则,存在一个数值常量使得PCP关于的精确恢复的概率至少为,也就是,,如果,和.在这个方程中,和是正的常数.在普通方形矩阵中,,PCP关于从毁坏元素中成功的概率至少为,如果.4.数值实验给出理论性结论之后,这篇文章执行数值实验去验证主要结果,使用的是Linetal.[2009a]和YuanandYang[2009]中介绍的增广拉格朗日乘子算法.这一节首先研究了PCP精确地恢复各种密度误差的各种秩的矩阵的能力.降低了迭代计算成本.实验一表明了这篇文章在恢复过程中主张

8、的内容除了

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。