资源描述:
《广义主元分析.doc》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库。
1、广义主元分析(gpca)GPCA算法是基于PCA算法改进的非线性方法,该方法运用在运动分割中有优良表现。PCA目的是将D维的样本空间映射到d维(d<=D)的线性空间中,以达到降维的效果,PCA可以直接用奇异值分解(SUV)的计算方法求解,可获得一组新的正交基描述新的样本空间,以去除样本数据空间存在的冗余和干扰。PCA有一关键假设:在求正交基时,假设它们是标准正交的线性组合。问题简化为:。但PCA算法使用单一模型分割子空间单一,需事先通过先验知识指定分割后子空间S的维数。因此算法局限性大。GPCA算法现实中很多数据集的映射到高维空间中后,数据分布不符合单一线性模
2、型,就无法有效表示数据。因此用混合线性模型(HybridLinearModel)进行数据集合估计。问题1:对于给定样本点,将其分割到个子空间,其中子空间的维数,。在未知数据归属下,解决如下问题:1.求解出子空间的数目n和维数集合;2.求解每个子空间的基;3.求解对应属于每个子空间的样本点;根据子空间维数不同,子空间可包含线性模型,平面模型,超平面模型等。在求1时,可估计相应子空间模型属性。问题1求解是循环问题,如要得到子空间模型,就必须先知道数据集的分类,然后对每一类数据建模。要知道数据所属类别,就需知道子空间的模型。大多数方法是随机的为每个子空间选取一组基,
3、然后通过迭代运算来估计数据分割和子空间分布,比如算法,算法等等。但是,大多数这样的迭代算法对于初始值是敏感的,换句话说,他们都最终得到的是局部优解而不是全局优解。在文[18]提出了新的方法,使得子空间分割不再要求初始化。如果可计算获得子空间的数目,使用等简单聚类算法去分割数据,使用算法去获得每个类的基,那么仅仅使用代数的方法就可以处理子空间分割的问题。对于数据集中的任意点,必满足,其中为所子空间的正交向量。原始数据集为,假设数据集中的数据处于n个不同的线性子空间,子空间的维数为,在文[22]中证明,估计n个不同的线性子空间可以统一得到估计n个维数为的线性子空间
4、的问题。估计n个维的线性子空间的问题又可以通过下面的方法求解:假设这n个维的线性子空间的正交向量为,。对于则有。那么,对于任何都有。估计n个维的线性子空间的问题,实际上的核心问题在于求解n个子空间的基,即为正交向量。而与数据集中的数据组成线性齐次方程。可得到,其中为X的K个分量,是x的范德默矩阵,而C向量是正交向量的线性组合。有下式成立:但是子空间的个数n还是未知,文献[18]中证明可以根据下面这条原则求解n:若多项式的次数小于n,那么X中并非所有点x能使得多项式2-5成立,则需满秩,;如果多项式的次数大于n,那么所有数据点都能够使得多项式成立,。所以可以从的
5、秩来判断子空间的数据n,即:总结式2-6,则子空间数目的求解方法,可以用式2-7表达。但是在有噪声的情况下,经常满秩,的秩可以定义为:式中为的第个奇异值,为预设的阈值。根据上述的推导过程,当求得子空间的个数n,就可以解出多项式的系数C,再通过分割算法得到,就得到了各个子空间的基,数据集的每个向量所属子空间就是与该向量距离最近的子空间。对于不同子空间,其不同利用代数等式可表达在的不同.M.Dinga,Z.Tian,andH.Xue,AdaptiveKernelPrincipalComponentAnalysis[J].SignalProcessing,Volum
6、e,90(5),2010GPCA算法在彩色车辆视频运动分割中的应用南京邮电大学丛露薇.