资源描述:
《非负矩阵分解算法综述》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库。
1、第4期电子学报Vol.36No.42008年4月ACTAELECTRONICASINICAApr.2008非负矩阵分解算法综述1,21,2李乐,章毓晋(11清华信息科学与技术国家实验室,北京100084;21清华大学电子工程系,北京100084)摘要:本文介绍了非负矩阵分解(Non2negativeMatrixFactorization,NMF)的基本原理和性质,将现有NMF算法分为了基于基本NMF模型的算法和基于改进NMF模型的算法两大类,在此基础上较为系统地分析、总结和比较了它们的构造原则、应用特点以及存在的问题,最后预测和分析了未来NMF算法研究的可能
2、方向.关键词:非负矩阵分解;多元数据描述;特征提取中图分类号:TP391文献标识码:A文章编号:037222112(2008)0420737207ASurveyonAlgorithmsofNon2NegativeMatrixFactorization1,21,2LILe,ZHANGYu2jin(11TsinghuaNationalLaboratoryforInformationScienceandTechnology,TsinghuaUniversity,Beijing100084,China;21DepartmentofElectronicEngineer
3、ing,TsinghuaUniversity,Beijing100084,China)Abstract:Thefundamentalsandpropertiesofnon2negativematrixfactorization(NMF)areintroduced,andavailableNMFalgorithmsareclassifiedintotwocategories:basicNMFmodel2basedalgorithmsandimprovedNMFmodel2basedalgorithms.Basedonthese,thedesignprincip
4、les,applicationcharacteristics,andexistingproblemsofthealgorithmsaresystematicallydiscussed.Be2sides,someopenproblemsinthedevelopmentofNMFalgorithmsarepresentedandanalyzed.Keywords:non2negativematrixfactorization;multivariatedatarepresentation;featureextraction[7]种有效数据描述形式.1引言因为纯加性
5、的和稀疏的描述能使对数据的解释变在信号处理、神经网络、模式识别、计算机视觉和图得方便(少量活跃的分量使数据的组成方式变得清晰)[1,8]象工程的研究中,如何构造一个能使多维观测数据被更与合理(许多物理信号中不可能存在负的成分),还好描述的变换方法始终是一个非常重要的问题.通常,因为相对稀疏性的表示方式能在一定程度上抑制由外一个好的变换方法应具备两个基本的特性:(1)可使数界变化(如:部分遮挡、光照变化和物体的旋转等)给特[9]据的某种潜在结构变得清晰;(2)能使数据的维数得到征提取带来的不利影响,所以NMF已逐渐成为信号一定程度的约减.处理、生物医学工程、模
6、式识别、计算机视觉和图像工程主分量分析、线性鉴别分析、投影寻踪、因子分析、等研究领域中最受欢迎的多维数据处理工具之一.具体冗余归约和独立分量分析是一些最常用的变换方法.它说,它目前已被应用到文本分析与聚类、数字水印、人脸们因被施加的限制不同而有着本质的区别,然而,它们检测与识别、图像检索、图像复原、语言建模、声源分类、有两个共同的特点:(1)允许负的分解量存在(允许有音乐信号分析与乐器识别、盲信号分离、网络安全、基因减性的描述);(2)实现线性的维数约减.区别于它们,一及细胞分析等的研究中.种新的变换方法———非负矩阵分解(NonnegativeMatrix
7、从NMF被提出算起,关于NMF的研究已走过了将[1]Factor,NMF)由Lee和Seung在《Nature》上提出,它使分近7个年头,对现有算法的系统性综述已非常必要,然解后的所有分量均为非负值(要求纯加性的描述),并且而,至今国内外尚无此类文章.同时实现非线性的维数约减.NMF的心理学和生理学根据NMF模型中对分解结果的限制是否仅限于非构造依据是对整体的感知由对组成整体的部分的感知负性,本文将现有算法分为基本NMF算法(BasicNMF,[2~6]构成的(纯加性的),这也符合直观的理解:整体是BNMF,基于基本NMF模型)和改进NMF算法(Improv
8、ed[1]由部分组成的,因此它在某种意义上抓住了智能