资源描述:
《高维特征降维技术》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库。
1、高维降维理论与技术吴飞浙江大学计算机学院2009年3月Email:wufei@cs.zju.edu.cn1ReferenceTurk,MatthewA.;Pentland,AlexP.FaceRecognitionusingEigenface,ProcIEEECVPR1991,p586-591M.S.Bartlett,H.M.Lades,andT.J.Sejnowski.IndependentComponentRepresentationsforFaceRecognition,InProc.SPIEConf.onHumanVisionand
2、ElectronicImagingIII,volume3299,pages528-539,1998.JBTenenbaumetc.AGlobalGeometricFrameworkforNonlinearDimensionalityReduction,Science290(5500):2319-2323,22December2000SamT.Roweis,LawrenceK.Saul,NonlinearDimensionalityReductionbyLocallyLinearEmbedding,Science290(5500):2323-
3、2326,22December2000特征降维的意义Complexstimulicanberepresentedbypointsinahigh-dimensionalvectorspaceTheytypicallyhaveamuchmorecompactdescriptionDimensionalityreduction:findingmeaningfulhiddenlow-dimensionalstructures中心极限定律与维数灾难特征降维的意义CurseofDimensionality:维数灾难Thetermdimensionali
4、tycurseisoftenusedasavagueindicationthathighdimensionalitycausesproblemsinsomesituationsThetermwasfirstusedbyBellmanin1967forcombinatorialestimationofmultivariatefunctions.维数如果超过15维,则QueryPoint距离与最远邻居最近,使得欧拉距离失去意义人脑生理特性对特征约减研究的启发由于人脑对外界认知的手段多样而导致获取的信息维数过高,如人脑有三千个听觉神经纤维和一百万
5、个视觉神经纤维(人脑总共大概有100亿左右的神经纤维)如果不进行降维处理将导致人脑对信息处理的效率和精确度下降,因此人脑在对这些感知神经纤维处理时,均通过了复杂的降维处理[Tenenbaum2000]。B.Tenenbaum,V.DeSilva,J.C.Langford,AGlobalGeometricFrameworkforNonlinearDimensionalityReduction,Science290(5500):22,December2000特征约减的必要性:以人脸为例太阳系(宇宙)所有电子总量10的79次方大脑对外界信息感知:
6、只会处理“有意义”部分图形:含有10000三角面片的3D地形模型(丘陵)图象:216*252个象素点(人脸)音频:10000个采样点构成的1秒长度音频(爆炸)视频:25-30帧/秒采样率构成的视频流(运动)什么是特征?特征降维方法:特征人脸方法子空间(Subspace)方法也就是平常说的奇异值分解方法(SingularValueDecomposition)或者主成分分析方法(PrincipleComponentAnalysis)EigenX方法,如Eigen-Eye,Eigen-Finger、Eigen-edge等等方法Turk,Matth
7、ewA.;Pentland,AlexP.FaceRecognitionusingEigenface,ProcIEEECVPR1991,p586-591特征人脸方法已成为经典的算法2009年3月23日GoogleScholar查询得到的引用率特征降维方法奇异值分解理论特征降维方法奇异值分解示列P值越大,丢失信息越少。特征维数很高时,一些特征根很微小,甚至为零,则可以忽略。如果将矩阵A看成由(0.96,1.72)和(2.28,0.96)两个2维的对象组成,为了将这两个对象由2维降维成1维,我们可以如下处理:(0.96,1.72)*(0.6,0.
8、8)=1.952(2.28,0.96)*(0.6,0.8)=2.136形式上而言,2维对象由2维空间被映射到了1维空间,从而被降维特征降维方法隐性语义索引奇异值分解方法在文本分析