资源描述:
《投影寻踪方法及其应用》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库。
1、投影寻踪方法及其应用金菊良合肥工业大学土木建筑工程学院水利系(邮编230009,电话0551-2903357,JINJL66@126.com)报告内容1投影寻踪方法的基本原理与建模步骤4总结与讨论3基于加速遗传算法的投影寻踪等级评价模型2基于加速遗传算法的投影寻踪聚类模型1投影寻踪方法的基本原理与建模型步骤1.1投影寻踪方法的基本原理投影寻踪(projectionpursuit,PP)方法属于直接由样本数据驱动的探索性数据分析方法。它把高维数据{x(i,j)}通过某种组合投影到低维子空间上{z(i)},对于投影到的构形,采用投
2、影指标函数Q(z(i))来描述投影暴露原系统某种分类排序结构的可能性大小,寻找出使投影指标函数达到最优(即能反映高维数据结构或特征)的投影值z(i),然后根据该投影值来分析高维数据的分类结构特征(如投影寻踪聚类评价模型),或根据该投影值与研究系统的实际输出值之间的散点图构造适当的数学模型以模拟系统输出(如投影寻踪等级评价模型)。1投影寻踪方法的基本原理与建模步骤1.2投影寻踪方法的建模步骤步骤1:高维样本数据的预处理,确定系统输入。步骤2:构造投影指标函数。步骤3:优化投影指标函数。步骤4:建立系统模型。2基于加速遗传算法的投
3、影寻踪聚类模型AGA-PPCE2.1基于加速遗传算法的投影寻踪聚类模型的建立步骤1:评价指标值的归一化处理。设样本集为{x*(i,j)
4、i=1~n,j=1~p}。其中x*(i,j)为第i个样本第j个指标值。为消除各指标值的量纲和统一各指标值的变化范围,可采用下式进行极值归一化处理:式中,xmin(j)、xmax(j)分别为样本集中第j个指标值的最小值和最大值。2基于加速遗传算法的投影寻踪聚类模型AGA-PPCE2.1基于加速遗传算法的投影寻踪聚类模型的建立步骤2:构造投影指标函数。PP方法就是把p维数据{x(i,j)
5、j=1~
6、p}综合成以a=(a(1),a(2),…,a(p))为投影方向的一维投影值z(i)然后根据{z(i)
7、i=1~n}的一维散布图进行分类。式(2.2)中a为单位长度向量。在综合投影值时,要求投影值z(i)的散布特征应为:局部投影点尽可能密集,最好凝聚成若干个点团;而在整体上投影点团之间尽可能散开。据此投影指标函数可构造为Q(a)=SzDz(2.3)式中,Sz为投影值z(i)的标准差,Dz为投影值z(i)的局部密度,即2基于加速遗传算法的投影寻踪聚类模型AGA-PPCE2.1基于加速遗传算法的投影寻踪聚类模型的建立步骤3:优化投影
8、指标函数。当各指标值的样本集给定时,投影指标函数Q(a)只随投影方向a的变化而变化。可通过求解投影指标函数最大化问题来估计最大可能暴露高维数据某类特征结构的最佳投影方向:maxQ(a)=SzDz(2.4)这是一个以{a(j)
9、j=1~p}为优化变量的复杂非线性优化问题,用模拟生物优胜劣汰规则与群体内部染色体信息交换机制的加速遗传算法(AGA)来求解上述问题较为简便和有效。加速遗传算法(AGA)步骤1:模型参数的编码。设码长为e,第j个参数的变化区间为[aj,bj],j=1~p。把这些区间等分成2e-1个子区间:cj=aj+Ij
10、dj(2)式中子区间长度dj=(bj-aj)/(2e-1)是常数;搜索步数Ij为小于2e的十进制整数,是变数;j=1~p(下同)。把Ij转化成e位二进制数{ia(j,k)|,k=1~e}(下同),即式(3):步骤2:初始父代群体的随机生成。生成n组各p个均匀随机数(简称随机数){u(j,i)|,i=1~n},经下式转换成十进制整数。Ij(i)=INT[u(j,i)2e](4)式中INT为取整函数。由式(3)得对应二进制数ia(j,k,i),它们与n组模型参数cj(i)对应,并把它们作为初始父代个体群。编码与解码的逻辑过程:cj
11、(i)~Ij(i)~ia(j,k,i)步骤3:父代个体适应能力评价。把第i组参数代入式(1)得目标函数值fi,fi越小表示模型与观测值拟合得越好,适应能力越强,设第i个个体的适应能力与fi成反比。构造选择概率序列{pi},把[0,1]区间分成n个子区间:(0,p1),(p1,p2),…,[pn-1,pn],它们与n个个体一一对应,fi越小的个体对应的子区间长度越大。步骤4:父代个体的概率选择。生成n个随机数{ui
12、i=1~n},若ui∈[pi-1,pi],则选取第i个父代个体,其二进制数记为ia1(j,k,i)。同理可得另外的
13、n个父代个体ia2(j,k,i)。选择是遗传算法的关键,它体现了优胜劣汰的思想。步骤5:父代个体的杂交。由步4得到的父代个体配对成n对双亲。生成两随机数u1和u2,再转成十进制整数:IU1=INT(1+u1·e),IU2=INT(1+u2·e),设IU1≤IU2(否则互换其值