资源描述:
《星座图与调和曲线图》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库。
1、星座图星座图是将高维空间中的样品点投影到平面上的一个半圆内,用投影点表示样品点。具体的作图步骤是:(1)将数据{Xki}变换为角度{qki},使0£qki£p,常取变换方法如下(极差标准化):k=1,…,ni=1,…,p(2)适当地选一组权系数w1,w2,…,wp,其中wi>0且。重要的变量相应的权数可取大一点。最简单的取法为wp=1/p,i=1,…,p。(3)画出一个半径为1的上半圆及半圆底边的直径。(4)对给定的第k次观测Xk=(Xk1,Xk2,…,Xkp),对应着上半圆内的一个点“·”或“*”和一条由折线表示的路径。路径的折点坐标是ïïîïïíì====
2、åå==nkWVpLWULikiiLkLikiiLk,,1sin,,1cos1)(1)(LLqq星号位于路径的终点,其坐标为(Uk(p),Vk(p))。将这些坐标(U1(1),V1(1)),(U1(2),V1(2)),…,(U1(p),V1(p))所对应的点分别记为o1,o2,…,op,连接o1,o2,…,op即为第一个样品点的路径。从上面表达式不难看出路径终点的横坐标就是点o1到点op的横坐标之和,终点的纵坐标是点o1到点op的纵坐标之和。如果将n个样品点的路径折线和星号位置都画出来,就很像天文学中星座的图象,故称之为星座图。下面对消费数据,使用相同的权数即
3、w1,w2,…,w6=1/6作星座图。调和曲线图调和曲线图是D.F.Andrews1972年提出的三角多项式作图法,所以又称为三角多项式图。其思想是把高维空间中的一个样品点对应于二维平面上的一条曲线。 设p维数据x=(x1,x2,…,xp)',对应的曲线是:上式当t在区间[-π,π]上变化时,其轨迹是一条曲线。 在多项式的图表示中,当各变量的数值太悬殊时,最好先标准化后再作图。这种图对聚类分析帮助很大,如果选择聚类统计量为距离的话,同类的曲线非常靠近拧在一起,不同类的曲线相互分开,非常直观。 调和曲线图有两点优良数学性质:一是保持线性性,二是与一般的欧式
4、距离之间的关系。 上面的变换是一个连续函数,我们定义两个样本X与Y之间的距离为如下平方积分形式(事实上也是一种常用的范数): 愿意复习三角函数积分的可以做一做,其实很简单的。最后可以发现这个距离与欧式距离(后者)有如下关系: 根据这条性质我们马上可以得知前面观察图线聚类的数学依据。