资源描述:
《应用多元统计分析课后习题答案高惠璇(第六章习题解答)》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库。
1、应用多元统计分析第六章部分习题解答1第六章聚类分析6-1证明下列结论:(1)两个距离的和所组成的函数仍是距离;(2)一个正常数乘上一个距离所组成的函数仍是距离;(3)设d为一个距离,c>0为常数,则仍是一个距离;(4)两个距离的乘积所组成的函数不一定是距离;2第六章聚类分析①②③(2)设d是距离,a>0为正常数.令d*=ad,显然有①②3第六章聚类分析③故d*=ad是一个距离.(3)设d为一个距离,c>0为常数,显然有②①4第六章聚类分析故d*是一个距离.③5第六章聚类分析6第六章聚类分析6-2试证明二值变量的相关系数为(6.2.2)式,夹角余弦为(6.2.3)式.证明:设变量Xi和Xj
2、是二值变量,它们的n次观测值记为xti,xtj(t=1,…,n).xti,xtj的值或为0,或为1.由二值变量的列联表(表6.5)可知:变量Xi取值1的观测次数为a+b,取值0的观测次数为c+d;变量Xi和Xj取值均为1的观测次数为a,取值均为0的观测次数为d等等。利用两定量变量相关系数的公式:7第六章聚类分析8第六章聚类分析故二值变量的相关系数为:(6.2.2)9第六章聚类分析利用两定量变量夹角余弦的公式:其中故有10第六章聚类分析6-3下面是5个样品两两间的距离阵试用最长距离法、类平均法作系统聚类,并画出谱系聚类图.解:用最长距离法:①合并{X(1),X(4)}=CL4,并类距离D1
3、=1.11第六章聚类分析②合并{X(2),X(5)}=CL3,并类距离D2=3.③合并{CL3,CL4}=CL2,并类距离D3=8.④所有样品合并为一类CL1,并类距离D4=10.12第六章聚类分析最长距离法的谱系聚类图如下:13第六章聚类分析①合并{X(1),X(4)}=CL4,并类距离D1=1.用类平均法:14第六章聚类分析②合并{X(2),X(5)}=CL3,并类距离D2=3.③合并{CL3,CL4}=CL2,并类距离D3=(165/4)1/2.④所有样品合并为一类CL1,并类距离D4=(121/2)1/2.15第六章聚类分析类平均法的谱系聚类图如下:16第六章聚类分析6-4利用距离
4、平方的递推公式来证明当γ=0,αp≥0,αq≥0,αp+αq+β≥1时,系统聚类中的类平均法、可变类平均法、可变法、Ward法的单调性.证明:设第L次合并Gp和Gq为新类Gr后,并类距离DL=Dpq,且必有Dpq2≤Dij2.新类Gr与其它类Gk的距离平方的递推公式,当γ=0,αp≥0,αq≥0,αp+αq+β≥1时这表明新的距离矩阵中类间的距离均≥Dpq=DL,故有DL+1≥DL,即相应的聚类法有单调性.17第六章聚类分析对于类平均法,因故类平均法具有单调性。对于可变类平均法,因故可变类平均法具有单调性。18第六章聚类分析对于可变法,因故可变法具有单调性。对于离差平方和法,因故离差平方
5、和法具有单调性。19第六章聚类分析6-5试从定义直接证明最长和最短距离法的单调性.证明:先考虑最短距离法:设第L步从类间距离矩阵出发,假设故合并Gp和Gq为一新类Gr,这时第L步的并类距离:且新类Gr与其它类Gk的距离由递推公式可知设第L+1步从类间距离矩阵出发,20第六章聚类分析故第L+1步的并类距离:即最短距离法具有单调性.类似地,可以证明最长距离法也具有单调性.21第六章聚类分析6-6设A,B,C为平面上三个点,它们之间的距离为将三个点看成三个二维样品,试用此例说明中间距离法和重心法不具有单调性.解:按中间距离法,取β=-1/4,将B和C合并为一类后,并类距离D1=1,而A与新类G
6、r={B,C}的类间平方距离为22第六章聚类分析故中间距离法不具有单调性。按重心法,将B和C合并为一类后,并类距离D1=1,而A与新类Gr={B,C}的类间平方距离为当把A与{B,C}并为一类时,并类距离23第六章聚类分析故重心法法不具有单调性。并类过程如下:当把A与{B,C}并为一类时,并类距离ABC24第六章聚类分析解一:利用如果样品间的距离定义为欧氏距离,则有6-7试推导重心法的距离递推公式(6.3.2);25第六章聚类分析26第六章聚类分析27第六章聚类分析解二:因样品间的距离定义为欧氏距离,利用28第六章聚类分析利用29第六章聚类分析故有30第六章聚类分析6-8试推导Ward
7、法的距离递推公式(6.3.3);解:Ward法把两类合并后增加的离差平方和看成类间的平方距离,即把类Gp和Gq的平方距离定义为利用Wr的定义:31第六章聚类分析32第六章聚类分析33第六章聚类分析(当样品间的距离定义为欧氏距离时)记Gr={Gp,Gq},则新类Gr与其它类Gk的平方距离为利用重心法的递推公式(6-7题已证明)可得:34第六章聚类分析35第六章聚类分析6-9设有5个样品,对每个样品考察一个指标得数据为1