资源描述:
《厦门大学《应用多元统计分析》试题b答案》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库。
1、多元统计分析试卷B(答案)一、判断并改错对;对;对;对;错(典型相关分析是研究两组变量之间相关关系的一种多元统计方法。)二、解:1)nnnnn⎛⎞E()Z=E⎜cX()⎟=E()cX()=cE()X()=cμ=μc=μ∑ii∑ii∑ii∑i∑i⎝i=0⎠i=0i=0i=0i=0Z是μ的无偏估计量得证;2)X?X独立同分布于N(,)μΣ,1npnnnn()⎛⎞()2()2DZ=D⎜∑ciX()i⎟=∑DciX()i=∑ciDX()i=∑ci∑=c′c∑,⎝i=0⎠i=0i=0i=0且由(1)中结论可知E(Z)=μ''所以,Z~N(,μ
2、ccΣ),其中c=(,,)cc?成立。p1n三、简答题1.最短距离法为类G与G之间的距离为两类最近样品的距离;最长距离法为类Giji与G之间的距离为两类最远样品的距离;中间距离法用介于最长与最短两者之间j的距离;重心法定义类间距离为两类重心(各类样品的均值)的距离;类平均法定义类间距离平方为这两类元素两两之间距离平方的平均数;可变类平均法将G和pGq合并为新类Gr,反映出Gp和Gq之间的距离Dpq的影响;如果中间法的前两项的系数也依赖于β,那么用可变法如果将G和G合并为新类G;离差平方和pqr法则是先将个样品各自成一类,然后每次缩小
3、一类,每缩小一类,离差平方和就n要增大,选择使方差增加最小的两类合并,直到所有的样品归为一类为止2.主成分分析与因子分析的相同点:两者都是一种降维,简化数据的技术;两种方法的求解过程是类似的,都是从协方差出发,利用特征值、特征向量求解。不同点:主成分分析的数学模型本质上是一种线形变换,将原始坐标变换到变异程度最大的方向上,突出数据变异的方向,归纳重要信息。而因子分析是从现在变量去提取潜在因子的过程。3.相应分析指受制于某个载体总体的两个因素为A和B,其中因素A包含个水平,r即AA,,?A;因素B包含c个水平,即B,,BB?。对这两组
4、因素作随机抽样12r12c调查,得到一个r×c的二维列联表,记为K=()k,主要目的是寻求列联表行ijrc×因素A和列因素B的基本分析特征和它们的最优联立表示。基本思想为通过列联表的转换,使得因素A和列因素B具有对等性,这样就可以用相同的因子轴同时描述两个因素各个水平的情况,把两个因素的各个水平的状况同时反映到具有相同坐标轴的因子平面上,直观地描述两个因素A和因素B以及各个水平之间的相关关系。4.典型相关分析是研究两组变量之间相关关系的一种多元统计方法,目的为识别并量化两组变量之间的联系,将两组变量相关关系的分析,转化为一组变量的线
5、性组合与另一组变量线性组合之间的相关关系分析。基本思想为:设()1()()1()1()1′()2(()2()2()2)′X=X,X?X,X=X,X?X是两个相互关联的随机向12p12q量,分别在两组变量中选取若干有代表性的综合变量Ui、Vi,使得每一个综合变量(i)(i)(i)(i)(i)(i)是原变量的线性组合,即U=ax+ax+?+ax,i1122pp()i(i)(i)(i)(i)(i)(1)(1)(1)(2)V=bx+bx+?+bx。在DD()aX′=()bX′=1的条件下,i1122pp使得ρ(,aX(1)(′1)(b1)(
6、′X2))达到最大,aX(1)′(1)、bX(1)′(2)是X(1)、X(2)的第一对典型相关变量。可以类似的求出各对之间互不相关的第二对、第三对等典型相关变(1)(2)量,至两组变量间的相关性被提取完毕。这些典型相关变量就反映了X,X之间的线性相关情况。四、计算题1.解:比较样品X到两总体的马氏距离的大小:2()2()DX,G−DX,G12−1−1=(X−μ)′∑(X−μ)−(X−μ)′∑(X−μ)1112221⎛32-12⎞⎛10⎞1⎛57⎞⎛0⎞=()10,5⎜⎜⎟⎟⎜⎜⎟⎟−(),5-0⎜⎜⎟⎟⎜⎜⎟⎟432⎝-1218⎠⎝
7、5⎠51⎝720⎠⎝-5⎠25⎛32-12⎞⎛2⎞1⎛57⎞⎛0⎞=(),12⎜⎜⎟⎟⎜⎜⎟⎟−(),5-0⎜⎜⎟⎟⎜⎜⎟⎟432⎝-1218⎠⎝1⎠51⎝720⎠⎝5-⎠25500=×98−〈043251所以X属于正态总体G。12.解:由题意得:G1G2G3G4G5G10G240G3690G417100G563580D(0)中最小的元素是D14=1,将G1和G4合并成G6,用最长距离法计算新类与其他类之间的距离,得到新的距离矩阵D(1):G6G2G3G5G60G270G31090G58350D(1)中最小的元素是D25=3,将G2
8、和G5合并成G7,用最长距离法计算新类与其他类之间的距离,得到新的距离矩阵D(2):G6G7G3G60G780G31090然后将G6和G7合并成G8,最后将G8和G3合并成G9,五个样品聚为一类。谱系聚类图:G1G6G4G8G2G7G