数据挖掘与分析1

数据挖掘与分析1

ID:44421457

大小:199.41 KB

页数:6页

时间:2019-10-21

数据挖掘与分析1_第1页
数据挖掘与分析1_第2页
数据挖掘与分析1_第3页
数据挖掘与分析1_第4页
数据挖掘与分析1_第5页
资源描述:

《数据挖掘与分析1》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库

1、《数据挖掘与分析》自测题A(时间为120分钟)一、填空题(每题2分,共20分)1、数据西宀,…宀的上四分位数2表示:人体上整批数据的%的观测值不超过上四分位数。2、利用正态。°图可以作直观的正态性检验,若止态图上的点,可以认为样本数据来自正态总体。3、概括地讲,_个检验的〃值是4、在与回归系数冇关的假设检验中,全模型与约简模型的残差平方和SSE(F)和SSE(R)的大小关系为C5、对于线性回归模型Y=A)+01X】+02*2+03*3+£,检验Xi,X2和X3的交叉乘积项对Y的综合影响是否显著,建立的全模型是o912—1SSE/

2、?;(p)=l-(——)—匕6、以修正的复相关系数n~PSST作为回归方程的评选准则,称为修正的复相关系数准则。7、在单因素方差分析中,利用误差平方和S'e得到的误差方差k的无偏估计是•8、设随机向量X=(X],X2,Xj的协差矩阵的特征值人=5.83,=2.00,入=°・17,X的笫一主成分提取的总信息的份额为oP10.4_7I工=9、设2(1,2)',y=(3,0)‘是来自协差阵为L°・41」的总体G的两个样品,贝F,y之间的马氏平方距离为O10、在两个总体的贝叶斯判別中,当训练样本是在口然状态下观察得到时,若总体久⑦的训

3、练样本的容量分别为20和30,贝慄用“按比例分配”原则确定的先验概率为P-P1=9o二、单项选择题(每题2分,共10分)1、在以下表示数据位宜的数字特征中,既能充分利用样本信息乂具有较强稳健性的是。人均值B.中位数C.分位数D.三均值2、若总体的偏度峰度°2>°,则总体分布o人向左侧更为扩展且细尾B.向右侧更为扩展且细尾C・向左侧更为扩展且粗尾D.向右侧更为扩展且粗尾3、两因素等重复试验下的方差分析,误差方羌"2的无偏估计为。A•因素A的均方MSaB.误差均方MSeC.交互效应的均方MSabd因素3的均方MS〃4、在采用厶距离

4、进行快速聚类时,最终聚点•&是每一类的中位向量且有较强的稳健性B.是每一类的中位向量且不具有抗扰性C•是每一类的均值向量门有较强的稳健性D・是每一类的均值向量不具冇抗扰性5、下图(1)(2)分别是以因变虽y和自变量X?的观测值为横坐标的残差图,由残差图分析知O4谋差的等方差性假定不合理B回归函数可能是非线性的,需要引进二次项或交义乘积项C拟合值线性趋势未完全消除,可能遗漏与Y有线性关系的H变量D・回归方程中应引进X?的二次项,即回归函数关于*2非线性。三、分析计算题(每题10分,共20分)1、对于回归模型开~+0"1+02兀/2

5、+爲兀1兀*2+几J^T+吕•,‘=1,2,_・,比,假定误差项独立同分布于n(Oq'),写出检验假设=°的约简模型、检验统计量及其零分布。2、设有两个二维正态总体“2(〃[塔)"2(“2,22),X=(2,l)‘为待判样品,若=■10.9_—■10.5__0_0.910.51_“1二“2二,均值向量为0,(1)试判断X來自哪一个总体?四、应用题(每题15分,共30分)1、从1975年1月到1976年12月,对纽约证券所的三种化工股票和两种石汕股票的周反弹率进行连续100周的观测(英中周反弹率二木周五收盘价-上周五收盘价),求得

6、其样木相关系数矩阵为1.0000.5771.000R=0.5090.5991.0000.3870.3890.4361.0000.4620.3220.4260.5231.000利用SASProcprincompii程,求得其特征值和止交单位化特征向量为人=2.53=(0.34,0.54,0.37,-0.46,-0.49)^=1.184=(0.69,-0・14,-0.47,-0.40,0.34)入=0.824=(-0」9,一0.2&0.60,-0.51,0.51)4=0.464=(0.50,-0.61,0.41,0.32,-0.32

7、)入=0=(0.35,0.48,0.31,0.51,0.53)(1)计算这两个主成分的方差贡献率,前两个主成分的累计方差贡献率以及用这两个主成分代替原來五个变量的信息损失。(2)对这两个主成分的意义作一个合理的解释。2、为比较同类型的三种不同食谱的营养效果,将19只幼鼠随机分为三纽,每组分别为9只、5只和7只,各采用这三种食谱喂养,假定其他条件均保持相同,12周后侧得其体重增加值如下表:食谱体重增加量甲164190203205206214228257244乙185197201231212丙28721221522024826528

8、1设体重增加数据服从方差分析模型,SAS过程为:dataexamp3_l;inputrecipe$weight@@;cards;al164al190al203al205al206al214al228al257al244a2185a2197a2201a2231a2

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。