数据挖掘试卷-题集.docx

数据挖掘试卷-题集.docx

ID:51437845

大小:44.33 KB

页数:5页

时间:2020-03-24

数据挖掘试卷-题集.docx_第1页
数据挖掘试卷-题集.docx_第2页
数据挖掘试卷-题集.docx_第3页
数据挖掘试卷-题集.docx_第4页
数据挖掘试卷-题集.docx_第5页
资源描述:

《数据挖掘试卷-题集.docx》由会员上传分享,免费在线阅读,更多相关内容在应用文档-天天文库

1、数据挖掘复习题集1.名词解释及简答数据矩阵闭频繁项集,极大频繁项集四分位数极差聚类分析聚类算法DBSCAN中的密度可达与密度相连简述数据清理的任务简述k-means聚类与k-中心点聚类的相似与不同之处2.填空题(1)计算sin(45o)的Matlab命令是(2)假设x=10,计算的Matlab命令是(3)Matlab中清除显示内容的命令是(4)Matlab中清除变量y的命令是(5)Matlab中有矩阵a=[123;456;789],执行a(2,:)=[]后,a的值为。(6)Matlab中绘制曲线的基本命令是。(7)数据质量涉及许多因素,包括,,,时效性,可信性和可解

2、释性。(8)属性的类型由该属性可能具有的值的集合决定,属性类型包括,,序数的或数值的。(9)KDD过程包括:,数据集成,数据选择,数据变换,数据挖掘,模式评估,和。(10)一个模式是有趣的,如果它是,在某种程度上在新的或测试数据上是有效的,,新颖的,或验证了用户希望证实的某种假设。(11)数据对象又称为样本、、数据点、或。(12)数值属性可以被分为属性和属性(13)常见的数据的可视化技术有基于的技术,几何投影技术,基于的技术以及层次的和基于图形的技术。(14)支持度和是规则兴趣度的两种度量。3.选择题:1)Matlab中,执行a=-4:4;b=reshape(a,3

3、,3)后b的值是()。D.报错C.[-4-4-4;444;444]B.[-4-12;-303;-214]A.[-4-3-2;-101;234]2)在MATLAB中,列出当前工作空间变量名的函数是(A)who(s)(B)clc(C)path(D)draw1)已知,则在MATLAB中调用命令A(3)的结果为(A)3(B)2(C)无结果(D)72)MATLAB对图形窗口进行灵活分割的命令为(A)plot(B)subplot(C)aplot(D)ploval3),,则A.*B=(A)运算不执行,因有错(B)683(C)574(D)6634)MATLAB中保持图形窗口不关闭的

4、命令为(A)alter(B)holdon(C)holdoff(D)cd5)MATLAB中a=[2,3,1],则b=a.^2的结果为(A)b=[4,6,1](B)b=[4,9,1](C)b=[4,6,2](D)执行出错,无结果6)MATLAB中给变量w赋空矩阵的语句为(A)w=zeros()(B)w=[](C)w=zeros(0,0)(D)clearw7)某超市研究销售纪录数据后发现,买啤酒的人很大概率也会购买尿布,这种属于数据挖掘的哪类问题?()A.关联规则发现B.聚类C.分类D.自然语言处理8)假设12个销售价格记录组已经排序如下:5,10,11,13,15,35

5、,50,55,72,92,204,215使用如下每种方法将它们划分成四个箱。等频(等深)划分时,15在第几个箱子内?()A第一个B第二个C第三个D第四个9)上题中,等宽划分时(宽度为50),15又在哪个箱子里?()10)下面哪个不属于数据的属性类型:()A标称B序数C区间D相异11)在上题中,属于定量的属性类型是:()12)只有非零值才重要的二元属性被称作:()A计数属性B离散属性C非对称的二元属性D对称属性13)以下哪种方法不属于特征选择的标准方法:()A嵌入B过滤C包装D抽样14)熵是为消除不确定性所需要获得的信息量,投掷均匀正六面体骰子的熵是:()A1比特B2

6、.6比特C3.2比特D3.8比特15)假设属性income的最大最小值分别是12000元和98000元。利用最大最小规范化的方法将属性的值映射到0至1的范围内。对属性income的73600元将被转化为:()A0.821B1.224C1.458D0.71616)假定用于分析的数据包含属性age。数据元组中age的值如下(按递增序):13,15,16,16,19,20,20,21,22,22,25,25,25,30,33,33,35,35,36,40,45,46,52,70,问题:使用按箱平均值平滑方法对上述数据进行平滑,箱的深度为3。第二个箱子值为:()A18.3B

7、22.6C26.8D27.91)考虑值集{12243324556826},其四分位数极差是:()A31B24C55D32)一所大学内的各年纪人数分别为:一年级200人,二年级160人,三年级130人,四年级110人。则年级属性的众数是:()A一年级B二年级C三年级D四年级3)下列哪个不是专门用于可视化时间空间数据的技术:()A等高线图B饼图C曲面图D矢量场图4)在抽样方法中,当合适的样本容量很难确定时,可以使用的抽样方法是:()A有放回的简单随机抽样B无放回的简单随机抽样C分层抽样D渐进抽样5)以下哪些算法是分类算法,()A,DBSCANB,C4.5C,K-Me

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。