欢迎来到天天文库
浏览记录
ID:22670073
大小:199.90 KB
页数:9页
时间:2018-10-30
《数据挖掘考试题》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、数据挖掘考试题一.选择题1.当不知道数据所带标签吋,可以使川哪种技术促使带同类标签的数据与带其他标签的数据相分离?()A.分类B.聚类C.关联分析D.主成分分析2.()将两个簇的邻近度定义为不同簇的所有点对邻近度的平均值,它是一种凝聚层次聚类技术。A.M1N(单链)B.MAX(全链)C.组平均D.Ward方法3.数据挖掘的经典案例“啤酒与尿布试验”最主要是成用了()数据挖掘方法。A分类B预测C关联规则分析D聚类4.关于K均值和DBSCAN的比较,以下说法不正确的是()A.K均伉丢弃被它识別为噪声的对象,IfljDBSCAN一般聚类
2、所有对象。B.K均值使川簇的菽于原型的概念,DBSCAN使川®于密度的概念。C.K均位很难处理非球形的簇和不同人小的簇,DBSCAN可以处理不同人小和不同形状的簇D.K均值可以发现不是明显分离的簇,即便簇有熏佥也可以发现,似足DBSCAN会合并有蜇叠的簇5.下列关于Ward’sMethod说法错误的是:()A.对噪声点和离群点敏感度比较小B.擅长处现球状的簇C.对于Ward方法,两个簇的邻近度定义为两个簇合并时导致的平方误差D.当W个点之间的邻近度取它们之间距离的平方时,Ward方法与组平均非常相似6.下列关于层次聚类存在的问题说
3、法正确的是:()A.具有全局优化tJ标函数B.GroupAverage擅长处现球状的族C.可以处理不同大小簇的能力D.Max对噪声点和离群点很敏感7.下列关于凝聚层次聚类的说法中,说法错误的事:()A.—旦两个簇合卯,该操作就不能撤销A.算法的终止条件是仅剩卜一个簇D.異有全局优化目标函数1.规则{牛奶,尿布卜{啤洒}的支持度和置信度分别为:()TID:集1{曲•包,牛奶}2{面包,尿布,啤酒,鸡蛋}3{牛奶,尿布,啤洒,可乐}4{面包,牛奶,鉍布,啤酒}5{而包,牛奶,尿布,"J乐}A.0.4,0.4B.0.67,0.67C.0
4、.4,0.67D.0.67,0.42.卜*列()是属于分裂层次聚类的方法。A.MinB.MaxC.GroupAverageD.MST3.对下图数据进行凝聚聚类操作,簇间相似度使用MAX计算,笫二步是哪两个簇合并:()11I2I3I4I511121314151.000.900.100.650.200.901.000.700.600.500.100.701.000.400.300.650.600.401.000.800.200.500.300.801.00A.在{3}和{1,2}合并B.{3}和{4,5}合并C.{2,3}和{4,5}
5、合并D.{2,3}和{4,5}形成簇和{3}合并一.填空题:1.属性包括的四种类型:、、、。2.是两个簇的邻近度定义为不同簇的所奋点对邻近度的平均值。3.基本凝聚层次聚类兑法空间复杂度,时间复杂度,如果某个簇到其他所有簇的距离存放在-个有序表或堆屮,层次聚类所需要的吋间复杂度将为。4.聚类中,定义簇间的相似度的方法冇(写出四个):、、、。5.层次聚类技术是第二类重要的聚类方法。两种戻次聚类的基木方法:、01.组平均足一种界于和之间的折中方法。2.相似度矩阵nJ以用相识度表示还以用表示。3.全链在处理大小不同的簇时,对能使破裂,并.
6、R.偏好。4.单链技术擅长于处理,但对和很敏感。5.聚类分析可以看做是一种的分类。(有监督、无监督)一.判断题1.从点作为个体簇开始,每一步合丼两个最接近的簇,这是一种分裂的层次聚类方法。()2.数据挖掘的0标不在于数据采集策略,而在于对己经存在的数据进行模式的发掘。()3.在聚类分析当中,簇內的相似性越大,簇间的差别越大,聚类的效果就越差。()4.当两个点之间的邻近度取它们之间距离的平方时,Ward方法与组平均非常相似。()5.DBSCAN是相对抗噪声的,并能够处理任意形状和大小的簇。()6.属性的性质不必与用来度量他的值的性质
7、相同。()7.全链对噪声点和离群点很敏感。()8.对于非对称的属性,只有非零值方是熏要的。()9.K均位可以很好的处理不同密度的数裾。()10.单链技术擅长处理椭闞形状的簇。()二.综合题1.何为层次聚类?它川哪两种图表示?2.两种层次聚类的基本方法?两种方法的定义?3.分别写出Min、Max和组平均的优缺点?4.写出基木凝聚层次聚类的算法?5.由下图已给岀的距离矩阵,将Max用于6个点样本数据集,両出层次聚类的树状图?P1P2P3P4P5P6P10.000.240.220.370.340.23P20.240.000.140.20
8、0.130.25P30.220.140.000.150.280.11P40.370.200.150.000.290.22P50.340.130.280.290.000.39P60.230.250.110.220.390.00考试题+答案一.选择题1
此文档下载收益归作者所有