数据挖掘考试题目聚类

数据挖掘考试题目聚类

ID:22288787

大小:58.00 KB

页数:6页

时间:2018-10-28

数据挖掘考试题目聚类_第1页
数据挖掘考试题目聚类_第2页
数据挖掘考试题目聚类_第3页
数据挖掘考试题目聚类_第4页
数据挖掘考试题目聚类_第5页
资源描述:

《数据挖掘考试题目聚类》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、数据挖掘考试题目一一聚类一、填空题1、密度的基于中心的方法使得我们可以将点分类为:、、O2、DBSCAN算法在最坏的情况卜*,吋间复杂度是、空间复杂度是o3、DBSCAN算法的优点是、。4、DBSCAN算法的缺点足处理、的数据效果不好。5、DBSCAN算法的参数有:、。6、簇的有效性的非监督度量常常可以分为两类:、,它常采用的桁标为07、簇的有效性的监督度景通常称为,它度景簇标号与外部提供的标号的匹配程度主要借助c8、在相似度矩阵评价的聚类巾,如果有明显分离的簇,则相似度矩阵应当籼略地足二、选择题1、DBSCAN算法的过程足(B)。①删除噪声点。②每组连通的核心点形成一

2、个簇。③将所冇点标记为核心点、边界点和噪声点。④将毎个边界点指派到一个与之关联的核心点的簇屮。⑤为距离在Eps之内的所奋核心点之间赋予一条边。A:①②④⑤③B:③①⑤②④C:③①②④⑤D:①④⑤②③DO(logm)2、如果有m个点,DBSCAN在最坏的情况卜的吋间复杂度度为(C)。A0(m)BO(mlogm)CO(m2)3、在基本DBSCAN的参数选择方法屮,点到它的K个最近邻的距离十的K选作为哪一个参数(B)。AEpsBMinPtsC质心D边界4、当采用K-距离的力‘法选择DBSCAN的Eps和MinPts参数时,如果设置的K的位太人,则小簇(尺寸小于K的簇)可能会被

3、标记为(A)。A噪声B核心簇C边界簇D以上都不对5、如果处理以下形状的数据时,适宜采川DBSCAN的是(B)A球形BSS形C椭球形D方形6、DBSCAN之所以难以有效处理高维数据,其主要原因是(D)7、簇评佔能够做到(D)①确定数裾集的聚类趋势。②确定正确的簇个数。③比较两个簇集,确定那个更好。④不引用附加信息,评估聚类分析结果对数据拟合情况A①②B②③④C①②③D①②③④8、如果不考虑外部信息,聚类结构的奋良性度景应当采川(A)。A均方差B方差C中位数D均值9、比较不同的聚类或簇时,通常采用相对的簇评佔度S,相对的簇评佔以()米评价不同的聚类或簇。ASSE或熵B簇的大

4、小C簇的形状D簇的密度10、对于DBSCAN,参数Eps固定,当MinPts取值较大时,会导致(B)A能很好的区分各类簇B只宥岛密度的点的聚粜区划为簇,其余划为噪声C低密度的点的聚集区划为簇,其余的划为噪声D无影响三、判断题1、DBSCAN的参数Eps固定吋,MinPts的值越人越好。(错)2、DBSCAN会把所有点划分到各自的簇巾。(错)3、4:所有核心点的Eps半径邻域内的点数都不少于MinPts阈伉。(对)4、SSE在无监矜的簇评佔中能起到很好的作用。(对)5、在通过相似度矩阵评估簇时,如果相似度矩阵是块对角的,说明具有明显分离的簇(对)。6、DBSCAN能够很好

5、的区分原始数据的形状,似受限于川户指定的参数。(对)7、判断簇的个数不属于簇评估。(错)8、在做聚类时,DBSCAN会删掉它汄为足噪声点的数据点。(对)9、DBSCAN的々间g杂度始终都足O(m)。(对)10、K均值可以发现不是明显分离的簇,即便簇冇重叠也可以发现,但是DBSCAN会合并有熏叠的簇。(对)四、简答题1、描述DBSCAN的算法过程。①将所冇点标记为核心点、边界点和噪声点。②删除噪声点。③为距离在Eps之内的所侖核心点之间赋予一条边。④每组连通的核心点形成一个簇。⑤将每个边界点指派到一个与之矢联的核心点的簇中。2、简答DBSCAN的优点与不足。答,优点:DB

6、SCAN是相对抗噪声的,并且能够处理任意形状和大小的簇,缺点:当簇的密度变化过大时,DBSCAN就很难敏感的发现数裾集巾的簇。同时,DBSCAN在处理高维数据时,会冇很大的开销。3、简述DBSCAN算法的核心思想。DBSCAN算法的核心思想足一个簇中除了边界点,毎个点在给定的半径Eps内必须包含不少于PinPts个数据点,这样的点称为核心点。4、确定DBSCAN参数的基木的万法是什么。答:观察点到它的K个最近邻的距离的特性。对于某个K,计算所有点的K距离,以递增的次序排序,绘制排序后的值。在阁中找到曲线拐点,拐点处的函数值为Eps半径,K的值为MinptSo5、簇评估的

7、主要任务是什么。答:①确定数据集的聚类趋势。②确定正确的簇个数。②不引用附加的倌息,评估聚类分析结果对数据的拟合情况。③将聚类分析结果与已知的客观结果比较。④比较两个簇集,确定哪个更好。9、DBSCAN算法的参数确定的®木方法是观察的特性。10、不引用附加的信息,评估聚类分析结果对数据拟合情况属于技术。答案••1、核心点边界点噪声点2、O(n*123456789)O(n)3、耐噪声能够处理任意人小和形状的簇4、高维数裾变密度的5、EPSMinPts6、簇的凝聚忡簇的分离忡均方差(SSE)7、外部指标监督指标的熵8、块对角的9、点到它的第K

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。