cpda考试真题与答案5

cpda考试真题与答案5

ID:21883370

大小:21.13 KB

页数:13页

时间:2018-10-25

cpda考试真题与答案5_第1页
cpda考试真题与答案5_第2页
cpda考试真题与答案5_第3页
cpda考试真题与答案5_第4页
cpda考试真题与答案5_第5页
资源描述:

《cpda考试真题与答案5》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、一、判断题(题数:15,共15.0分)1.定量属性可以是整数值或者是连续值。()正确答案:√2.分类模型的误差大致分为两种:训练误差(trainingerror)和泛化误差(generalizationerror)。()正确答案:√3.在决策树中,随着树中结点数变得太大,即使模型的训练误差还在继续减低,但是检验误差开始增大,这是出现了模型拟合不足的问题。()正确答案:×4.在聚类分析当中,簇内的相似性越大,簇间的差别越大,聚类的效果就越差。()正确答案:×5.聚类分析可以看作是一种非监督的分类。()正确答案:√6.如果一个对象不强属于任何簇,那么该对象是基于聚类的离群点。()正确答

2、案:√7.允许误差应根据错误记录对整个系统可能带来的破坏来确定,通常正是那些低使用率的产品或不常使用的产品为库存误差带来很大麻烦,因此应结合数量方差百分比和绝对值方差来确定误差。()正确答案:√8.召回率反映的是预测为正中的样本中正例的概率。()正确答案:×9.支持度表示前项与后项在一个数据集中同时出现的频率。()正确答案:√10.最大最小值标准化法也叫极值法,该方法适用于已知数据集的最小值或最大值情况。()正确答案:√11.波特五力模型中五个压力来源是供应商议价能力、购买者的议价能力、行业新进入者的威胁、替代产品的威胁及企业内部的管理压力。()(1.0分)1.0分正确答案:×12

3、.异常值在数理统计里一般是指一组观测值中与平均值的偏差超过三倍标准差的测定值。()正确答案:×13.数据可视化可以便于人们对数据的理解。()正确答案:√14.大数据思维,是指一种意识,认为公开的数据一旦处理得当可以为人类急需解决的问题提供答案。()正确答案:√15.资金本身具有时间价值。()正确答案:×二、单选题(题数:30,共45.0分)1.某超市研究销售记录发现,购买牛奶的人很大概率会购买面包,这种属于数据挖掘的哪类问题?()A、聚类分析B、关联规则C、分类分析D、自然语言处理正确答案:B2.以下两种描述分别对应哪两种对分类算法的评价标准?()(a)警察抓杀人犯,描述警察抓的人

4、中有多少个是杀人犯的标准。(b)描述有多少比例的杀人犯给警察抓了的标准。A、Precision,RecallB、Recall,PrecisionC、Precision,ROCD、Recall,ROC正确答案:A3.将原始数据进行集成、变换、维度规约、数值规约是在以下哪个步骤的任务?()A、数据获取B、分类和预测C、数据预处理D、数据可视化正确答案:C4.当不知道数据所带标签时,可以使用哪种技术促使带同类标签的数据与带其他标签的数据相分离?()A、分类B、聚类C、关联分析D、主成分分析正确答案:B5.下面哪种不属于数据预处理的方法?()A、变量代换B、离散化C、聚集D、估计遗漏值正确

5、答案:D6.假设12个销售价格记录组已经排序如下:5,10,11,13,15,35,50,55,72,92,204,215使用等宽划分(宽度为50)方法将它们划分成四个箱,求15在哪个箱子里?()A、第一个B、第二个C、第三个D、第四个正确答案:A7.以下哪些算法是分类算法?()A、DBSCANB、C4.5C、K-MeanD、K-medoids正确答案:B8.以下哪些分类方法可以较好地避免样本的不平衡问题?()A、KNNB、SVMC、BayesD、神经网络正确答案:A9.关于K均值和DBSCAN的比较,以下说法不正确的是()。A、K均值丢弃被它识别为噪声的对象,而DBSCAN一般聚

6、类所有对象B、K均值使用簇的基于原型的概念,而DBSCAN使用基于密度的概念C、K均值很难处理非球形的簇和不同大小的簇,DBSCAN可以处理不同大小和不同形状的簇D、K均值可以发现不是明显分离的簇,即便簇有重叠也可以发现,但是DBSCAN会合并有重叠的簇正确答案:A10.下列不属于关联分析的关键要素的是()A、支持度B、置信度C、满意度D、提升度正确答案:C11.因子分析的主要作用有()A、对变量进行降维B、对变量进行判别C、对变量进行聚类D、以上都不对正确答案:A12.ROC曲线凸向哪个角,代表模型越理想?()A、左上角B、左下角C、右上角D、右下角正确答案:A13.SQL语句中

7、删除表的命令是()A、DROPTABLEB、DELETETABLEC、ERASETABLED、DELETEDBF正确答案:A14.在多元回归模型的检验中,目的是检验每一个自变量与因变量在指定显著性水平上是否存在线性相关关系的检验是()A、r检验B、t检验C、f检验D、DW检验正确答案:B15.()提供的支撑技术,有效解决了大数据分析、研发的问题,比如虚拟化技术、并行计算、海量存储和海量管理等。A、点计算B、线计算C、云计算D、面计算正确答案:C16.智能健康手环的应用

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。