欢迎来到天天文库
浏览记录
ID:23282402
大小:1.09 MB
页数:22页
时间:2018-11-06
《教材部分习题参考答案(发布版).pdf》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库。
1、部分习题参考答案第1章认识数据挖掘1.对于以下问题,考虑使用有指导的学习方法、无指导的聚类方法和数据查询方法中的哪一种更为合适。若使用有指导的学习方法,请确定可能的输入属性和输出属性。略。2.定义“成功人士”的概念。确定概念中的属性特征,并分别从传统角度、概率角度和样本角度描述这个概念。略。3.为表1.1感冒类型诊断数据集画一张前馈神经网络图。说明:7个输入属性——Increased–lym(淋巴细胞升高)、Leukocytosis(白细胞升高)、Fever(发烧)、Acute-onset(起病急)、Sore-throat(咽痛)、Cooling-effect(退热效果)、Grou
2、p(群体发病),1个输出属性——Cold-type(感冒类型)。网络结构包括7个输入结点和1个输出结点,选择9个隐藏层结点。4.假设有两个类,各有100个实例。第一个类中的实例是患有病毒性感冒(Cold-type=Viral)的患者数据。第二个类中的实例是患有细菌性感冒(Cold-type=Bacterial)的患者数据。根据以下规则回答下面的问题。IFIncreased–lym(淋巴细胞是否升高)=Yes&Sore-throat(是否有咽痛症状)=NoTHENCold-type=Viral(ruleaccuracy=80%,rulecoverage=60%)(1)患有病毒性感冒的
3、患者中有多少人淋巴细胞升高且没有咽痛症状?60(2)患有细菌性感冒的患者中有多少人淋巴细胞升高且没有咽痛症状?60/0.8-60=155.在不使用Sore-throat(咽痛)属性的情况下,使用Weka软件为表1.1建立一棵决策树,解1释和评估结果,并对表1.2中的实例进行分类。决策树(C4.5)检验数据为训练集,分类正确率80%,模型性能一般。分类表1.2中的两个实例结果:第一个实例被分类为患有细菌性感冒(Cold-type=Bacterial),第二个实例被分类为患有病毒性感冒(Cold-type=Viral)。6.访问UCI网站,选择一个数据集,使用Weka软件进行有指导的学
4、习、无指导的聚类和关联分析,并解释和评估结果。略。第2章基本数据挖掘技术1.关联规则和传统的用于分类的产生式规则有什么异同?关联规则与传统的用于分类的产生式规则有两点不同。(1)在某条关联规则中以前提条件出现的属性可以出现在下一条关联规则的结果中。(2)传统的用于分类的产生式规则的结果中仅能有一个属性,而关联规则中则允许其结果包含一个或多个属性。2.对于K-means算法,最优聚类的评判标准是什么?K-means算法的最优聚类通常为:簇中所有实例与簇中心的误差平方和最小。3.设计方案解决K-means算法缺乏对所发现内容进行解释的问题。提示:尝试使用决策树算法对K-means算法形
5、成的簇的定义进行解释。略。4.画出使用Partner作为根节点的决策树,并写出决策时的产生式规则。2PartnerYesNo1Yes3NoCourses<=5>56Yes3No2No(1)IFPartner=YesandCourses<=5THENPlay=Yes正确率:6/8=75%覆盖率:6/7=85.7%(2)IFPartner=YesandCourses>5THENPlay=No正确率:3/3=100%覆盖率:3/8=37.5%(3)IFPartner=NoTHENPlay=No正确率:3/4=75%覆盖率:3/8=37.5%5.计算使用Partner作为根节点的增益率值。
6、(1)Info(I)=-(7/15log2(7/15)+8/15log2(8/15))=0.996792≈0.9968(2)Info(I,Partner)=11/15Info(Yes)+4/15Info(No)=0.9453其中:Info(Yes)=-(6/11log2(6/11)+5/11log2(5/11))=0.9940Info(No)=-(1/4log2(1/4)+3/4log2(3/4))=0.8113(3)SplitsInfo(Partner)=-(11/15log2(11/15)+4/15log2(4/15))=0.8366(4)Gain(Partner)=Info(
7、I)-Info(I,Partner)≈0.9968-0.9453=0.0515(5)GainRatio(Partner)=Gain(Partner)/SplitsInfo(Partner)=0.0515/0.8366=0.06166.计算使用Temperature作为根节点的增益率值。(1)Info(I)=-(7/15log2(7/15)+8/15log2(8/15))=0.996792≈0.9968(2)Info(I,Temperature)=3/15Info(-1
此文档下载收益归作者所有