教材部分习题参考答案(发布版).pdf

教材部分习题参考答案(发布版).pdf

ID:23282402

大小:1.09 MB

页数:22页

时间:2018-11-06

教材部分习题参考答案(发布版).pdf_第1页
教材部分习题参考答案(发布版).pdf_第2页
教材部分习题参考答案(发布版).pdf_第3页
教材部分习题参考答案(发布版).pdf_第4页
教材部分习题参考答案(发布版).pdf_第5页
教材部分习题参考答案(发布版).pdf_第6页
教材部分习题参考答案(发布版).pdf_第7页
教材部分习题参考答案(发布版).pdf_第8页
教材部分习题参考答案(发布版).pdf_第9页
教材部分习题参考答案(发布版).pdf_第10页
资源描述:

《教材部分习题参考答案(发布版).pdf》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、部分习题参考答案第1章认识数据挖掘1.对于以下问题,考虑使用有指导的学习方法、无指导的聚类方法和数据查询方法中的哪一种更为合适。若使用有指导的学习方法,请确定可能的输入属性和输出属性。略。2.定义“成功人士”的概念。确定概念中的属性特征,并分别从传统角度、概率角度和样本角度描述这个概念。略。3.为表1.1感冒类型诊断数据集画一张前馈神经网络图。说明:7个输入属性——Increased–lym(淋巴细胞升高)、Leukocytosis(白细胞升高)、Fever(发烧)、Acute-onset(起病急)、Sore-throat(咽痛)、Cooling-effect(退热效果)、Grou

2、p(群体发病),1个输出属性——Cold-type(感冒类型)。网络结构包括7个输入结点和1个输出结点,选择9个隐藏层结点。4.假设有两个类,各有100个实例。第一个类中的实例是患有病毒性感冒(Cold-type=Viral)的患者数据。第二个类中的实例是患有细菌性感冒(Cold-type=Bacterial)的患者数据。根据以下规则回答下面的问题。IFIncreased–lym(淋巴细胞是否升高)=Yes&Sore-throat(是否有咽痛症状)=NoTHENCold-type=Viral(ruleaccuracy=80%,rulecoverage=60%)(1)患有病毒性感冒的

3、患者中有多少人淋巴细胞升高且没有咽痛症状?60(2)患有细菌性感冒的患者中有多少人淋巴细胞升高且没有咽痛症状?60/0.8-60=155.在不使用Sore-throat(咽痛)属性的情况下,使用Weka软件为表1.1建立一棵决策树,解1释和评估结果,并对表1.2中的实例进行分类。决策树(C4.5)检验数据为训练集,分类正确率80%,模型性能一般。分类表1.2中的两个实例结果:第一个实例被分类为患有细菌性感冒(Cold-type=Bacterial),第二个实例被分类为患有病毒性感冒(Cold-type=Viral)。6.访问UCI网站,选择一个数据集,使用Weka软件进行有指导的学

4、习、无指导的聚类和关联分析,并解释和评估结果。略。第2章基本数据挖掘技术1.关联规则和传统的用于分类的产生式规则有什么异同?关联规则与传统的用于分类的产生式规则有两点不同。(1)在某条关联规则中以前提条件出现的属性可以出现在下一条关联规则的结果中。(2)传统的用于分类的产生式规则的结果中仅能有一个属性,而关联规则中则允许其结果包含一个或多个属性。2.对于K-means算法,最优聚类的评判标准是什么?K-means算法的最优聚类通常为:簇中所有实例与簇中心的误差平方和最小。3.设计方案解决K-means算法缺乏对所发现内容进行解释的问题。提示:尝试使用决策树算法对K-means算法形

5、成的簇的定义进行解释。略。4.画出使用Partner作为根节点的决策树,并写出决策时的产生式规则。2PartnerYesNo1Yes3NoCourses<=5>56Yes3No2No(1)IFPartner=YesandCourses<=5THENPlay=Yes正确率:6/8=75%覆盖率:6/7=85.7%(2)IFPartner=YesandCourses>5THENPlay=No正确率:3/3=100%覆盖率:3/8=37.5%(3)IFPartner=NoTHENPlay=No正确率:3/4=75%覆盖率:3/8=37.5%5.计算使用Partner作为根节点的增益率值。

6、(1)Info(I)=-(7/15log2(7/15)+8/15log2(8/15))=0.996792≈0.9968(2)Info(I,Partner)=11/15Info(Yes)+4/15Info(No)=0.9453其中:Info(Yes)=-(6/11log2(6/11)+5/11log2(5/11))=0.9940Info(No)=-(1/4log2(1/4)+3/4log2(3/4))=0.8113(3)SplitsInfo(Partner)=-(11/15log2(11/15)+4/15log2(4/15))=0.8366(4)Gain(Partner)=Info(

7、I)-Info(I,Partner)≈0.9968-0.9453=0.0515(5)GainRatio(Partner)=Gain(Partner)/SplitsInfo(Partner)=0.0515/0.8366=0.06166.计算使用Temperature作为根节点的增益率值。(1)Info(I)=-(7/15log2(7/15)+8/15log2(8/15))=0.996792≈0.9968(2)Info(I,Temperature)=3/15Info(-1

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。