数据挖掘技术第九常用分类方法.ppt

数据挖掘技术第九常用分类方法.ppt

ID:61916162

大小:672.01 KB

页数:36页

时间:2021-03-29

数据挖掘技术第九常用分类方法.ppt_第1页
数据挖掘技术第九常用分类方法.ppt_第2页
数据挖掘技术第九常用分类方法.ppt_第3页
数据挖掘技术第九常用分类方法.ppt_第4页
数据挖掘技术第九常用分类方法.ppt_第5页
资源描述:

《数据挖掘技术第九常用分类方法.ppt》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、数据挖掘技术第九课 常用分类方法主要内容基于规则的分类基于实例的分类基于规则的分类(Rule-BasedClassifier)使用形如“if…then…”的规则集对记录进行分类。规则:(Condition)y其中:Condition是属性-值对的合取y是类标记分类规则的例子:(BloodType=Warm)(LayEggs=Yes)Birds(TaxableIncome<50K)(Refund=Yes)Evade=No示例R1:(GiveBirth=no)(CanFly=yes)BirdsR2:(GiveBirth=no)(LiveinWater=yes)Fis

2、hesR3:(GiveBirth=yes)(BloodType=warm)MammalsR4:(GiveBirth=no)(CanFly=no)ReptilesR5:(LiveinWater=sometimes)Amphibians基于规则的分类的应用若实例x的属性值满足规则的条件,则称规则r覆盖了实例xR1:(GiveBirth=no)(CanFly=yes)BirdsR2:(GiveBirth=no)(LiveinWater=yes)FishesR3:(GiveBirth=yes)(BloodType=warm)MammalsR4:(GiveBirth=

3、no)(CanFly=no)ReptilesR5:(LiveinWater=sometimes)AmphibiansTheruleR1coversahawk=>BirdTheruleR3coversthegrizzlybear=>Mammal分类规则的类别互斥规则(Mutuallyexclusiverules)若规则互相独立,则称分类器包含互斥规则每条记录最多被一条规则所覆盖无遗漏规则(Exhaustiverules)若分类器考虑了所有可能的属性值的组合,则该分类器具有无遗漏的覆盖每条记录至少被一条规则所覆盖规则可以约简InitialRule:(Refund=No)(St

4、atus=Married)NoSimplifiedRule:(Status=Married)No规则约简的效果规则有可能不再互斥一条记录有可能调用多条规则解决方案对规则集进行排序使用投票的方式规则有可能存在遗漏一条记录可能不满足任何一条规则解决方案使用默认类别利用规则进行分类R1:(GiveBirth=no)(CanFly=yes)BirdsR2:(GiveBirth=no)(LiveinWater=yes)FishesR3:(GiveBirth=yes)(BloodType=warm)MammalsR4:(GiveBirth=no)(CanFly=no)Re

5、ptilesR5:(LiveinWater=sometimes)AmphibiansAlemurtriggersruleR3,soitisclassifiedasamammalAturtletriggersbothR4andR5Adogfishsharktriggersnoneoftherules有序规则集根据优先权对规则进行排序对一个待分类的记录若满足多条规则,则使用排在最前面的对其进行分类。若不满足任何规则,则使用默认类别。R1:(GiveBirth=no)(CanFly=yes)BirdsR2:(GiveBirth=no)(LiveinWater=yes)Fish

6、esR3:(GiveBirth=yes)(BloodType=warm)MammalsR4:(GiveBirth=no)(CanFly=no)ReptilesR5:(LiveinWater=sometimes)Amphibians规则排序基于规则的排序根据规则的质量进行排序基于类别的排序根据规则的类别进行排序规则的覆盖度与正确性规则的覆盖度(Coverage):满足规则条件的记录的百分比规则的正确性(Accuracy):在满足规则条件的记录中,也满足规则结论的记录的百分比(Status=Single)NoCoverage=40%,Accuracy=50%构造分类规则直

7、接方法:直接从数据中提取规则e.g.RIPPER,CN2,Holte’s1R间接方法:从其它分类模型中提取规则、e.g.decisiontrees,neuralnetworks,etc直接方法:顺序覆盖顺序覆盖(SequentialCovering)(1)初始值为空规则集(2)使用Learn-One-Rule函数得到一条新规则(3)从训练集中删去被新产生的规则所覆盖的实例(4)重复步骤(2)和步骤(3),直到满足停止标准为止。示例示例顺序覆盖的要点产生规则消除实例规则评价停止标准

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。