基于正相关关联规则的分类算法

基于正相关关联规则的分类算法

ID:33287145

大小:1.21 MB

页数:50页

时间:2019-02-23

基于正相关关联规则的分类算法_第1页
基于正相关关联规则的分类算法_第2页
基于正相关关联规则的分类算法_第3页
基于正相关关联规则的分类算法_第4页
基于正相关关联规则的分类算法_第5页
资源描述:

《基于正相关关联规则的分类算法》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、郑硕士学位授予单位代码:!!!!!学号或申请号:Q!≥!!128密级:——堂论文论文题目:基于正相关关联规则的分类算法作者姓名:学科门类:专业名称:导师姓名、职称:李睿楠工学计算机软件与理论范明教授二零零七年五月基于正相关关联规则的分类算法摘要分类是数据挖掘研究中的一个基本任务,关联规则挖掘是数据挖掘研究中的一个重要领域,把关联规则挖掘用于分类问题开辟了数据分类的一条新路。常见的基于关联规则分类算法通常在训练数据集上生成关联规则的全部集合,然后选择~个高质量的规则子集作为分类规则集去分类和预测测试数据集。研究表明,基于关联规则分类具有高准确率

2、和强适应性的特点。但是,在生成的分类器中,往往会产生大量的分类规则,而其中很大一部分的分类规则可能对分类并没有好处。并且,有时因为选取单一高置信度的规则,使分类结果产生了过分拟合。因此,基于关联规则的分类算法,其关键在于分类器也就是分类规则集的建立。而且对挖掘得到的分类规则集需要有不同的度量去评估其分类性能。如何产生更有意义的关联规则,如何使用有意义的关联规则对测试数据集进行分类,是本文研究的主要内容。本文提出了一种新的关联分类算法CPCAR。该方法对FP.Growth算法进行改进,在频繁项集产生的过程中,引入正相关性的判断,使最后生成的频繁

3、项集是正相关的。并使用正相关的频繁项集得到正相关的初始分类规则集。为了提高分类准确率和效率,再利用置信度对初始分类规则集进行规贝Ⅱ选取,生成由正相关关联规则组成的分类器。分类时,本文算法首先在每个分类器中选取分类规则,这些分类规则可以分类测试事务,每条分类规则都有一个夕权值,然后计算每个分类器中选取出的分类规则的权值和,比较权值和最大的分类器的类标号与测试事务的类标号,两个类标号一致则表示分类正确。最后根据正确分类的测试事务数与总测试事务数得出本文算法在某事务数据集上的分类准确率。实验表明,虽然本文算法在生成分类规则集的时候,删除了大量的关联

4、规则,但是在UCI机器学习的14个数据集中,最终的分类准确率可以与CA.5和CMAR相媲美,且算法运行的时间开销明显降低。关键词:分类;频繁项集;关联规则;正相关基于正相关关联规则的分类算法AbstractClassificationisabasictaskofdataminingresearch,associationrulemiulngisallimportantareaofdataminingresearch,classificationbasedonassociationruleminingbreakanewpathindatacla

5、ssification.ThenormalclassificationbasedONassociationrulealgorithmsusuallymineallassociationrulessetintrainingdatabase.Then曲eyclassifyorpredictthetestdatabasebyahighp叮f湎柚ceclassificationrulesetwhichischosenina11asSOeiafionrulesset.Previousstudiesproposethatclassificationbas

6、edOilassociationrulehashi曲classificationaccuracyandstrongflexibility.However,therearehugeclassificationrulesintheclassifier,andthemostofitarehdplessinclassification.Andclassificationwillbeoverfittingsometimessinceitisbasedononlysinglehigh-confidencerule.Sothekeyofclassifica

7、tionbasedonassociationrulealgorithmsistheconstructingofclassifieri.e.classificationruleset.Weneeddifferentmeasurementstoevaluatetheperformanceoftheclassificationruleset.Themaincontentofthispaperarehowtogetmoremeaningassociationrulesandhowtoelassifytestdatasetsbythemeaningas

8、sociationrules.Inthispaper,weproposeanewassociativeclassificationalgorithm.CPCAR,i

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。