欢迎来到天天文库
浏览记录
ID:54923284
大小:788.51 KB
页数:8页
时间:2020-05-04
《完全加权正负关联规则挖掘及其在教育数据中的应用-论文.pdf》由会员上传分享,免费在线阅读,更多相关内容在应用文档-天天文库。
1、第28卷第4期中文信息学报V01.28,No.42014年7月JOURNALOFCHINESEINFORMATIONPROCESSINGJu1.,2014文章编号:1003—0077(2014)04—0068-08完全加权正负关联规则挖掘及其在教育数据中的应用余如,朱朝阳。,黄名选(1.广西教育学院党政办,广西南宁530023;2.广西教育学院数计系,广西南宁530023)摘要:完全加权数据模型的特点是其项目权值分布在各个事务记录中,随着事务记录的不同而变化。现有的加权负关联规则挖掘算法不能适用于完全加权数据模型。该文提出一种新颖的基
2、于概率比和兴趣度的完全加权正负关联规则的挖掘算法,探讨了算法在教育信息化数据中的应用。算法以概率比代替传统的置信度,采用支持度一概率比一兴趣度架构衡量完全加权正负关联规则,获得很好的挖掘效果。以真实的教育数据和文本数据为实验测试集,与现有正负关联规则挖掘算法比较,该文提出的算法更有效、更合理,具有较高的理论价值和应用前景。关键词:概率比;兴趣度;完全加权关联规则;文本挖掘中图分类号:TP391文献标识码:AAll—weightedPositiveandNegativeAssociationRulesMiningandItsApplic
3、ationinEducationDataYURu,ZHUChaoyang,HUANGMingxuan(1.AdministrativeOffice,GuangxiCollegeofEducation,Nanning,Guangxi530023,China;2.DepartmentofMathandComputerScience,GuangxiCollegeofEducation,Nanning,Guangxi530023,China)Abstract:All—weighteddatamodelischaracterizedbyitsi
4、temweightsdistributionineachtransactionrecords,chan—gingwiththedifferenttransactionrecords.Existingminingalgorithmofweightednegativeassociationrulescannotbeappliedall—weighteddatamode1.Inthispaper,anovelminingalgorithmofall—weightedpositiveandnegativeas—sociationrulesis
5、presentedforapplicationineducationdata.Thealgorithmusesprobabilityratioinsteadofthetra—ditionalconfidence.andadopts”support-probabilityratio—interest”frameworktoestimatepositiveandnegativeall—weightedassociationrules.Usingrealeducationa1informationdataandtextdataastests
6、et,thealgorithmproposedinthispaperismoreeffectiveandmorereasonablecomparedwiththeexistingminingalgorithmsofpositiveandneg—ativeassociationrules.Keywords:probabilityratio;interest;all—weightedassociationrules;textmining关联规则挖掘是数据挖掘研究中的一个重要分重要性,其典型的挖掘算法是1993年Agrawal提支,具有极广
7、泛的应用前景,已经成为一个日益流行出的Apriori算法l1]。此后在Apriori算法的基础而重要的研究热点。现有的正负关联规则挖掘研究上,出现了一些改进的挖掘算法,例如,FP—growth可以分为项无加权正负关联规则挖掘、项加权正负算法口等。1997年,Brin等首次提出关联规则中存关联规则挖掘以及项完全加权正负关联规则挖掘等在否定关系【3],2004年,wu等提出一种有效的挖掘3类。正负关联规则算法[4]。近几年来,学者们从不同角项无加权正负关联规则挖掘只考虑项集在数据度和方法提出了有效的正负关联规则挖掘算法_5书]。库中出现的
8、频度,将数据库中各个项目以平等一致项加权正负关联规则挖掘更关注数据库中各个的方式处理,不考虑项集在数据库及各个事务中的项目之间具有不同的权值,项权值在事务数据库中收稿日期:2013—10—24定稿日期:2013—12—2
此文档下载收益归作者所有