完全加权正负关联规则挖掘及其在教育数据中的应用-论文.pdf

完全加权正负关联规则挖掘及其在教育数据中的应用-论文.pdf

ID:54923284

大小:788.51 KB

页数:8页

时间:2020-05-04

完全加权正负关联规则挖掘及其在教育数据中的应用-论文.pdf_第1页
完全加权正负关联规则挖掘及其在教育数据中的应用-论文.pdf_第2页
完全加权正负关联规则挖掘及其在教育数据中的应用-论文.pdf_第3页
完全加权正负关联规则挖掘及其在教育数据中的应用-论文.pdf_第4页
完全加权正负关联规则挖掘及其在教育数据中的应用-论文.pdf_第5页
资源描述:

《完全加权正负关联规则挖掘及其在教育数据中的应用-论文.pdf》由会员上传分享,免费在线阅读,更多相关内容在应用文档-天天文库

1、第28卷第4期中文信息学报V01.28,No.42014年7月JOURNALOFCHINESEINFORMATIONPROCESSINGJu1.,2014文章编号:1003—0077(2014)04—0068-08完全加权正负关联规则挖掘及其在教育数据中的应用余如,朱朝阳。,黄名选(1.广西教育学院党政办,广西南宁530023;2.广西教育学院数计系,广西南宁530023)摘要:完全加权数据模型的特点是其项目权值分布在各个事务记录中,随着事务记录的不同而变化。现有的加权负关联规则挖掘算法不能适用于完全加权数据模型。该文提出一种新颖的基

2、于概率比和兴趣度的完全加权正负关联规则的挖掘算法,探讨了算法在教育信息化数据中的应用。算法以概率比代替传统的置信度,采用支持度一概率比一兴趣度架构衡量完全加权正负关联规则,获得很好的挖掘效果。以真实的教育数据和文本数据为实验测试集,与现有正负关联规则挖掘算法比较,该文提出的算法更有效、更合理,具有较高的理论价值和应用前景。关键词:概率比;兴趣度;完全加权关联规则;文本挖掘中图分类号:TP391文献标识码:AAll—weightedPositiveandNegativeAssociationRulesMiningandItsApplic

3、ationinEducationDataYURu,ZHUChaoyang,HUANGMingxuan(1.AdministrativeOffice,GuangxiCollegeofEducation,Nanning,Guangxi530023,China;2.DepartmentofMathandComputerScience,GuangxiCollegeofEducation,Nanning,Guangxi530023,China)Abstract:All—weighteddatamodelischaracterizedbyitsi

4、temweightsdistributionineachtransactionrecords,chan—gingwiththedifferenttransactionrecords.Existingminingalgorithmofweightednegativeassociationrulescannotbeappliedall—weighteddatamode1.Inthispaper,anovelminingalgorithmofall—weightedpositiveandnegativeas—sociationrulesis

5、presentedforapplicationineducationdata.Thealgorithmusesprobabilityratioinsteadofthetra—ditionalconfidence.andadopts”support-probabilityratio—interest”frameworktoestimatepositiveandnegativeall—weightedassociationrules.Usingrealeducationa1informationdataandtextdataastests

6、et,thealgorithmproposedinthispaperismoreeffectiveandmorereasonablecomparedwiththeexistingminingalgorithmsofpositiveandneg—ativeassociationrules.Keywords:probabilityratio;interest;all—weightedassociationrules;textmining关联规则挖掘是数据挖掘研究中的一个重要分重要性,其典型的挖掘算法是1993年Agrawal提支,具有极广

7、泛的应用前景,已经成为一个日益流行出的Apriori算法l1]。此后在Apriori算法的基础而重要的研究热点。现有的正负关联规则挖掘研究上,出现了一些改进的挖掘算法,例如,FP—growth可以分为项无加权正负关联规则挖掘、项加权正负算法口等。1997年,Brin等首次提出关联规则中存关联规则挖掘以及项完全加权正负关联规则挖掘等在否定关系【3],2004年,wu等提出一种有效的挖掘3类。正负关联规则算法[4]。近几年来,学者们从不同角项无加权正负关联规则挖掘只考虑项集在数据度和方法提出了有效的正负关联规则挖掘算法_5书]。库中出现的

8、频度,将数据库中各个项目以平等一致项加权正负关联规则挖掘更关注数据库中各个的方式处理,不考虑项集在数据库及各个事务中的项目之间具有不同的权值,项权值在事务数据库中收稿日期:2013—10—24定稿日期:2013—12—2

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。