资源描述:
《关联规则挖掘中的隐私保护研究》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库。
1、第18卷第10期计算机技术与发展Vol.18No.102008年10月COMPUTERTECHNOLOGYANDDEVELOPMENTOct.2008关联规则挖掘中的隐私保护研究121张瑞,郑诚,陈娟娟(1.安徽大学计算机科学与技术学院,安徽合肥230039;2.安徽大学计算智能与信号处理教育部重点实验室,安徽合肥230039)摘要:数据挖掘中的关联规则反映一个事件和其他事件之间依赖或相互关联的知识。随着大量数据不停地收集和存储积累,人们希望从中发现感兴趣的数据关联关系,从而帮助他们进行决策。随着信息技术的发展,数据挖掘在一些深层次的
2、应用中发挥了积极的作用。但与此同时,也带来隐私保护方面的问题。隐私保护是当前数据挖掘领域中一个十分重要的研究问题,其目标是要在不精确访问真实原始数据的条件下,得到准确的模型和分析结果。为了提高对隐私数据的保护程度和挖掘结果的准确性,提出一种有效的隐私保护关联规则挖掘方法。针对关联规则挖掘中需预先给出最小支持度和最小置信度这一条件,提出了一种简单的事务数据库中事务的处理方法,即隐藏那些包含敏感项目的关联规则的方法,以对相关事务作处理,达到隐藏包含敏感项目的关联规则的目的。理论分析和实验结果均表明,基于事务处理的隐私保护关联规则挖掘方法具
3、有很好的隐私性、简单性和适用性。关键词:隐私保护;联规则;敏感项目中图分类号:TP31115文献标识码:A文章编号:1673-629X(2008)10-0013-03ResearchonPrivacyPreservinginAssociationRulesMining121ZHANGRui,ZHENGCheng,CHENJuan2juan(11SchoolofComputerScienceandTechnologyofAnhuiUniversity,Hefei230039,China;21MinistryofEdu.KeyLab.of
4、IntelligentComputing&SignalProcessing,AnhuiUniv.,Hefei230039,China)Abstract:Associationrulesminingindataminingreflectsrelationsbetweenevents.Withthelargeamountsofdatacollectionandstoragecontinuouslyaccumulated,peoplewanttofinddataassociationswhichtheyareinterestingin,an
5、dtoassistthemindecision-making.Withthedevelopmentsofinformationtechnology,dataminingplaysanactiveroleinapplications.Butatthesametime,ithasbroughtsomeproblemsofprivacypreserving.Privacypreservingiscurrentlyaveryimportantissueinthefieldofdatamining.Theobjectistogetvera2ci
6、ousmodelandanalyzetheresultswithimprecisedataacess.Inordertoraisethelevelofprotectionofdataprivacyandtheaccuracyofminingresults,proposeaneffectiveprivacypreservingmethod.Theminimumsupportandconfidenceshouldbegiveninassociationsmin2ing,againstthis,asimpletransactionshand
7、lingmethodhasbeengiven.Canhidetheassociationswhichcontainsensitiveitemsbythewayofdealingwithtransactions.Theoreticalanalysisandexperimentalresultsshowthat,thismethodbasedontansactionprocessinghasgotgoodprivacy,simplicityandapplicability.Keywords:privacypreserving;associ
8、ationrules;sensitiveitem[1]0引言之间有趣的关联或相关联系。随着大量数据不停地数据挖掘中的关联规则反映一个事件和其他事件收集和存储积累,人们希望从他们的交易数据中发现之间依赖或相互关联的知识。如