欢迎来到天天文库
浏览记录
ID:33394942
大小:1.31 MB
页数:47页
时间:2019-02-25
《基于隐私保护的分类规则挖掘问题研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、东南大学硕士学位论文基于隐私保护的分类规则挖掘问题研究姓名:许娟申请学位级别:硕士专业:计算机应用技术指导教师:孙志挥20070101摘要数据挖掘楚数据库研究领域中最活跃盼分支之~,在秘学研究和银行、电信,保狳、零售等艨耀领域囊嚣驭得了缀多的成皋。但数揍挖掘也带来了一蹙社会阉题,尤其是信息安全和隐私保护问题褥到了广j眨的关注。因此,如何在保证隐私的情况下挖掘出有用的信息爵成为近年来数据挖掘领域研究熬热点之一。举文主要探讨基于隐私保护的分类规则挖掘问题,根据数据分布方式,分类规则挖掘所用到蠡孽数l霉集莓分鸯集串式羲攥集嚣分枣凌鼗据繁,本
2、文分澍瓣这嚣耱祷嚣遴程7研究。觜先,针对不同的数据分布方式,本文分别分析和介绍丁当前几种典型的隐私保护结类规则挖掘算法.其次,针对集中式数据集,本戈提出了一种有效的基于随机投影的数据扰乱方法,并基于此方法提出了两种具体的算法:PBB分类算法和PBP分攒算法.通过分析和实验可以看遗,零文提出灼热撂扰魏方法,出予在维数上进行了压缩,艨以对新蠢的数据炎型都能提供有效的隐私保护.并且缀此方法扰乱后的数据适用予多种分樊算法.臆这些算法具有计算开镑拳、糖廑毫豹忧熹。本文还针对分布式数据集,络出了一种基于投影的分类规则挖掘模型,再基于此横型提出了一
3、种具体的锌对数鬣拳平分带静隐秘保护分类娩羽挖掘箨法PBHPD,并绘箍7一释藩私保护程度的译价标准。分析和嶷验证明,该算法可以骑止瓣意攻击,在隐私保护程度和精度之闯可以达到一个较好盼平衡,与现有的多种算法相比,避行效率商,计算鞫遥讯开销都比较小。溉后。本烹进行了慧结和展黛,提出了研究中的技术难鼹和将来研究工作的拓展点和方是。,关穗谣:数据攘撵酶鹈绦护分类陡辘投影数据撬琵AbstractDatamininghaslongbeen衄activeareaindataba∞research·Itiswidelyusedinmanyfields,
4、especiaUyinscientificresearchandcommercialfields.Ontheotherhand,datamininghasbroughtsomesocialproblems.such嬲informatienalsafetyandprivacyprotec-fion.Therefore,privacyandsecurityhasbecomethefocusofmanydataminingresearches·Thispaperaddre%cstheproblemof"privacypreservingcl
5、assificationrulemininginthesituationsofcentralizeddataSetsanddisuibuteddatasets,respectively.Firstofall,thispaperintmdncesandanalyzesseveraltypicalprivacypreservingclassificationalgorithmsinrespecttOdifferentmodesofdamdistribution·Secondly,an唧methodfordataperturbationis
6、proposedwhichisbasedOilrandom删。甜吡Andthen,twoalgorithmsusingthismethodareintroduced,thatis删ecti∞-b∞ednaiveBayesian(PBB)classificationalgorithm__andprojection-basedperceptron(PBP)classificationalgorithm,whichaleconcemlngcentralizeddatasets.Thetheoreticalanalysisandexperim
7、entalrcsultsshowthattheproposedmethodiseffectiveinaccuracyandprivacy,andcallbeusedfor8varietyofdassifieationmethods.Thirdly,thispaperexploresan钾frameworkofclassificationruleminingusingrandomprojectionmethodinthedism'butedsituation.Ancwalgorithmcalledprojecdon。basedclass
8、ificationalgorithmforhorizontallypartitioneddata(PBHPD)isth锄proposedw鼬isbaseda咀theframework.Thetheoreticalanal
此文档下载收益归作者所有