保护隐私的关联规则挖掘研究

保护隐私的关联规则挖掘研究

ID:33180632

大小:2.36 MB

页数:63页

时间:2019-02-21

保护隐私的关联规则挖掘研究_第1页
保护隐私的关联规则挖掘研究_第2页
保护隐私的关联规则挖掘研究_第3页
保护隐私的关联规则挖掘研究_第4页
保护隐私的关联规则挖掘研究_第5页
资源描述:

《保护隐私的关联规则挖掘研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、Y1404817分类号:UDC:TP301.6密级:学校代号:学号:1015020052197戈建交戤挚硕士学位论文保护隐私的关联规则挖掘研究Privacy—preservingAssociationRulesMining学生姓名:导师及职称:学科门类:专业名称:研究方向:申请学位级别:论文答辩日期:学位授予单位:董爱杰田宏副教授工科计算机应用技术数据挖掘工学硕士2007年12月23日大连交通大学保护隐私的关联规则挖掘研究摘要随着信息技术,特别是网络技术、数据存储技术和高性能处理器技术的飞速发展,海量数据的收集、管理和分析变得越来越方便,知识发现和数据挖掘更是

2、在一些深层次的应用中发挥了积极的作用。任何事情都有其两面性,数据挖掘领域也不例外,随之产生的是信息安全和保护隐私的问题。所以,如何在保证信息隐私的情况下挖掘出有用信息已经成为目前数据挖掘界的一个研究热点。本文首先从数据分布方式、数据修改方式等角度,对当前流行的保护隐私数据挖掘算法进行了深入浅出的介绍和分析。重点介绍了MASK、I沁H、PARD三种保护隐私的关联规则挖掘方法。通过分析它们的缺点和不足,提出一种新颖的保护隐私关联规则挖掘方法一基于转移概率矩阵的部分随机化回答(partialrandomizedresponsebasedonprobabilityma

3、trix,简称PRRPM)方法。为了在保护隐私的同时能够准确、高效地进行关联规则挖掘,PRRPM方法在进行频繁1.项集和频繁k.项集(k>1)挖掘时分别采用不同的数据转换策略。在挖掘频繁1.项集时,先使用“属性转移概率矩阵”对每个属性进行部分转换,然后提出一种方法恢复1.项集在原数据集中的支持度,以便找出数据集中的所有频繁1.项集;而在挖掘频繁k.项集(k>1)时,要先使用“多项集转移概率矩阵"对所有的候选频繁k.项集进行部分转换,然后提出一种方法恢复候选频繁k-项集在原数据集中的支持度,以便找出所有的频繁k.项集。理论分析和实验验证表明,本文提出的PRRPM

4、方法比RRPH和MASK方法在隐私性、准确性、复杂度方面更具有优势。关键词:属性转移概率矩阵;多项集转移概率矩阵;部分随机化;保护隐私;关联规则;大连交通大学T学硕十学位论文AbstractWiththerapidlydevelopingofinformationtechnologies,especiallyofnetworktechnology,datastoragetechnologyandhighcapabilityprocessortechnology,itismoreandmoreconvenienttocollect,manageandanalys

5、emassivedata.KnowledgeDiscoveryandDataMininghavemorepositiveeffectindeepapplication,buteverycoinhastwosidesanddataminingisnotexceptional.Informationsecurityandprivacypreservingbringup、析t11thedevelopmentofdatamining.So,howtomineusefulandexactinformationontheprivacypreservingisbecomin

6、ghotspotindataminingfieldatpresent.Firstly,thecurrentprivacypreservingdataminingalgorithmsareintroducedandanalysed,asdatadistributingmethod,datamodifyingmethodetc.Secondly,threeprivacy—preservingassociationrulesminingmethodsMASK,RRPHandPARDareimportanttointroduce.Finallly,anewprivac

7、y—preservingassociationrulesminingmethod(PRRPM)isproposedinthispaper,whichisanovelpartialrandomizedresponsemethodbasedonprobabilitymatrix.PRRPMmethodchoosesdifferentdatatransitionstrategiestofindfrequent1-itemsetsandfrequentk-itemsets(k>1)inordertomineassociationrulesaccuratelyandef

8、ficientlywhileprese

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。