基于隐私保护的分布式聚类算法折研究

ID:34041397

大小:8.11 MB

页数:61页

时间:2019-03-03

基于隐私保护的分布式聚类算法折研究_第1页
基于隐私保护的分布式聚类算法折研究_第2页
基于隐私保护的分布式聚类算法折研究_第3页
基于隐私保护的分布式聚类算法折研究_第4页
基于隐私保护的分布式聚类算法折研究_第5页
资源描述:

《基于隐私保护的分布式聚类算法折研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、指导小组成员名单张世永教授钟亦平教授吴承荣副教授吴杰副教授目录摘要⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯¨.⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯一-1ABSTRACT.⋯.⋯.⋯⋯⋯.⋯⋯⋯。⋯⋯⋯......⋯⋯⋯..........⋯........⋯⋯....。⋯⋯⋯...⋯⋯⋯⋯·⋯⋯--·r·⋯2第一章引言⋯⋯⋯⋯。⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯一⋯⋯一⋯-31.1研究背景⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯31.2国内外研究近况⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯41.3本文的工作⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯7第二章聚类算法及隐私保护概述2.1数据挖掘概述9

2、2.2常见数据挖掘技术⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯92.3聚类算法概连⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯·122.31基于距离的聚类算法122.32基于密度的聚类算法132,33分布式的聚类算法142.4隐私保护⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯152.41隐私保护的定义152.42隐私保护与数据挖掘162.5隐私保护数据挖掘算法的评价标准2.6本章小结第三章基于微簇的隐私保护聚类算法⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯213.1安全模型厦算法相关定义⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯”213,22安

3、全模型的定义213.22算法相关定义233,2基于可信任第三方的微簇分布式聚类算法3.21系统的框架3.22算法过程3,23算法参数分析3.3算法复杂度及安全性分析3.31算法复杂度分析3,32安生性分析323.4实验结果囊分析⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯驺3.S基于半可信任第三方的擞簇聚粪算法⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯”343.51算法描述35第四章增量式环境下的分布式隐私保护聚类算法4l问题描述42相关定义4.3算法思想44算法实现4.5实验结果与分析451准确度分析452时间复杂度分析4.S3安全性分析46本章小结第五章结束语参

4、考文献⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯s3攻读硕士期间发表的论文5758=一{{

5、

6、一{{一三

7、

8、!曩{

9、一竺一耱黼一爱,o¨柏mm∞瑚m眈里呈查竺坚主兰竺堡兰一摘要数据挖掘技术正受到人们越来越多的关注.与此同时隐私保护问题也日益受到广大人们的重视。如何在保护自身隐私的同时进行充分的合作和数据的共享,已经成为人工智能领域的一个研究热点。本文主要针对多方合作计算问题展开了研究,目的在于使参与各方能在很好的保护自身敏感数据及数据分布情况等知识的前提下,能很好的进行相互间的协作,挖掘出基于整体数据集的知识作为参与者的共同财产。通过将数据流当中的

10、微簇概念引入到分布式的环境中.并加入多方安全协议,我们提出了基于隐私保护的分布式聚类算法。该算法具有很小的通信消耗,较低的计算时间复杂度,然而却具有很好的安全性以及较高的准确率。考虑到信息飞速增长,各个行业内部合作逐步扩大的现实背景.文章在之前提出的基于微簇的聚类算法基础上进行了扩展,提出了增量式的隐私保护聚类算法IDPPKMeans(IncrementDistributingPrivacyProtectK-Means),避免了由于新的数据集加入到合作系统中而引起所有数据进行重新聚类的问题。最后通过实验证明该算法具有较高的准确度,并能很好的保护数据的安全性。关键字:隐

11、私保护,分布式.数据挖掘,微簇,安全计算!!i兰!!!!!!————AbstractAsdataminingtechniquehasbeenbecomingmoreandmoreimportantincommerce,asensitirequestionwhichisprivacyprotectirldatamining,isalsoattractmoreandmoreattentionbothofnormalpersonsandresearchersPPDM(PrivacyProtectDataMining)isahotspotofartificialinteiii

12、gencenow.Inthisarticle.wemainlystudyonthemultisecuritycalculateproblemAndthegoalistoproposeaclusteringarithmetic,whichcanpreventeveryparticipator’Ssubtleinformation,whichcontainsboththesensitivedataandtheknowledgefromdataanalyzingIntheprivacyprotectdistributingclusteringarithme

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
正文描述:

《基于隐私保护的分布式聚类算法折研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、指导小组成员名单张世永教授钟亦平教授吴承荣副教授吴杰副教授目录摘要⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯¨.⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯一-1ABSTRACT.⋯.⋯.⋯⋯⋯.⋯⋯⋯。⋯⋯⋯......⋯⋯⋯..........⋯........⋯⋯....。⋯⋯⋯...⋯⋯⋯⋯·⋯⋯--·r·⋯2第一章引言⋯⋯⋯⋯。⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯一⋯⋯一⋯-31.1研究背景⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯31.2国内外研究近况⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯41.3本文的工作⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯7第二章聚类算法及隐私保护概述2.1数据挖掘概述9

2、2.2常见数据挖掘技术⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯92.3聚类算法概连⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯·122.31基于距离的聚类算法122.32基于密度的聚类算法132,33分布式的聚类算法142.4隐私保护⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯152.41隐私保护的定义152.42隐私保护与数据挖掘162.5隐私保护数据挖掘算法的评价标准2.6本章小结第三章基于微簇的隐私保护聚类算法⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯213.1安全模型厦算法相关定义⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯”213,22安

3、全模型的定义213.22算法相关定义233,2基于可信任第三方的微簇分布式聚类算法3.21系统的框架3.22算法过程3,23算法参数分析3.3算法复杂度及安全性分析3.31算法复杂度分析3,32安生性分析323.4实验结果囊分析⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯驺3.S基于半可信任第三方的擞簇聚粪算法⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯”343.51算法描述35第四章增量式环境下的分布式隐私保护聚类算法4l问题描述42相关定义4.3算法思想44算法实现4.5实验结果与分析451准确度分析452时间复杂度分析4.S3安全性分析46本章小结第五章结束语参

4、考文献⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯s3攻读硕士期间发表的论文5758=一{{

5、

6、一{{一三

7、

8、!曩{

9、一竺一耱黼一爱,o¨柏mm∞瑚m眈里呈查竺坚主兰竺堡兰一摘要数据挖掘技术正受到人们越来越多的关注.与此同时隐私保护问题也日益受到广大人们的重视。如何在保护自身隐私的同时进行充分的合作和数据的共享,已经成为人工智能领域的一个研究热点。本文主要针对多方合作计算问题展开了研究,目的在于使参与各方能在很好的保护自身敏感数据及数据分布情况等知识的前提下,能很好的进行相互间的协作,挖掘出基于整体数据集的知识作为参与者的共同财产。通过将数据流当中的

10、微簇概念引入到分布式的环境中.并加入多方安全协议,我们提出了基于隐私保护的分布式聚类算法。该算法具有很小的通信消耗,较低的计算时间复杂度,然而却具有很好的安全性以及较高的准确率。考虑到信息飞速增长,各个行业内部合作逐步扩大的现实背景.文章在之前提出的基于微簇的聚类算法基础上进行了扩展,提出了增量式的隐私保护聚类算法IDPPKMeans(IncrementDistributingPrivacyProtectK-Means),避免了由于新的数据集加入到合作系统中而引起所有数据进行重新聚类的问题。最后通过实验证明该算法具有较高的准确度,并能很好的保护数据的安全性。关键字:隐

11、私保护,分布式.数据挖掘,微簇,安全计算!!i兰!!!!!!————AbstractAsdataminingtechniquehasbeenbecomingmoreandmoreimportantincommerce,asensitirequestionwhichisprivacyprotectirldatamining,isalsoattractmoreandmoreattentionbothofnormalpersonsandresearchersPPDM(PrivacyProtectDataMining)isahotspotofartificialinteiii

12、gencenow.Inthisarticle.wemainlystudyonthemultisecuritycalculateproblemAndthegoalistoproposeaclusteringarithmetic,whichcanpreventeveryparticipator’Ssubtleinformation,whichcontainsboththesensitivedataandtheknowledgefromdataanalyzingIntheprivacyprotectdistributingclusteringarithme

显示全部收起
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。
关闭