分布式数据挖掘中的隐私保护问题研究

分布式数据挖掘中的隐私保护问题研究

ID:33390913

大小:1.47 MB

页数:51页

时间:2019-02-25

分布式数据挖掘中的隐私保护问题研究_第1页
分布式数据挖掘中的隐私保护问题研究_第2页
分布式数据挖掘中的隐私保护问题研究_第3页
分布式数据挖掘中的隐私保护问题研究_第4页
分布式数据挖掘中的隐私保护问题研究_第5页
资源描述:

《分布式数据挖掘中的隐私保护问题研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、中国科学技术大学硕士学位论文分布式数据挖掘中的隐私保护问题研究姓名:李哲鹏申请学位级别:硕士专业:商务智能指导教师:王卫平20070501中国科学技术大学学位论文相关声明本人声明所呈交的学位论文,是本人在导师指导下进行研究工作所取得的成果。除已特别加以标注和致谢的地方外,论文中不包含任何他人已经发表或撰写过的研究成果。与我一同工作的同志对本研究所做的贡献均己在论文中作了明确的说明。本人授权中国科学技术大学拥有学位论文的部分使用权,即:学校有权按有关规定向国家有关部门或机构送交论文的复印件和电子版,允许论文被查阅和借阅,可以将学位论文编

2、入有关数据库进行检索,可以采用影印、缩印或扫描等复制手段保存、汇编学位论文。保密的学位论文在解密后也遵守此规定。作者签名:旁侈坞川年多月岁日中国科学技术大学硕士学位论文摘要高新信息技术和数据分析手段的出现大大降低了数据采集、加工和发布的难度,各类组织希望从数据中获取有用的知识而使用最广泛的分析手段就是数据挖掘方法。该项技术的潜在负面作用就是对隐私信息的过分搜集、滥用或买卖。因此,对组织或个人隐私的保护日益受到各界重视并提上了研究日程。首先,数据挖掘研究和相关从业人员希望更高的数据可用性和精确性、信息越详细越好,这样可以减少前期工作量并

3、极大缩小结果的失真和偏差;从用户的角度来说,则不希望暴露隐私细节,从而更倾向于使用各种数据扭曲方法来保护自有隐私信息。这类对立行为的现实后果就是使得研究人员必须花费更多的时间和工作来弥补由此导致的数据实用性和精确度的损耗。本文着眼于建立考虑隐私保护的数据挖掘平台,将有助于在完成挖掘任务的同时保护参与者的隐私信息并防止其被滥用,从而缓和此类矛盾。其次,在分布式的数据存储环境中,各个数据库所有者都倾向于以最大的可能来保护本方隐私(商业模式、战略行为等)。文中设计了一种可以在保护个体隐私的基础上展开全局合作的数据挖掘工作平台和算法,以保证此

4、过程中安全地交换统计信息而不涉及具体隐私细节,从而更好地满足现代企业和商务发展的隐私性需求。本文介绍分析了前人的各种方法思想及各自优缺点,并从两个方面入手展开研究。首先,分析了快速分布式关联规则挖掘算法(FDM),指出在复杂甚至恶意的环境中保留可置信的第三方(TIP)一般认为是不安全的做法;将安全多方计算(SMC)的思想引入数据挖掘任务进而实现了各站点的平等合作(无需第三方介入)。其次,在设计防串谋的隐私保护平台时,定义了分布式合作数据挖掘任务中的一一类恶意威胁,放松了半诚实假设并在预防此类恶意行为的基础上实现了解决算法平台——RPA

5、。文章最后,设计仿真实验将RPA与另外两种代表性的分布式数据挖掘算法(FDM快速算法和CER加密算法)进行了比较。实验结果表明RPA平台具有较好的挖掘计算效率和效果:(1)该方法仅增加线性通讯次数,是一种轻量级的解决方案;(2)所有的站点都可以得到有力的保护,避免了站点子集隐私泄漏的可能。关键词:数据挖掘,分布式数据集合,隐私保护,恶意行为,计算集成平台第2页共52页中国科学技术大学硕士学位论文Abstract.Ilheemerginginformationtechnologyandanalysismethodhavegreatlyr

6、educedthedifficultyofdatacollection,processanddistribution.Usingthemostextensivelyappliedanalysismethod-datamining.organizationsareenabledtoacquireinterestingknowledge盘omroughdata.ThepOtentialside-effectofthismethodisovercollecting,misusingandsellingofprivateinformation

7、.Alongwiththeglobaldrivefordigital弘“z昭andnewlyemergingmethodfordamanalysis,theprotectionofprivacyfororganizationsandindividualshasbeenputintoagenda.Forthefirstthing,datan血ersexpectmoreaccurate,applicableanddetaileddatawhichwillsavemuchworkofthepreprocessingandgreatlyred

8、uceinaccurateanddistortedresults;olltheotherhand.ordinaryusoIxprefertomaintaintheiroMprivacybywidelyusinganony

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。