面向聚类的多敏感属性数据发布隐私保护研究

面向聚类的多敏感属性数据发布隐私保护研究

ID:35102279

大小:3.35 MB

页数:57页

时间:2019-03-17

面向聚类的多敏感属性数据发布隐私保护研究_第1页
面向聚类的多敏感属性数据发布隐私保护研究_第2页
面向聚类的多敏感属性数据发布隐私保护研究_第3页
面向聚类的多敏感属性数据发布隐私保护研究_第4页
面向聚类的多敏感属性数据发布隐私保护研究_第5页
资源描述:

《面向聚类的多敏感属性数据发布隐私保护研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、.一乂,..广卢''?..>一VS;.■■'’■'‘,V码:10293密级;.单位代■.;公:堪'.f尸r?,,:;?妾祭译二為脅《才嫂考皮硕女#後讼戈Vs广—m?.遠ifeS论文题目:面向聚类的《敏感属性数据发布隐私保护研巧'':蟲.軒甘'游’y......学号1213043117一、iV姓名Jli系.一.1’‘':—-V导师—:立#:葛;;!麵片‘.工

2、程硕±专业学位类别^'.';‘’..非..:A;;,孩,夺B制.类型余:彎I件工程专业(领域)软二Q—六年二月期.,论文提交日.’'片辩巧’>:攀f’殺常:南京邮电大学学位论义原创性声明本人声明所呈交的学位论文是我个人在导师指导下进行的研究工作及取得的研究成果。尽我所知,论文,除了文中特别加勒标注和致谢的地方外中不包含其他人已经发表或撰写过的研究成果,也不包含为获得南京邮电大学或其它教脊机构的学位或证书而使用过的材料。

3、^与我同王作的同志对本研巧所做的任何贡献巧己在论文中作了明确的说明并表示了谢意。^,愿意切相关的法律本人学位论文及涉及相关资料若有不实承担责任。.去;了《研名:葦日:2如少巧生签期南论文使用授权京邮电大学学位声明南邮电向国有关部口或机构送交论文印和电子文本人授权京大学可W保留并家的复件;论文被查拥和借阅;可1^将学位论文的全部或部分内容编入有关数据库进行检索;档允许可^1印、缩印或手段、汇论文。电子文档的内容和纸1采用影扫描等复制保存编本学位本文质一。论文()生院理。论文相

4、的公包括刊登授权南邮电大学研的内容致布京究办涉密学位论文在解密后适用本授权书。。’中2仁(家研生签名:禪师签名::库导日期巧?Researchonprivacypreservingdatapublishingformulti-sensitiveattributebasedonclusteringThesisSubmittedtoNanjingUniversityofPostsandTelecommunicationsfortheDegreeofMasterofEngineeringByYang

5、LuSupervisor:Prof.GuoqiangZhouFebruary2016摘要数据发布在数据管理、数据挖掘和信息共享应用中有着重要的地位。高速发展的互联网使得海量数据的收集、发布及分析更加便捷,但与此同时,也给用户个人隐私带来了威胁。在现实生活中,有很多机构需要定期对外发布数据。例如,医院定期发布医疗统计数据,上市公司定期发布的财务报表,等等。这些数据中存在大量的个人敏感信息,如果泄露将会造成不可估量的损失。实际场景中,数据中存在不止一个敏感属性,所以,我们对数据发布中存在不止一个敏感属性的隐私研

6、究迫在眉睫,尤其是对多敏感属性数据发布中的多维数值敏感属性个性化隐私保护问题,更是探讨热点,分析这一问题通常需要采用聚类的方法处理数据,所以称之为面向聚类。首先,论文分析了现有数据发布中保护隐私的各种方法,包括匿名隐私保护模型、匿名技术、应用聚类的匿名方法等等,从中得出不同匿名模型和匿名技术的优缺点。其次,论文对数据发布中多敏感属性的隐私保护技术进行深入探讨,指出传统的多敏感属性数据发布方法在保护隐私上存在不足。针对多维数值敏感属性数据发布隐私保护方法中,很少考虑数值敏感属性的属性值权重的个性化隐私问题。提

7、出基于聚类和加权多维桶分组的个性化隐私保护方法。该方法首先通过聚类单独将各维数值敏感属性的属性值划分到多个聚簇中,然后为多维数值敏感属性构建加权多维桶,将表中数据记录映射到对应多维桶中,通过考虑加权选择度的最大维容量优先算法,选择多维桶中的数据记录,构建满足l-diversity的分组,最后将得到分组的准标识符进行泛化,将分组以匿名表形式发布。实验结果表明,发布的匿名数据表,满足l-diversity的同时,避免了相似性攻击,具有较低信息损失和较低的隐匿率,以及较高的数据拥有者定义重要记录可发布性,达到个性

8、化隐私保护效果。最后论文对多敏感属性数据发布中的多维数值敏感属性数据发布个性化匿名技术进行深入探讨,针对传统方法中,很少同时考虑数值敏感属性的权重和敏感值的权重的问题。提出了一种基于聚类和个性化加权(数据记录权重)选择度的匿名算法,该方法利用最小个性化数据记录选择度优先的思想,选择数据记录构成满足l-diversity的分组,最后将得到分组的准标识符进行泛化,将分组以匿名表形式发布,达到个性化隐私保护。实验结果证

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。