欢迎来到天天文库
浏览记录
ID:36546557
大小:1.96 MB
页数:47页
时间:2019-05-11
《数据发布中多敏感属性数据隐私保护算法》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库。
1、硕硕士学位士论文唐印浒数据发布中多敏感属性数据隐私保护算法数据发布中多敏唐印浒感属性数据隐私保护算法2014二○一四年六月分类号密级UDC硕士学位论文数据发布中多敏感属性数据隐私保护算法唐印浒学科专业计算机系统结构指导教师钟诚教授论文答辩日期2014年5月24日学位授予日期答辩委员会主席葛丽娜教授广西大学学位论文原创性和使用授权声明本人声明所呈交的论文,是本人在导师的指导下独立进行研究所取得的研究成果。除已特别加以标注和致谢的地方外,论文不包含任何其他个人或集体已经发表或撰写的研究成果,也不包含本人或他人为获得广西大学或其它单位的学位而使用过的材料。与我一同工作的同事
2、对本论文的研究工作所做的贡献均已在论文中作了明确说明。本人在导师指导下所完成的学位论文及相关的职务作品,知识产权归属广西大学。本人授权广西大学拥有学位论文的部分使用权,即:学校有权保存并向国家有关部门或机构送交学位论文的复印件和电子版,允许论文被查阅和借阅,可以将学位论文的全部或部分内容编入有关数据库进行检索和传播,可以采用影印、缩印或其它复制手段保存、汇编学位论文。本学位论文属于:□保密,在年解密后适用授权。□不保密。(请在以上相应方框内打“√”)论文作者签名:日期:指导教师签名:日期作者联系电话:电子邮箱:数据发布中多敏感属性数据隐私保护算法摘要随着信息技术的快速
3、发展,如何在保证隐私数据安全的同时提高计算机信息系统发布数据的可用性,已成为当前计算机系统安全领域面临的挑战问题之一。本文针对静态、动态环境下数据发布中敏感信息泄露的问题进行研究,主要研究针对多敏感属性数据集的基于k-匿名模型的概率k-匿名改进算法和基于m-不变性匿名模型的改进算法的设计与实现。基于k-匿名模型的要求,研究提出适用于静态多敏感属性数据集的基于变长聚类的概率k-匿名算法,该算法在原始概率k-匿名算法基础上,综合考虑距离和权重值对聚类种子选取以及聚类结果的影响,建立一个新的聚类种子选取模型,以获得更好的聚类结果,提高匿名数据集的数据质量;提出融合k-mea
4、ns与变长聚类算法的概率k-匿名并行算法,采用多线程并行技术,在不降低匿名质量的前提下,大大提升算法处理大数据集的效率。实验结果表明,所提出的算法效率高、生成的匿名数据集具有较高的数据可用性。针对动态数据集环境下隐私泄露的问题,对经典算法m-invariant算法进行分析研究并提出改进算法,改进的算法通过增加一个伪记录表,将新添加的记录先与伪记录进行匹配,创造删除伪记录的机会,以减少整个匿名数据集中伪记录的总数目,达到提高数据可用性的目的;针对算法处理多敏感属性数据较耗时的问题,采用多线程并行技术,将算法的桶分割并行I处理,在不降低数据质量的前提下,提高算法的效率。实
5、验表明,提出的改进算法高效、生成的匿名数据集具有较高的数据可用性。关键词:计算机信息系统安全数据发布隐私保护多敏感属性概率k-匿名变长聚类k-means线程级并行IIPRIVACY-PRESERVINGALGORITHMSFORPUBLISHINGDATAWITHMULTIPLESENSITIVEATTRIBUTESABSTRACTWiththerapiddevelopmentofinformationtechnology,howtoimprovetheserviceabilityofpublishingdataincomputerinformationsystema
6、ndensurethesecurityofprivatedatahasbecomeoneofthechallengesinthefieldofdatasecurityofcomputersystems.Inthispaper,westudytheissueofleakofsensitiveinformationinstaticanddynamicdatapublishing,andmainlyresearchimprovedalgorithmofprobabilistick-anonymitybasedonk-anonymityandimprovedalgorithm
7、basedonm-invarianceformultiplesensitiveattributesdatasets.Basedontherequirementofk-anonymity,thispaperproposesaprobabilistick-anonymityalgorithmwithmultiplesensitiveattributesbasedonvariable-lengthclustering.Inordertogetbetterclusteringresultandhigherqualityofanonymousdataset,t
此文档下载收益归作者所有