欢迎来到天天文库
浏览记录
ID:37065501
大小:3.67 MB
页数:116页
时间:2019-05-16
《基于不同匿名需求的隐私保护数据发布算法研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、分类号:TP391单位代码:10183研究生学号:2014531021密级:公开吉林大学博士学位论文基于不同匿名需求的隐私保护数据发布算法研究ResearchonPrivacy-PreservingDataPublishingAlgorithmsBasedonDifferentAnonymityRequests作者姓名:李博宇专业:计算机应用技术研究方向:隐私保护数据发布技术指导教师:刘衍珩教授培养单位:计算机科学与技术学院2018年6月基于不同匿名需求的隐私保护数据发布算法研究ResearchonPrivacy-PreservingDataPublishingAlgorithmsB
2、asedonDifferentAnonymityRequests作者姓名:李博宇专业名称:计算机应用技术研究方向:大数据的隐私保护指导教师:刘衍珩教授学位类别:工学博士培养单位:计算机科学与技术学院论文答辩日期:2018年6月5日授予学位日期:2018年月日论文评阅人答辩委员会组成盲审专家正高级大连理工大学主席王宽全教授哈尔滨工业大学盲审专家副高级北京交通大学委员杨华民教授长春理工大学盲审专家正高级哈尔滨工业大学秦贵和教授吉林大学申铉京教授吉林大学赵宏伟教授吉林大学未经本论文作者的书面授权,依法收存和保管本论文书面版本、电子版本的任何单位和个人,均不得对本论文的全部或部分内容进行任何
3、形式的复制、修改、发行、出租、改编等有碍作者著作权的商业性使用(但纯学术性使用不在此限)。否则,应承担侵权的法律责任。吉林大学博士学位论文原创性声明本人郑重声明:所呈交学位论文,是本人在指导教师的指导下,独立进行研究工作所取得的成果。除文中已经注明引用的内容外,本论文不包含任何其他个人或集体已经发表或撰写过的作品成果。对本文的研究做出重要贡献的个人和集体,均已在文中以明确方式标明。本人完全意识到本声明的法律结果由本人承担。学位论文作者签名:日期:2018年月日《中国优秀博硕士学位论文全文数据库》投稿声明研究生院:本人同意《中国优秀博硕士学位论文全文数据库》出版章程的内容,愿意将本人的
4、学位论文委托研究生院向中国学术期刊(光盘版)电子杂志社的《中国优秀博硕士学位论文全文数据库》投稿,希望《中国优秀博硕士学位论文全文数据库》给予出版,并同意在《中国博硕士学位论文评价数据库》和CNKI系列数据库中使用,同意按章程规定享受相关权益。论文级别:□硕士■博士学科专业:计算机应用技术论文题目:基于不同匿名需求的隐私保护数据发布算法研究作者签名:指导教师签名:2018年月日作者联系地址(邮编):吉林大学计算机科学与技术学院130012作者联系电话:15843114822摘要摘要基于不同匿名需求的隐私保护数据发布算法研究随着大数据和机器学习等技术的不断进步,各个行业对数据的需求量越
5、来越大。行业之间的数据交换和共享逐渐成为了信息交流中越来越重要的活动,但是,在交流的数据中包含了大量的用户隐私信息。如果这些数据在没有经过隐私保护处理就对外进行发布或者交换,会非常容易造成用户的隐私泄露。因此,学者们通过提出隐私保护数据发布技术解决在数据发布和交换过程中用户的隐私泄露问题。本文主要研究了在特定的发布环境中面对一些匿名保护的需求时,提出适当的匿名算法为数据表中的隐私信息提供安全的保护并且尽可能保存数据中的信息可利用性,具体的主要工作包括以下三个方面:1.提出了交叉桶泛化算法。该算法结合泛化算法和桶算法的原理分别对用户身份和敏感属性进行相互独立的保护,从而解决了当使用泛化
6、算法时对用户身份过度保护的问题。由于交叉桶泛化算法可以为用户身份和敏感属性提供独立的保护,所以我们通过提出并使交叉桶泛化算法遵循(k,l)-anonymity匿名原则将匿名数据表中用户身份暴露的概率和敏感属性值泄露的概率分别控制在1?和1?以内,并且参数k和l可以根据实际匿名需求自由设置。此外,还通过使用启发式将匿名数据表中各个等价组和桶包含的个体数量尽可能减少,并且尽量缩小等价组中QI泛化值的值域范围,从而进一步提高了匿名数据的信息可利用性。2.定义了个性化隐私保护的发布环境并提出了局部分解算法。在个性化隐私保护的发布环境中,用户可以在数据表中自由设置自身属性值的敏感性,并且根据包
7、含数据值的类型将数据表中的属性分为QI属性、半敏感属性和敏感属性。局部分解算法基于桶算法的原理,在每个半敏感属性和敏感属性中将带有敏感值的用户划分为桶,从而在保障所有敏感值安全的同时还保留了所有原始QI值信息。局部分解算法不仅可以保留非常优秀的信息可利用性,还具有很好的可扩展性,它可以根据实际匿名需求或者不同属性的特点同时遵循不同的匿名原则对数据表中的敏感值进行保护。3.提出了局部分解泛化算法。该算法通过在局部分解算法中加入泛化机制,I使其可以在个性化隐私
此文档下载收益归作者所有