欢迎来到天天文库
浏览记录
ID:35071256
大小:2.75 MB
页数:63页
时间:2019-03-17
《基于非交互式数据发布的隐私保护技术研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、学校代码:10255学号:2131588基于非交互式数据发布的隐私保护技术研究ResearchofPrivacyProtectiontechnologybasedonNon-interactiveDataRelease学科专业:软件工程作者:周玲指导教师:石秀金答辩日期:2016年1月东华大学计算机科学与技术学院SchoolofComputerScienceandTechnologyDonghuaUniversity东华大学学位论文原创性声明本人郑重声明:我恪守学术道德,崇尚严谨学风。所呈交的学位论文,是本人在导师的指导下,独立进行
2、研究工作所取得的成果。除文中已明确注明和引用的内容外,本论文不包含任何其他个人或集体已经发表或撰写过的作品及成果的内容。论文为本人亲自撰写,我对所写的内容负责,并完全意识到本声明的法律结果由本人承担。学位论文作者签名:日期:年月日东华大学学位论文版权使用授权书学位论文作者完全了解学校有关保留、使用学位论文的规定,同意学校保留并向国家有关部门或机构送交论文的复印件和电子版,允许论文被查阅或借阅。本人授权东华大学可以将本学位论文的全部或部分内容编入有关数据库进行检索,可以采用影印、缩印或扫描等复制手段保存和汇编本学位论文。保密□,在年解
3、密后适用本版权书。本学位论文属于不保密□。学位论文作者签名:指导教师签名:日期:年月日日期:年月日基于非交互式数据发布的隐私保护技术研究摘要在大数据蓬勃发展的时代背景下,人们和海量数据交互的场合与机会越来越多。在数据处理过程中可能会涉及到人口、医疗或金融等隐私性较强的数据,如果针对这些数据直接进行线性统计数据发布,将会造成大量的敏感信息泄露。那么,如何在发布这些数据线性统计结果的同时保护数据内部的个人隐私信息就显得十分重要。对于数据的线性统计结果,具有高度背景知识的攻击者能以较高概率推断出发布数据中隐含的目标个体敏感信息,这种高置信
4、度推断式攻击是目前造成该类数据隐私泄露的重要原因之一。传统的匿名模型方法不能很好地防御此类攻击,差分隐私模型作为一种新型隐私保护模型可以从根本上弥补匿名模型的不足。本文针对差分隐私模型在线性统计数据发布中的实现进行了重点研究,主要工作如下:首先,针对差分隐私模型进行理论性研究,详细分析该模型通过数据失真方式实现隐私保护的原理,并且根据国内外先进的隐私保护技术进行对比分析,总结出模型的适用范围以及优缺点。其次,针对差分隐私实现过程中涉及到相关技术进行研究,例如链式攻击模型、拉普拉斯机制以及数据发布技术等,此外,论文详细分析了拉普拉斯噪
5、声分布参数对于隐私保护效果的影响。然后,课题基于非交互式的隐私数据发布按照数据发布维度分成两部分进行研究,分别提出相应的数据发布差分隐私解决方案,并给出详细论证和说明。针对单维数据发布,差分隐私保护实现中结合StructureFirst结构模型以及保序回归算法,将动态规划算法应用在直方图结构模型中,并且在直方图重构的基础上重新分配隐私预算ε,从而使得最终发布的直方图具有较小的扰动误差。针对多维数据发布,差分隐私保护基于矩阵-向量模式将数据库批量查询操作转化为代数计算形式,将单一查询的拉普拉斯机制扩展到批量查询并用向量I形式表示扰动结
6、果,在此基础上采用策略矩阵机制进行多维数据的差分隐私实现。最后,基于不同数据集分别进行差分隐私数据发布实验,通过具体的数据发布误差分析验证课题研究方法的可用性和有效性。课题研究差分隐私的两种实现方案分别针对单维和多维数据发布场景,在保证数据隐私基础上有效提高了数据发布的精确度。关键词:数据发布;差分隐私;动态规划;保序回归;策略矩阵机制IIRESEARCHOFPRIVACYPROTECTIONTECHNOLOGYBASEDONNON-INTERACTIVEDATARELEASEABSTRACTInthebackgroundofbig
7、databooming,theoccasionsandtheopportunitiesthatpeopleinteractwithmassivedatabecomemoreandmore.Whiletheprocessmayberelatedtohigh-privacydatasuchaspopulation,medicalorfinancialandsoon,twillcausealotofdataleakageofsensitiveinformationifreleasingsuchlinearstatisticaldatadi
8、rectly.So,itisveryimportantthathowtoprotectpersonalprivacyinformationcontainedinthelinearstatisticalresultsofthedatar
此文档下载收益归作者所有