基于熵的k-匿名属性泛化算法研究

基于熵的k-匿名属性泛化算法研究

ID:33175124

大小:2.30 MB

页数:66页

时间:2019-02-21

基于熵的k-匿名属性泛化算法研究_第1页
基于熵的k-匿名属性泛化算法研究_第2页
基于熵的k-匿名属性泛化算法研究_第3页
基于熵的k-匿名属性泛化算法研究_第4页
基于熵的k-匿名属性泛化算法研究_第5页
资源描述:

《基于熵的k-匿名属性泛化算法研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、独创性声明本人声明所呈交的论文是我个人在导师指导下进行的研究工作及取得的研究成果。本论文除了文中特别加以标注和致谢的内容外,不包含其他人或其他机构已经发。表或撰写过的研究成果,也不包含为获得南京信息工程大学或其他教育机构的学位或证书而使用过的材料。其他同志对本研究所做的贡献均已在论文中作了声明并表示谢意。学位论文作者签名:缒。量签字日期:丝!』:芏互关于论文使用授权的说明南京信息工程大学、国家图书馆、中国学术期刊(光盘版)杂志社、中国科学技术信息研究所的《中国学位论文全文数据库》有权保留本人所送交学位论文的复印件和电子文

2、档,可以采用影印、缩印或其他复制手段保存论文,并通过网络向社会提供信息服务。本人电子文档的内容和纸质论文的内容相一致。除在保密期内的保密论文外,允许论文被查阅和借阅,可以公布(包括刊登)论文的全部或部分内容。论文的公布(包括刊登)授权南京信息工程大学研究生院办理。,囱公开口保密(年月)(保密的学位论文在解密后应遵守此协议)学位论文作者签名:勉指导教师签名:签字日期:b』L堇:辽签字日期:坦!!:£:塑摘要!lllllIIIIIIIIIU]IIIIIIIIY189101随着互联网技术的迅速发展,信息共享越来越普遍,在给用户

3、带来方便的同时,隐私暴露问题逐渐突显出来。隐私保护方法的研究受到越来越多的关注。目前,基于k-匿名的隐私保护方法正成为隐私保护领域的一个热门研究课题。k-匿名技术是一种有效的隐私保护技术。k.匿名最早是由Sweeney提出的,它要求发布的数据中存在一定数量(k个)的不可区分的个体,使攻击者不能分辨出隐私信息所属的具体个体,从而防止了个人隐私的泄密。k.匿名被提出后,受到国内外学者的广泛关注,涌现出许多算法,k.匿名算法都需要对数据表的某些属性进行泛化和隐匿,这样虽然损失了一部分数据的可用性,但是提高了发布信息的安全性。k

4、.匿名运算过程中,信息缺失是必然的,所以数据的可用性和安全性本身就是矛盾的,两者需要找到折中平衡,每种k匿名算法也希望能达到低数据缺失率和高安全性。同一数据集泛化属性的选择以及不同数据集k.匿名算法的选择都是k.匿名技术研究的难题。本文的工作是提出了一种新的k-匿名算法,该算法能找出需要优先泛化的属性,经过实验验证,这种算法能达到较好效果。然后设计并实现了匿名医疗信息发布系统,并把该算法应用到其中。本文主要工作如下:(1)对k-匿名算法的定义、算法、评估方法和发展趋势做了概述。(2)提出一种新的k-匿名算法(基于熵的k_

5、匿名属性泛化算法),在无法确定泛化哪个属性的情况下,计算每个属性的熵值,选择熵值较小的属性泛化。(3)把该算法和Incognito算法、Datafly算法进行实验对比后,证明该算法是有效的,用该方法对数据k-匿名处理后,能尽可能的接近原始数据,并保持高的精准度。·(4)针对医疗机构隐私保护措施不足,患者隐私容易泄露的现状,本文设计了一种医疗信息发布系统,系统可以对数据进行k.匿名运算,使得数据表变的更安全。从事医疗工作的授权人士可以浏览信息,而没授权人员只能浏览匿名信息。医疗信息发布系统在医疗机构中的应用,能有效的防止信

6、息泄露,保护患者隐私。关键词:k-匿名,熵,信息发布,隐私保护sub-tupleisanecessary(notsufficient)conditionforhavingkaccullr印cesofasuper-tuple.Inthisway,attackercan’tdistinguishprivacyinformationfi'omanother,thus,Wecanprotectprivacyinformation.Afterk-anonymitywasputforward,itwaspaidattentionto

7、bythedomesticandforeignscholars.Alotofalgorithmswereproposed.Generalizationandsuppressiona他twomethodofk-anonymity.GeneralizationandsuppressionmaybeleadtoinformationIOSS,however,itincreasethesecurityofdata.Informationlossisinevitable.Sotheusabilityandthesecurityof

8、dataarccontrary.Andweallstudytheproblemofachievingk-anonymitywithminimallossofinformationandmaximalsecurity.Itisaveryhardissueforthestudyofk-anonymitytechnolog

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。