基于信息负表示的数据发布方法研究

基于信息负表示的数据发布方法研究

ID:33513542

大小:5.69 MB

页数:77页

时间:2019-02-26

基于信息负表示的数据发布方法研究_第1页
基于信息负表示的数据发布方法研究_第2页
基于信息负表示的数据发布方法研究_第3页
基于信息负表示的数据发布方法研究_第4页
基于信息负表示的数据发布方法研究_第5页
资源描述:

《基于信息负表示的数据发布方法研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、中国科学技术大学学位论文原创性声明本人声明所呈交的学位论文,是本人在导师指导下进行研究工作所取得的成果。除己特别加以标注和致谢的地方外,论文中不包含任何他人已经发表或撰写过的研究成果。与我一同工作的同志对本研究所做的贡献均己在论文中作了明确的说明。作者签名:签字目期:中国科学技术大学学位论文授权使用声明作为申请学位的条件之一,学位论文著作权拥有者授权中国科学技术大学拥有学位论文的部分使用权,即:学校有权按有关规定向国家有关部门或机构送交论文的复印件和电子版,允许论文被查阅和借阅,可以将学位论文编入《中国学位论文全文数据库》等有关数据库进行检索,可以采用影印、缩印或扫描

2、等复制手段保存、汇编学位论文。本人提交的电子文档的内容和纸质论文的内容相一致。保密的学位论文在解密后也遵守此规定。户公开口保密(——年)作者签名:衅签字日期:—乒咀半盐b1斗聊繇盟签字日期:丝!!:竺:二2摘要现有的关于数据发布的工作集中于如何在数据发布时隐藏个体信息,己提出的方法大部分都是“正发布”方法,即直接对原始数据进行处理后发布,但其实这些方法发布的依然是“正”的数据。因此,这会使得攻击者有可能通过特定的攻击手段,如同质化攻击等,从发布表中获取到用户隐私,从而造成隐私泄露,给用户利益带来危害。由于负表示是将原始数据用其补集来表示,具有很强的隐私保护能力,因此本

3、文将负表示思想引入到数据发布领域,提出了新的数据发布方法,即将每条记录的敏感属性值使用其负表示的值进行替换,发布带有“负”的敏感属性值的数据,从而提高现有方法的隐私保护度。本文的工作主要集中在以下几个方面:(1)由于传统数据发布的肛匿名模型发布的是带“正”的敏感信息的发布(未处理原始数据的敏感信息),且肛匿名模型发布数据时未考虑到各个等价类中“正”敏感信息的分布,这些缺陷使得肛匿名容易受到同质化攻击等方式的攻击,从而造成隐私泄露。因此,本文将负表示与弘匿名模型结合,提出了(屯m).口挖onⅣPD算法。该算法对克.匿名的发布数据进行了负表示转换,从而最终的发布数据在非敏

4、感属性上不可区分,同时对应的敏感属性值都是“负”的敏感属性值,以此达到隐私保护的目的。本文通过理论分析和相关的实验,将本文提出的(屯圳一日胛D,2MDD算法与红匿名进行了比较,证明了(毛州,口胛o,zⅣPD算法隐私保护能力比舡匿名更强,同时该算法也具有实用性。(2),.多样性模型是基于肛匿名模型提出的,该模型对数据发布时等价类中的敏感信息的分布做了处理,使得发布数据的每个等价类中至少包含Z种不同敏感信息,克服了肛匿名发布时会出现的同等价类中的敏感信息的分布可能会比较集中的缺陷,但是厶多样性发布的数据依然包含“正”的敏感属性值。本文将负表示与,.多样性模型结合,提出了(

5、毛珑).破vM叼l算法。该算法在厶多样性进程中将原始数据进行了负表示转换,从而使得发布数据中的敏感信息都是“负”的敏感信息,且这些“负”的敏感信息具有更好的多样性,提高了隐私保护能力。本文通过理论分析和相关实验,将本文提出的(Z,聊).舢D算法与Z.多样性进行了比较,证明了(,,朋)一坊悯算法相比■多样性模型具有更强的隐私保护能力,同时也具有实用性。(3)本文提出了两种算法(屯州一以,?D觚,PD算法和(,,聊).讲vⅣPD算法,这两种算法都将对应的传统数据发布模型的发布效果做了一定的提升。但是,这两种算法具有各自的特点,因此,本文针对提出的(屯州一日玎D加炉JD算法

6、和(,,朋)一舢DT摘要算法,通过相关实验对这两种算法进行了比较,分析了两种方法的各自的特点。本文将负表示思想应用到数据发布领域,并将负表示与数据发布领域的经典模型肛匿名模型和,.多样性模型结合,分别提出了新的基于肛匿名模型的(毛叫.口胛D栅算法和新的基于,.多样性模型的(,,聊).历vⅣPD算法,并通过理论分析和相关实验,验证了两种算法的隐私保护能力和实用性。关键词:隐私保护数据发布缸匿名Z.多样性信息负表示负调查ABSTRACTMostoftheexisting、№rkondatapublicationfocusesonhowtoconceali11dividua

7、ls’血fomationduringtl:lepublishmgprocessandtheyare“positiVe”publication,w11ichmeansdirecnypublishingtlleprocessedVersionoftheoriginaldataandthepublisllingdataisessemiallyt:herealdata.HoweVer,sincetherealdataispublished,attackerscouldretrievemdividuals’iI怕nIlation舶mthepublisbjngd

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。