基于剖分的事务型数据隐私保护

基于剖分的事务型数据隐私保护

ID:21691437

大小:90.84 KB

页数:11页

时间:2018-10-23

基于剖分的事务型数据隐私保护_第1页
基于剖分的事务型数据隐私保护_第2页
基于剖分的事务型数据隐私保护_第3页
基于剖分的事务型数据隐私保护_第4页
基于剖分的事务型数据隐私保护_第5页
资源描述:

《基于剖分的事务型数据隐私保护》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、数据的隐私保护题目过于泛泛,应该给出具体的数据类型作者略摘 要事务型数据发布时的隐私保护已经成为隐私保护数据发布研究中的一个热点。我针对事务型数据发布的隐私保护问题,以剖分技术为基础,提出新的适用于事务型数据的多维剖分技术,并设计出一个满足l-多样化的线性时间匿名算法。基于真实数据集和人工数据集的仿真实验和对匿名后事务型数据的关联规则分析表明,本文的算法可安全且高效地实现事务型数据发布的隐私保护,同时保证发布数据的可用性较高。摘要中应该用第三人称,并且不分段落关键词l-多样化;剖分技术;隐私保护;关联规则挖掘;数据挖掘PrivacyPreservationinTransactionD

2、atabasesbasedonAnatomytechniqueAbstractPrivacypreservationintransactiondatapublicationisahotspotissueinprivacy-preservingdatapublishing.Thispaperconsiderstheproblemofprivacypreservingtransactiondatapublishing.Inthispaper,wepresentanoveltechniquebasedonanatomytechniqueandproposealinear-timeanony

3、mousalgorithmthatmeetsthel-diversityrequirement.Thesimulationexperimentsonrealdatasetsandsyntheticdatasetsandtheresultsofassociationrulesminingontheanonymoustransactiondatashowedthatouralgorithmcansafelyandefficientlypreservetheprivacyintransactiondatapublication,whileensuringhighutilityofthere

4、leaseddata.Keywordsl-diversity;anatomytechnique;privacypreservation;associationrulesmining;DataMining1引言随着越来越多的公司发布数据方便研究与统计,数据发布时的隐私保护也成为越来越重要的热点问题。事务型数据包括网络检索日志、在线购物交易记录、超市数据等数据。这些事务型数据为数据挖掘提供了丰富的资料,如关联规则挖掘[3]、用户行为分析和推荐系统。因此,事务型数据在发布之前,必须进行必要的隐私保护以防止恶意的攻击者得到用户的隐私信息。引言中没有预期的结果及其地位、作用和意义例1.Bob去

5、超市购买了一些东西,包括面包、牛奶、饼干、红酒、牛肉、冰淇淋、灯泡和家用妊娠试纸。假设Bob所购买的一些物品出现在他的购物袋上(如面包、牛奶、灯泡),并且和他的邻居Alice乘坐在同一辆公共汽车上。Bob不想让Alice知道自己购买的一些东西(如家用妊娠试纸)。如果超市发布它的交易记录,并且只有一条记录包含面包、牛奶和灯泡,那么Alice能够立即通过这条记录判断出Bob购买的所有东西。例2.AOL最近发布了一份查询日志数据库[1,2],在对这些记录进行分析时,通过搜索第4417749号用户的查询记录,找到了乔治亚州利尔本市62岁的寡妇ThelmaArnold。尽管没有一条记录包含该用

6、户的地址或者姓名,但是,恶意的攻击者仍然可以通过对记录项目的排列组合来确定该用户的个人信息。在这些例子[10,11]中,数据发布者公布了包含用户特性的事务型数据用于科学研究。每一条事务记录都是由任意的项目组合而成。每一项可以是公有的(如面包、牛奶、灯泡)或者是私有的(如家用妊娠试纸)。攻击者试图推断出事务记录中的若干项目。由于攻击者可能拥有一些背景知识。例如,攻击者知道目标用户(如Bob)在发布的数据表中并已知其购买的一些项目(如面包、牛奶、灯泡),如果只有少数几条事务记录包含这些项目,那么攻击者就可能推断出目标用户对应的食物记录,从而获取其不愿意透露的信息。许多隐私保护模型,如k-

7、匿名[4,5,6],l-多样性[7]和t-closeness[8],对于低维的关系型数据会有很好的效果,但是无法直接应用于高维的非结构化数据。这些模型的思想都是将公有属性(也称之为准标识符)匿名化,以防止攻击者通过这些公有属性来推断出个人的隐私信息。然而,对于事务型数据,属性任意的排列组合都可能作为攻击者的背景知识。所以,以上模型都并不适合解决事务型数据。文献[9]指出,高维的数据更易于遭受推理攻击,并且在取得一定程度的匿名化后,大量的数据信息将丢失。传统

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。