隐私保护数据发布中身份保持的匿名方法

隐私保护数据发布中身份保持的匿名方法

ID:34641118

大小:874.02 KB

页数:14页

时间:2019-03-08

隐私保护数据发布中身份保持的匿名方法_第1页
隐私保护数据发布中身份保持的匿名方法_第2页
隐私保护数据发布中身份保持的匿名方法_第3页
隐私保护数据发布中身份保持的匿名方法_第4页
隐私保护数据发布中身份保持的匿名方法_第5页
资源描述:

《隐私保护数据发布中身份保持的匿名方法》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、万方数据ISSN1000·9825,CODENRUXUEWJournalofSoftware,V01.21,No.4,April2010,PP.771—781doi:lO.3724/SEJ.1001.2010.03466@byInstituteofSoftware.theChineseAcademyofSciences.Allrightsreserved.隐私保护数据发布中身份保持的匿名方法幸童云海,陶有东+,唐世渭,杨冬青(机器感知与智能教育部重点实验室(北京大学),北京100871)Identity-ReservedAnonymityinP

2、rivacyPreservingDataPublishingTONGYun-Hai,TAOYou-Dong+,TANGShi-Wei,YANGDong-Qing噼eyLaboratoryofMachinePerceptionofMinistryofEducation(PekingUniversity),Beijing100871,China)+Correspondingauthor:E—mail:taoyd@plcll.edu.cnE—mail:jos@iscas.∞.cnhttp://www.jos.org.cnTbl腰ax:+86.10.6

3、2562563TongYH,TaoYD,TangSW,YangBQ.Identity—Reservedanonymityinprivacypreservingdatapublishing·JournalofSoftware,2010,21(4):771-781.http://www.jos.org.cn/1000—9825/3466.htmAbstract:Intheresearchofpfivacypreservingdatapublishing,thepresentmethodalwaysremovestheindividualidenti

4、ficationattributesandthenanonymizesthequasi-identifierattributes.Thispaperanalyzesthesituationofmultiplerecordsoneindividualandproposestheprincipleofidentity-reservedanonymity.Thismethodreservesmoreinformationwhilemaintainingtheindividualprivacy.Thegeneralizationandloss-join

5、approachesaredevelopedtomeetthisrequirement.Thealgorithmsareevaluatedinanexperimentalscenario,reservingmoreinformationanddemonstratingpracticalapplicabilityoftheapproaches.Keywords:privacypreservation;datapublishing;anonymity;identity-reserved;lossyjoin;generalization摘要:在隐私保

6、护的数据发布研究中,目前的方法通常都是先删除身份标识属性,然后对准标识属性进行匿名处理.分析了单一个体对应多个记录的情况,提出了一种保持身份标识属性的匿名方法,它在保持隐私的同时进一步提高了信息有效性.采用概化和有损连接两种实现方式.实验结果表明,该方法提高了信息有效性,具有很好的实用性.关键词:隐私保护;数据发布;匿名;身份保持;有损连接;概化中图法分类号:TP309文献标识码:A当今社会,个人的信息记录被不同的政府部门或者机构广泛地收集和分析.为了有利于数据分析,有些机构会发布这些涉及到个人数据的信息.这些数据在发布时,一方面要保护个人隐私

7、不被泄露,另一方面又要具备足够的信息供分析使用.近年来,数据发布中的隐私保护方法从信息技术方面得到了进一步广泛的研究,并对隐私保护的程度和泄露都作了一定的定量研究.数据发布中的隐私保护试图在保护个体隐私的同时保存更多的信息有效性,群匿名[1-3]是其中的核心思想.待发布的数据表通常包含3类属性:(1)个体标识属性(individuallyidentifyingattribute,简称ID),包括可以显式表明个体身份的属性,比如姓名、身份证号码和手机号码.(2)准标识属性(quasi.identifierattribute,简称QI),可以用于链

8、接攻击的属性,并可用于表明数据保护的程度,比如性别、年龄和邮政编码.(3)敏感属性(sensitive·SupposedbytheNationalNa

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。