欢迎来到天天文库
浏览记录
ID:34641118
大小:874.02 KB
页数:14页
时间:2019-03-08
《隐私保护数据发布中身份保持的匿名方法》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库。
1、万方数据ISSN1000·9825,CODENRUXUEWJournalofSoftware,V01.21,No.4,April2010,PP.771—781doi:lO.3724/SEJ.1001.2010.03466@byInstituteofSoftware.theChineseAcademyofSciences.Allrightsreserved.隐私保护数据发布中身份保持的匿名方法幸童云海,陶有东+,唐世渭,杨冬青(机器感知与智能教育部重点实验室(北京大学),北京100871)Identity-ReservedAnonymityinP
2、rivacyPreservingDataPublishingTONGYun-Hai,TAOYou-Dong+,TANGShi-Wei,YANGDong-Qing噼eyLaboratoryofMachinePerceptionofMinistryofEducation(PekingUniversity),Beijing100871,China)+Correspondingauthor:E—mail:taoyd@plcll.edu.cnE—mail:jos@iscas.∞.cnhttp://www.jos.org.cnTbl腰ax:+86.10.6
3、2562563TongYH,TaoYD,TangSW,YangBQ.Identity—Reservedanonymityinprivacypreservingdatapublishing·JournalofSoftware,2010,21(4):771-781.http://www.jos.org.cn/1000—9825/3466.htmAbstract:Intheresearchofpfivacypreservingdatapublishing,thepresentmethodalwaysremovestheindividualidenti
4、ficationattributesandthenanonymizesthequasi-identifierattributes.Thispaperanalyzesthesituationofmultiplerecordsoneindividualandproposestheprincipleofidentity-reservedanonymity.Thismethodreservesmoreinformationwhilemaintainingtheindividualprivacy.Thegeneralizationandloss-join
5、approachesaredevelopedtomeetthisrequirement.Thealgorithmsareevaluatedinanexperimentalscenario,reservingmoreinformationanddemonstratingpracticalapplicabilityoftheapproaches.Keywords:privacypreservation;datapublishing;anonymity;identity-reserved;lossyjoin;generalization摘要:在隐私保
6、护的数据发布研究中,目前的方法通常都是先删除身份标识属性,然后对准标识属性进行匿名处理.分析了单一个体对应多个记录的情况,提出了一种保持身份标识属性的匿名方法,它在保持隐私的同时进一步提高了信息有效性.采用概化和有损连接两种实现方式.实验结果表明,该方法提高了信息有效性,具有很好的实用性.关键词:隐私保护;数据发布;匿名;身份保持;有损连接;概化中图法分类号:TP309文献标识码:A当今社会,个人的信息记录被不同的政府部门或者机构广泛地收集和分析.为了有利于数据分析,有些机构会发布这些涉及到个人数据的信息.这些数据在发布时,一方面要保护个人隐私
7、不被泄露,另一方面又要具备足够的信息供分析使用.近年来,数据发布中的隐私保护方法从信息技术方面得到了进一步广泛的研究,并对隐私保护的程度和泄露都作了一定的定量研究.数据发布中的隐私保护试图在保护个体隐私的同时保存更多的信息有效性,群匿名[1-3]是其中的核心思想.待发布的数据表通常包含3类属性:(1)个体标识属性(individuallyidentifyingattribute,简称ID),包括可以显式表明个体身份的属性,比如姓名、身份证号码和手机号码.(2)准标识属性(quasi.identifierattribute,简称QI),可以用于链
8、接攻击的属性,并可用于表明数据保护的程度,比如性别、年龄和邮政编码.(3)敏感属性(sensitive·SupposedbytheNationalNa
此文档下载收益归作者所有