基于两次聚类的k_匿名隐私保护.pdf

基于两次聚类的k_匿名隐私保护.pdf

ID:57922738

大小:314.90 KB

页数:6页

时间:2020-04-11

基于两次聚类的k_匿名隐私保护.pdf_第1页
基于两次聚类的k_匿名隐私保护.pdf_第2页
基于两次聚类的k_匿名隐私保护.pdf_第3页
基于两次聚类的k_匿名隐私保护.pdf_第4页
基于两次聚类的k_匿名隐私保护.pdf_第5页
资源描述:

《基于两次聚类的k_匿名隐私保护.pdf》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、第27卷第2期吉林大学学报(信息科学版)Vol.27No.22009年3月JournalofJilinUniversity(InformationScienceEdition)Mar.2009文章编号:167125896(2009)0220173206基于两次聚类的k2匿名隐私保护1,221,23李太勇,唐常杰,吴江,周敏(1.西南财经大学经济信息工程学院,成都610074;2.四川大学计算机学院,成都610065;3.中国民航飞行学院计算机学院,四川广汉618307)摘要:已有的k2匿名方法忽视了准标识符对不同敏感属性的影响且只考虑了对元组本身的聚类,在数据发布时造成了较大

2、的信息损失。为此,提出一种通过两次聚类实现k2匿名的隐私保护方法。给出了影响矩阵的概念,用来描述准标识符对敏感属性的影响,研究了影响矩阵聚类技术,对敏感属性影响相近的元组进行聚类,实现k2匿名效果。实验验证结果表明,该方法具有良好的隐私保护效果,相对于基本k2匿名方法,该方法具有更小的平均等价类大小和更少的运行时间。关键词:k2匿名;隐私保护;数据安全;聚类中图分类号:TP311113文献标识码:Ak2AnonymityviaTwiceClusteringforPrivacyPreservation1,221,23LITai2yong,TANGChang2jie,WUJian

3、g,ZHOUMin(1.SchoolofEconomicInformationEngineering,SouthwestUniversityofFinanceandEconomics,Chengdu610074,China;2.SchoolofComputerScience,SichuanUniversity,Chengdu610065,China;3.CollegeofComputerScience,CivilAviationFlightUniversityofChina,Guanghan618307,China)Abstract:k2anonymityisacurrent

4、hotspotforprivacypreservation.Theexistingk2anonymousmethodsignoredthequasi2identifier’sdifferentinfluencesonthesensitiveattributesandclusteredthetuplesonly,whichcausedmuchinformationlosswhilepublishingthedata.Tocopewiththisproblem,anovelk2anonymityviatwiceclus2teringandtheconceptofinfluence

5、matrixtoexpressthequasi2identifier’sinfluencesondifferentsensitiveat2tributesareproposed.Theclusteringtechniquesoverinfluencematrixareinvestigatedandthetupleswithnearinfluencesonthesensitiveattributesareclusteredtoachievek2anonymity.Theexperimentalresultsshowthattheproposedmethodsareeffecti

6、veandfeasibletoprivacypreservation.Comparedwithbasick2anonymity,themethodshavelessaverageequivalenceclasssizeandlessruntime.Keywords:k2anonymity;privacypreservation;datasecurity;clustering引言从大量数据中发现有价值的模式是数据挖掘中的重要任务,数据越准确,挖掘出的模式越有价值。然而,准确的数据意味着将有更多的数据被共享,甚至是隐私数据。隐私数据的泄漏将严重影响隐私所有者的权益。所以,在进行数

7、据挖掘的同时,有效地保护隐私信息已成为当前研究的热点。k2匿名是一种有效保护隐私信息的方法。传统的k2匿名方法未考虑准标识符对不同敏感属性的影响。如果在进行匿名化时,将那些准标识符对敏感属性有类似影响的元组划分到同一个等价类中,则在达到匿名化的同时,将丢失更少的原始信息。而准标识符对敏感属性的影响可从领域专家或数据本身获收稿日期:2008212206基金项目:国家自然科学基金资助项目(60773169);国家科技支撑计划重大基金资助项目(2006BAI05A01)作者简介:李太勇(1979—),男,四川

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。