欢迎来到天天文库
浏览记录
ID:57924382
大小:811.44 KB
页数:6页
时间:2020-04-14
《基于动态分类树构造的集值型数据差分隐私保护方法-论文.pdf》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库。
1、第32卷第8期计算机应用研究Vo1.32No.82015年8月ApplicationResearchofComputersAug.2015基于动态分类树构造的集值型数据差分隐私保护方法术郑剑,黄奚芳,刘聪(江西理工大学信息工程学院,江西赣州341000)摘要:基于分类树划分的差分隐私方法能有效地对集值型数据的发布进行保护,但在构造分类树时该方法没有充分利用集值型数据集自身的特征。通过对添加噪声量的影响因素分析,提出了一种基于数据集特征的集值型数据发布方法,该方法首先对数据集进行分析,然后根据数据集中记录的种类数占总输出域的比例以及只出现一次的记录种类数占总输出域比例,动态构造分类树。实验
2、结果表明:当数据集满足IOR≤40%且SIOR=(5%,20%]时,通过有效利用集值型数据集的特征,构造较优的分类树,可以添加少于10%的噪声。关键词:分类树;差分隐私保护;集值型数据;数据集特征中图分类号:TP309.7文献标志码:A文章编号:1001.3695(2015)08.2420.05doi:10.3969/j.issn.1001-3695.2015.08.042Constructingtaxonomytreebaseddynamicmethodfordifferentialprivacypreservingset—valueddataZhengJian,HuangXi~ng十
3、LiuCong,(SchoolofInformationEngineering,JiangxiUnivemi~ofScience&Technology,GanzhouJiangxi341000,China)Abstract:Taxonomytreepartitioningbasedmethodfordiferentialprivacycouldprotecttheeffectivereleasingofset.valueddata.However.taxonomytreedoesnottakethecharacteristicsofset—valueddatasetsintoconsid
4、erationoftreeconstruction.Byanalyzingtheinfluencefactorsofaddednoise,thispaperproposedanovelmethodthatreleasesset,valueddatabasedonthecharacteristicsofdatasets.Thismethodfirstlyanalyzedthedatasets,andthendynamicallyformedtaxonomytreestructureac.cordingtothetypesofrecordsinthedatasetandtheproporti
5、onbetweenthetotaloutputofasinglerecordfieldandthetotalnumberofspeciesappearedinproportionaloutputfields.Theexperimentalresultsshowthattheproposedmethodcaneffective.1yutilizethecharacteristicsofset.valueddatasets,whenthedatasetsconditionssatisfyIOR≤40%andSIOR=(5%,20%].constructingsuperiortaxonomyt
6、reeandreducingnoisetolessthan10%.Keywords:taxonomytree;differentialprivacy;set.valueddata;datasetscharacteristics的噪声量与数据集的大小无关,对于大型的数据集,仅通过添0引言加极少量的噪声就能达到高级别的隐私保护。这种保护模型大大降低了隐私泄露的风险,同时极大地保证了数据的可用随着社会信息化和网络化的蓬勃发展,越来越多的数据信性。因此该方法在2006年一经提出就在国外掀起一股研究热息在网络中被公开发布。预计到2020年,全球制造、复制出的潮J,但在国内还处于起步阶段。数字信息量
7、将达到40ZB。作为信息资料的一种,集值型数据(set—valueddata)(如医院诊断记录、在线查询记录、证券交易传统隐私保护下的集值型数据通常是使用k-anonymity模数据等)的发布将有利于数据挖掘等研究,然而这些数据资料型来保护数据的。Terrovitis等人提出的(k,m)-anonymity隐中包含个人敏感信息,在网络上发布和共享这些信息资料会给私原则是通过泛化层次树对集值型元数据中的一些或是全部个人隐私带来严重威胁
此文档下载收益归作者所有