基于动态分类树构造的集值型数据差分隐私保护方法-论文.pdf

基于动态分类树构造的集值型数据差分隐私保护方法-论文.pdf

ID:57924382

大小:811.44 KB

页数:6页

时间:2020-04-14

基于动态分类树构造的集值型数据差分隐私保护方法-论文.pdf_第1页
基于动态分类树构造的集值型数据差分隐私保护方法-论文.pdf_第2页
基于动态分类树构造的集值型数据差分隐私保护方法-论文.pdf_第3页
基于动态分类树构造的集值型数据差分隐私保护方法-论文.pdf_第4页
基于动态分类树构造的集值型数据差分隐私保护方法-论文.pdf_第5页
资源描述:

《基于动态分类树构造的集值型数据差分隐私保护方法-论文.pdf》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库

1、第32卷第8期计算机应用研究Vo1.32No.82015年8月ApplicationResearchofComputersAug.2015基于动态分类树构造的集值型数据差分隐私保护方法术郑剑,黄奚芳,刘聪(江西理工大学信息工程学院,江西赣州341000)摘要:基于分类树划分的差分隐私方法能有效地对集值型数据的发布进行保护,但在构造分类树时该方法没有充分利用集值型数据集自身的特征。通过对添加噪声量的影响因素分析,提出了一种基于数据集特征的集值型数据发布方法,该方法首先对数据集进行分析,然后根据数据集中记录的种类数占总输出域的比例以及只出现一次的记录种类数占总输出域比例,动态构造分类树。实验

2、结果表明:当数据集满足IOR≤40%且SIOR=(5%,20%]时,通过有效利用集值型数据集的特征,构造较优的分类树,可以添加少于10%的噪声。关键词:分类树;差分隐私保护;集值型数据;数据集特征中图分类号:TP309.7文献标志码:A文章编号:1001.3695(2015)08.2420.05doi:10.3969/j.issn.1001-3695.2015.08.042Constructingtaxonomytreebaseddynamicmethodfordifferentialprivacypreservingset—valueddataZhengJian,HuangXi~ng十

3、LiuCong,(SchoolofInformationEngineering,JiangxiUnivemi~ofScience&Technology,GanzhouJiangxi341000,China)Abstract:Taxonomytreepartitioningbasedmethodfordiferentialprivacycouldprotecttheeffectivereleasingofset.valueddata.However.taxonomytreedoesnottakethecharacteristicsofset—valueddatasetsintoconsid

4、erationoftreeconstruction.Byanalyzingtheinfluencefactorsofaddednoise,thispaperproposedanovelmethodthatreleasesset,valueddatabasedonthecharacteristicsofdatasets.Thismethodfirstlyanalyzedthedatasets,andthendynamicallyformedtaxonomytreestructureac.cordingtothetypesofrecordsinthedatasetandtheproporti

5、onbetweenthetotaloutputofasinglerecordfieldandthetotalnumberofspeciesappearedinproportionaloutputfields.Theexperimentalresultsshowthattheproposedmethodcaneffective.1yutilizethecharacteristicsofset.valueddatasets,whenthedatasetsconditionssatisfyIOR≤40%andSIOR=(5%,20%].constructingsuperiortaxonomyt

6、reeandreducingnoisetolessthan10%.Keywords:taxonomytree;differentialprivacy;set.valueddata;datasetscharacteristics的噪声量与数据集的大小无关,对于大型的数据集,仅通过添0引言加极少量的噪声就能达到高级别的隐私保护。这种保护模型大大降低了隐私泄露的风险,同时极大地保证了数据的可用随着社会信息化和网络化的蓬勃发展,越来越多的数据信性。因此该方法在2006年一经提出就在国外掀起一股研究热息在网络中被公开发布。预计到2020年,全球制造、复制出的潮J,但在国内还处于起步阶段。数字信息量

7、将达到40ZB。作为信息资料的一种,集值型数据(set—valueddata)(如医院诊断记录、在线查询记录、证券交易传统隐私保护下的集值型数据通常是使用k-anonymity模数据等)的发布将有利于数据挖掘等研究,然而这些数据资料型来保护数据的。Terrovitis等人提出的(k,m)-anonymity隐中包含个人敏感信息,在网络上发布和共享这些信息资料会给私原则是通过泛化层次树对集值型元数据中的一些或是全部个人隐私带来严重威胁

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。