基于乘法扰动的数据挖掘隐私保护算法研究

基于乘法扰动的数据挖掘隐私保护算法研究

ID:32872923

大小:6.14 MB

页数:84页

时间:2019-02-17

基于乘法扰动的数据挖掘隐私保护算法研究_第1页
基于乘法扰动的数据挖掘隐私保护算法研究_第2页
基于乘法扰动的数据挖掘隐私保护算法研究_第3页
基于乘法扰动的数据挖掘隐私保护算法研究_第4页
基于乘法扰动的数据挖掘隐私保护算法研究_第5页
资源描述:

《基于乘法扰动的数据挖掘隐私保护算法研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、广东工业大学硕士学位论文基于乘法扰动的数据挖掘隐私保护算法研究姓名:石雅强申请学位级别:硕士专业:管理科学与工程指导教师:刘洪伟201205摘要当今数据挖掘技术已成为管理与商务信息智能分析的主要工具。但在其应用的同时,用户隐私数据泄露问题时常发生。所以数据挖掘中的隐私保护算法成为当今的一大研究热点,即在获得高质量数据挖掘结果的同时,如何保护用户隐私数据。不同的数据挖掘算法对应着不同的隐私保护方法,如建立决策树模型只需要知道数据的分布,所以应用加法扰动方法比较有效。建立Apriori关联规则模型只需要了解每个事务项出现的概率

2、,所以应用随机应答方法比较有效。还有一类数据挖掘算法,如K.means聚类算法,支持向量机分类算法等,这类算法的主要特点是只需要根据数据集之间的距离或点积便能建立模型,所以应用乘法扰动方法比较有效,这也是本文的研究重点。现在已研究的基于乘法扰动的数据挖掘隐私保护算法主要有旋转扰动方法(I冲)和投影扰动方法(PP),它们分别将数据以同一角度旋转或将数据从高维空间映射到低维空间。独立分量分析(ICA)作为一种从混合数据分离恢复源数据的有效工具,也可以被用来从旋转扰动数据估计得到用户数据,这极大地降低了RP方法的隐私安全水平。本

3、文研究出了已知信息独立分量分析(KK.ICA),攻击者利用它可以从投影扰动数据估计出用户数据的近似值,这也很大程度上破坏了PP的隐私安全性。因此,本文提出了新的乘法扰动隐私保护算法一局部旋转扰动方法(PRP),它将原始数据分割成若干个独立的部分,使用不同的随机正交矩阵对各部分局部旋转扰动,从而用KK.ICA不能从局部扰动数据中准确地估计得到所有用户数据。所以,PRP相比其他乘法扰动隐私保护算法具有更高的隐私安全性,而且准确性不低于以前的算法。在实验部分,本文引入了相对误差(RE)和Frobenius相对误差(F.RE)作为

4、度量方法,通过多组实验对比了PRP、PP和RP的准确性和隐私安全性,验证了PRP的优越性。由于PRP是专门针对基于距离和点积的数据挖掘算法提出的,所以本文在最后部分,将该方法分别应要到聚类挖掘和分类挖掘中,更为直观地说明了局部旋转扰动方法在数据挖掘中的实际应用。关键词:隐私保护数据挖掘;乘法扰动;局部旋转扰动;旋转扰动;投影扰动广东工业大学硕士学位论文ABSTRACTToday,dataminingtechnologyhasbecomethemaintoolformanagementandbusinessintellige

5、nceanalysis.Butwi也theapplicationsofdatamining,theproblemofdataleakageoftenhappensSOthattheuser’sprivacycan’tbeguaranteed.Consequently,thetechnologyofprivacy-preservingdatamininghasbecomeamajorresearchfocus,thatis,howtoprotectuserprivacydatawhileobtaininghighqualit

6、yresultsindatamining.Differentdataminingalgodthrnscallfordifferentprivacy-preservingtechnologies.DecisiontreeclassificationalgorithmestablishesamodelaccordingtOthedistributionofthedata.Sotheapplicationofadditiveperturbationmethodishighlyeffective.Aprioriassociatio

7、nrulesalgorithmestablishesamodelaccordingtotheoccurrenceprobabilitiesofeachobjectitem.Sotheapplicationofrandomresponsemethodisveryuseful.Thereisaclassofdataminingalgorithms,suchasK-meansclusteringalgorithm,supportvectormachinesclassifyingalgorithm,themainfeatureso

8、fthesealgorithmisthattheyonlyneedtheinformationaboutdistanceandinnerproductbetweenthedatasetstobuildmodels.Sotheapplicationofmultiplicativeperturbationm

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。