资源描述:
《智能电网用户侧信息隐私保护方法的研究及应用》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、1第卷第期电力系统自动化Vol.No.年月日AutomationofElectricPowerSystems智能电网用户侧信息隐私保护方法的研究与应用*郭晓利,张佳佳,王秀磊(东北电力大学信息工程学院,吉林吉林132012)摘要:在智能电网的不断建设和发展过程中积累了大量的基础用电数据,这些数据不仅具有海量、高频、分散等特点,是时空、动态、关系等性质复杂的数据,而且数据之间存在关联性和相似性。因此,传统的隐私保护方法对电力数据保护会有较大的信息损失,时间损耗,基于数据分类处理的思想,提出支持多属性泛化的随机化的隐私保护方法对电力信息数据进行分级保护,将准标识符属性属性按照自底向上支持多属性
2、泛化的算法处理,敏感属性进行随机化算法处理,生成保护后的新数据表。通过与广泛应用的MBF算法,GASCG算法进行实验比较得出结论,该方法可以极大的提高隐私保护的效率降低个人信息的损失并且数据的效用性大大提高。关键词:数据分类处理;k-匿名;泛化;随机扰动;多敏感属性中图分类号:TM93文献标识码:B文章编号:1001–1390(2016)00–0000–00Theresearchandapplicationofinformationprivacyprotectionmethodforsmartgriduser-sidesinformationprivacyprotectionmethodG
3、uoXiaoli1,ZhangJiajia2,WangXiuLei3(InformationengineeringEngineeringcollegeCollege,ofNortheastDianliUniversity,Jilin132012,Jilin,China)Abstract:AAbstract:greatdealofbasicdataAgreatdealofbasicelectricitydatahasbeenconstructedinthedevelopmentofelectricitysmartgridhavebeenconstructed.Thesedataarenoto
4、nlymassive,high-frequency,dispersionandthenatureoftimeandspace,dynamichas,complexdatarelationships,andbutalsothereisrelevanceandcomparabilitybetweenthedata.Thereforedata.Therefore,thetraditionalmethodofprivacyprotectionwillcausegreaterimformationinformationlossandtimeconsumption.Basedconsumption.B
5、asedontheideaofdataclassification,thispaperproposedamethodwhichcanprotectthepowerratinginformation.Bottominformation.Anewdatatableprotectionisconductedthroughbottom-upgeneralizationthequasi-identifierattributes,andtherandomizedsensitiveattributes,thenattributesarerandomizedgenerateanewdatatableaft
6、erprotection.TheexperimentresultsshowthatcomparedwiththewidelyusedalgorithmMBFandGASCG,themethodcangreatlyimprovetheefficiencyoftheprivacyprotectionwhilereducethelesspersonalinformationandtheeffectivenessofdataisgreatlyincreased.Keywords:disposaldifferentkindsofdata,k-annonmyanonym,generalization,
7、stochasticdisturbance,multi-sensitiveattributes1第??卷第??期电测与仪表Vol.??No.50420??年第??期ElectricalMeasurement&InstrumentationDec.20??0引言在智能电网的不断建设和发展过程中积累了大量的基础用电数据,这些数据不仅具有海量、高频、分散等特点,是时空、动态、关系等性质复杂的数据,而且数据之间存在关联性和相似性