基于信息熵差异性度量的数据流增量集成分类算法-论文.pdf

基于信息熵差异性度量的数据流增量集成分类算法-论文.pdf

ID:57924619

大小:2.94 MB

页数:11页

时间:2020-04-14

基于信息熵差异性度量的数据流增量集成分类算法-论文.pdf_第1页
基于信息熵差异性度量的数据流增量集成分类算法-论文.pdf_第2页
基于信息熵差异性度量的数据流增量集成分类算法-论文.pdf_第3页
基于信息熵差异性度量的数据流增量集成分类算法-论文.pdf_第4页
基于信息熵差异性度量的数据流增量集成分类算法-论文.pdf_第5页
资源描述:

《基于信息熵差异性度量的数据流增量集成分类算法-论文.pdf》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库

1、研究与开发基于信息熵差异性度量的数据流增量集成分类算法琚春华,邹江波(1.浙江工商大学信息学院杭州310018;2.浙江工商大学现代商贸研究中心杭州310000)摘要:对分类器之间的差异性进行了研究,提出了一种基于信息熵差异性度量的增量集成分类算法,将信息熵差异性度量方法融人到基分类器选择过程中,通过对训练数据集的基分类结果的信息熵差异度计算,采用循环迭代优化的选择方法,以熵差异性最优化为约束目标,动态调整基分类器个数,实现了分类准确稳定,减少了系统开销。通过实验比对,证明了算法在数据流处理时比其他算法具

2、有更小的开销和较强的适应性。关键词:集成分类器;差异性度量;信息熵;增量集成;数据流doi:10.11959/j.issn.1000—0801.2015014AnIncrementalClassificationAlgorithmforDataStreamBasedonInformationEntropyDiversityMeasureJuChunhua,_.ZouJiangbo,f1.SchoolofComputerScience&InformationEngineering,Hangzhou31001

3、8,China;2.CenterforStudiesofModemBusiness,ZhejiangGongshangUniversity,Hangzhou310018,China)Abstract:Thediversitybetweenclassifierswasstudiedandanincrementalclassificationalgorithmfordatastreambasedoninformationentropydiversitymeasurewasproposed,themethodo

4、finformationentropydiversitymeasurewasintegratedintotheselectionprocessofbaseclassifiers,theinformationentropydiversityofbaseclassifierwhichtrainedfromtrainingdatawascalculated,bymeansofcycliciterativeasoptimizationmethodandentropydiversityasoptimizationc

5、onstrainedgoal,thenumbersofbaseclassifierswasdynamicadjustedthatimprovedtheclassificationaccuracyandstabilitytoreducesystemcosts.Theexperimentsprovethatthealgorithmhaslesscostandstrongadaptabilitycomparewithotherdatastreamalgorithmwhenprocessingdatastream

6、.Keywords:ensembleclassifier,diversitymeasure,entropyofinformation,incrementalensemble,datastream等静态数据集与动态数据流挖掘分析领域,尤其是运用集1引言成学习思想对数据流动态分类的研究已成为目前热点之一。自Hansen和Salamon于1990年首次提出神经网络集参考文献【l】提出了将Boosting算法应用于数据流分成的概念以来.集成学习方法被国内外许多学者应用于文类过程中,通过对数据样本动态分配权重,实现

7、了具有自本分类、语音识别、地震波分析、通信网络、网上交易日志适应数据流动态变化和噪声数据流的集成分类挖掘方法。收稿日期:2014—09—13;修回日期:2014一l1一o4基金项目:国家科技支撑计划基金资助项目(No.2012BAI34B01.5),浙江省自然科学基金资助项目(No.LY14F020002),教育部人文社会科学重点研究基地基金资助项目(No.14JJD630011)FoundationItems:TheNationalKeyTechnologyR&DProgram(No.2012BAI34

8、B01—5),TheNaturalScienceFoundationofZhejiangProvinceofChina(No.LY14F020002),TheKeyMinistryofEducation,HumanitiesandSocialSciencesProject(No.14JJD630011)_考锵参考文献f21提出了通过动态修改多分类器中决策权值参是针对数据流挖掘,本文基于分类器中信息熵差异性度数,增强对数据流突变

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。