探析基于专家委员会的主动学习算法研究

探析基于专家委员会的主动学习算法研究

ID:34791138

大小:2.73 MB

页数:76页

时间:2019-03-10

探析基于专家委员会的主动学习算法研究_第1页
探析基于专家委员会的主动学习算法研究_第2页
探析基于专家委员会的主动学习算法研究_第3页
探析基于专家委员会的主动学习算法研究_第4页
探析基于专家委员会的主动学习算法研究_第5页
资源描述:

《探析基于专家委员会的主动学习算法研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、谨以此文献给所有关心和帮助过我的人——梁延U峰l木刈兰军基于专家委员会的主动学习算法研究学位论文完成日期:指导老师签字:答辩委员会成员签字:

2、11111IIIII111IIIY1828556j歪笺乙拯。因五亟△蛆I}独创声明本人声明所呈交的学位论文是本人在导师指导下进行的研究工作及取得的研究成果。据我所知,除了文中特别加以标注和致谢的地方外,论文中不包含其他人已经发表或撰写过的研究成果,也不包含未获得(注;垫递查墓丝壶要壁别应四的:奎拦亘窒!或其他教育机构的学位或证书使用过的材料。与我一同工作的同志对本研究所做的任何

3、贡献均已在论文中作了明确的说明并表示谢意。学位论文作者繇辟乒啐签字吼脚,月阳学位论文版权使用授权书本学位论文作者完全了解学校有关保留、使用学位论文的规定,并同意以下事项:l、学校有权保留并向国家有关部门或机构送交论文的复印件和磁盘,允许论文被查阅和借阅。2、学校可以将学位论文的全部或部分内容编入有关数据库进行检索,可以采用影印、缩印或扫描等复制手段保存、汇编学位论文。同时授权清华大学“中国学术期刊(光盘版)电子杂志社”用于出版和编入CNKI《中国知识资源总库》,授权中国科学技术信息研究所将本学位论文收录到《中国学位论

4、文全文数据库》。(保密的学位论文在解密后适用本授权书)新繇吖孑钇导师签字:I‘叫砂签字日期:(夕年§‘月厶日)却●J矿,炙兽汨孙月奎r者年作伽丈泛:位期学只字签基于专家委员会的主动学习算法研究摘要随着机器学习理论在指纹识别、图像检索、信用分析、网页推荐等数据分析和数据挖掘领域中的广泛应用,主动学习已经成为模式识别和机器学习中的重要研究领域,并且在理论和实际应用研究中都己获得了长足的发展。主动学习研究主要关注在标记样本较少时,如何利用大量未标记样本来改善学习器性能,它改变了传统的机器学习方式从已知样本集中进行被动学习的

5、方法,而是根据学习进程,主动选择最佳的样本进行学习,解决了传统学习方法对少量标记样本进行学习泛化能力较差的问题。基于支持向量机的主动学习算法和基于专家委员会的主动学习算法是两种研究较多的主动学习算法,但目前仍然存在学习效率不是很高,训练样本标注代价过大,对不平衡数据学习能力较差等问题。本文首先介绍了主动学习模型及其研究的内容,总结了主动学习与其他机器学习方法的区别与联系,对主动学习领域的国内外研究现状进行回顾,介绍了目前主动学习方法研究的几个思路。接着,本文详细介绍了我们在主动学习方法研究领域开展的工作:1.讨论了基

6、于不确定度缩减的主动学习方法,深入研究了该类方法中基于支持向量机的主动学习算法。针对SVM主动学习过程中,对不平衡数据集学习能力较差的问题,本文提出了一种基于SMOTE的支持向量机主动学习算法。该算法将处理小样本数据的SMOTE算法引入SVM主动学习过程中,解决了SVM主动学习在学习过程中,分类超平面偏向少数类的问题,提高了学习的速度和准确率。2.深入研究了基于版本空间缩减的主动学习方法中最具有代表性的主动学习算法⋯基于专家委员会的主动学习算法。总结了该算法中委员会成员分歧度的度量方式。深入研究了基于专家委员会的主动

7、学习算法中的委员会成员的构建方法和样本选择策略,并提出了一种改进的基于选择的专家委员会主动学习算法,算法的改进主要体现在三个方面:(1)将选择集成的思想引入到委员会成员的构建过程中,将生成的专家委员会中分类性能高,相互之间差异较大的委员会成员挑选出来重新构造一个新的专家委员会,利用新组建的专家委员会对无标注样本进行选择提交标注。(2)在选择集成的过程中,本算法并没有采用基于遗传算法的选择性集成方法,而是改用了另一种智能优化算法一粒子群优化算法,在委员会成员的权重优化过程中,粒子群算法比遗传算法精度更高、收敛速度更快,

8、且在算法实现及操作方面更加容易。(3)在委员会对样本分歧度计算方面,我们采用了投票熵和KL—d分歧度相结合的方式,使委员会选择的未标注样本更加丰富多样。3.深入研究了Decorate算法,对Active.Decorate主动学习算法中,人工虚拟样本的产生方法进行改进,改进后的算法,不仅仅使用带类别标注的训练样本数据计算均值和方差,而是使用带类别标注的和未带标注的样本集共同计算样本的均值和方差。这样产生的高斯分布函数才会更加接近真实的样本概率分布。并将改进后的Active.Decorate主动学习算法与选择集成学习方法

9、相结合,组成基于选择性的Active.Decorate主动学习算法。关键词:主动学习:选择性集成学习:粒子群算法:SMOTE;Active.DecorateResearchofOuery—by—comfflitreeMethodofActiveLearningAbstractWithMachinelearningmethodsbeingwide

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。