欢迎来到天天文库
浏览记录
ID:10336307
大小:50.50 KB
页数:2页
时间:2018-07-06
《基于组合分类器的生物命名实体识别》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库。
1、基于组合分类器的生物命名实体识别 论文摘要:生物命名实体识别是一项非常重要和基础的生物医学文本挖掘技(略)键的一个步骤,只有正确地识别出生物命名实体,才能有效地完成基因标准化、生物事件抽取以及蛋白质-蛋白质交互关系抽取等更加复杂的工作.生物医学命名实体包括(略)、DNA、RNA等,通常有着复杂的结构,对于这些实体的鉴别和分类是非常富有挑战性的.机器学习方法例如CRF、MEMM和SVM已经广泛的应用于从已标注的语料中学习识别出生物医学命名实体.然而,生物命名实体识别系统的性能仍然没有普通命名实体识别系统的好.(略)高生物命名实体识别的性能,研究者提出了合并多个分类器结果的多分类
2、器方法.本文主要研究基于组合分类器的生物命名实体识别方法,实验是在BioCreAtIvE2GM的训练语料和测试语料上进行的.本文主(略)下两点:⒈构建单一分类器模型本文利用不同的分类模型、不同的分类方法和特征集构建了六个不同的机器学习模型,并对每种模型采用的特征集,特征抽取方法,以及训练过程进行了详细介绍.(略)提高最大熵方法的识别性能,本文采用TBL方法对最大熵的标注结果进行了纠错处理.实验结果显示纠错处理在很大程... BiomedicalNamedEntityRecognition(Bio-NER)is(omitted)lyimportantandfundamental
3、taskofbiomedicaltextmining,andisalsoacriticalstepforbiomedicaltextmining,onlyitted)iesarecorrectlyi(omitted)couldothermoreplextasks,suchas,genenormalization,biomedicaleve(omitted)tionandprotein-proteininteractionextraction,beperformedeffectively.Biomedicalnamedentitiesincludementionsofprotei
4、ns,genes,DNA,RNA,etcitted)omplexstructures,butitischa... 目录: 摘要第4-5页 Abstract第5-6页 1绪论第9-16页 研究背景与意义第9-10页 研究现状第10-14页 本文主要研究内容第14页 本文组织结构第14-16页 2机器学习模型第16-25页 支持向量机模型第16-18页 最优分类超平面第16页 核函数第16-17页 SVM多分类问题扩展方法第17-18页 最大熵模型第18-20页 条件随机场模型第20-24页 CRF的无向图结构第21-22页 CRF与势函数第22-
5、23页 CRF的参数估计第23-24页 本章小结第24-25页 3单一分类器的构建第25-40页 实验语料及语料的预处理方法第25-26页 有效的特征信息第26-28页 不同单一分类器的构建第28-38页 基于条件随机场的生物命名实体识别第29-32页 基于支持向量机的生物命名实体识别第32-34页 最大熵方法的生物命名实体识别第34-38页 本章小结第38-40页 4基于组合分类器的生物命名实体识别方法第40-46页 组合分类器方法第40-43页 后处理第43-45页 本章小结第45-46页 5实验与结果分析第46-54页 单个分类器实验结果第
6、46-47页 组合分类器方法的识别结果第47-52页 集合并/交操作方法实验结果第47-49页 投票方法实验结果第49-50页 叠加方法实验结果第50-51页 结果比较与分析第51-52页 错误分析与总结第52页 本章小结第52-54页 结论第54-55页
此文档下载收益归作者所有