资源描述:
《基于机器学习的实体关系抽取方法》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、第9期刘方驰等:基于机器学习的实体关系抽取方法•63•2013-0932(9)兵工自动化OrdnanceIndustryAutomation©1994-2013ChinaAcademicJournalElectronicPublishingHouse.Allrightsreserved,http://www.cnki.net第9期刘方驰等:基于机器学习的实体关系抽取方法•63•©1994-2013ChinaAcademicJournalElectronicPublishingHouse.Allrightsreserved,http://www.
2、cnki.net第9期刘方驰等:基于机器学习的实体关系抽取方法•63•doi:10.7690/bgzdh.2013.09.017©1994-2013ChinaAcademicJournalElectronicPublishingHouse.Allrightsreserved,http://www.cnki.net第9期刘方驰等:基于机器学习的实体关系抽取方法•63•©1994-2013ChinaAcademicJournalElectronicPublishingHouse.Allrightsreserved,http://www.cnki.n
3、et第9期刘方驰等:基于机器学习的实体关系抽取方法•63•基于机器学习的实体关系抽取方法刘方驰,钟志农,雷霖,吴烨(国防科学技术大学电子科学与工程学院,长沙)摘要:实体关系抽取是信息抽取的一项重要内容,总结现有的方法对于该领域的发展具有指导和借鉴意义。结合当前的研究进展,分析和比较了有监督、无监督和弱监督3类关系抽取方法的原理和代表性算法,总结了各类方法的特性并对关系抽取的发展趋势进行了展望。关键词:实体关系抽取;机器学习;有监督;无监督;弱监督中图分类号:TP303文献标志码:AEntityRelationExtractionMethodBa
4、sedonMachineLearningLiuFangchi,ZhongZhinong,LeiLin,WuYe(SchoolofElectronicScience&Engineering,NationalUniversityofDefenseTechnology,Changsha,China)Abstract:Relationextractionisanimportantsectionofinformationextraction,summarizationoftheexistingmethodsisinstructionalforthedev
5、elopingofthisfield.Combinedwiththecurrentresearchstatus,firstly,analyzedandcomparedtheprincipleandrepresentativealgorithmsofthreerelationextractionmethods,includingsupervised,unsupervisedandsemi-supervisedbasedonmachineleaning,thensummarizedthecharacteristicofallthethreemeth
6、ods.Finally,putforwardoutlookfordevelopmenttendency.Keywords:entityrelationextraction;machinelearning;supervised;unsupervised;semi-supervised©1994-2013ChinaAcademicJournalElectronicPublishingHouse.Allrightsreserved,http://www.cnki.net第9期刘方驰等:基于机器学习的实体关系抽取方法•63•©1994-2013Chin
7、aAcademicJournalElectronicPublishingHouse.Allrightsreserved,http://www.cnki.net第9期刘方驰等:基于机器学习的实体关系抽取方法•63•0引言面对着来自互联网和其他渠道的文本数据的爆炸式増长,如何从这些非结构化数据中获取所需要的信息成为困扰人们的一个难题,在这种情况下,信息抽取技术应运而生。信息抽取(informationextraction)技术,是指从一段文本或其他形式的非结构化数据中抽取特定的实体、事件、关系等信息,形成结构化的数据存储成关系数据库、XML数据形式
8、,供用户查询和使用的过程。信息抽取的任务包括命名实体识别、句法分析、关系抽取、篇章分析与推理、知识获取等,其中命名实体识别是信息抽取系统中最基础的工作