欢迎来到天天文库
浏览记录
ID:46601611
大小:351.74 KB
页数:5页
时间:2019-11-26
《基于实体-属性框架的领域知识库构建》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、第28卷第2期2011年4月沈阳航空航天大学学报JournalofShenyangAerospaceUniversityVOl-28No.2Apr.201文章编号:2095—1248(2011)02—0069—05基于实体一属性框架的领域知识库构建王迎春,蔡东风,叶娜(沈阳航空航天大学知识工程研究中心,辽宁沈阳110136)摘要:知识库是进行各种自然语言处理任务不可或缺的一项基础性的资源。而目前知识库的构建还是一个难点问题,尤其是以自动方式构建复杂的领域性知识库系统的研究还处于探索阶段。本文提出一种基于实体一属性框架的领域知识库自动构建方法,致力于利用航空
2、百科辞典的信息自动获取术语之间的上下位关系及部分实体属性关系,其中,基于多策略的上下位关系术语对提取融合了后缀子串匹配、模板自动构建、实质提取三种方法,分别考虑了辞典中反映上下位关系的不同信息。其中模板自动构建方法,在无需人工标注语料的情况下获得了比较好的效果。属性提取部分采用了以人工标注语料为前提的模板匹配方法。实验表明,本文系统对术语上下位关系抽取的F值达到76.0l%,对各个属性的抽取也达到了75%以上。关键词:领域知识库;实体一属性框架;上下位关系;属性;航空百科辞典中图分类号:TP391.1文献标志码:Adoi:10.3969/j.issn.20
3、95—1248.加11.02.016Theconstructionofdomainknowledgebaseundertheentity-attributeframeWANGYing—chun,CAIDong—feng,YENa(KnowledgeEngineeringResearchCenter,ShenyangAerospaceUniversity,LiaoningShenyang110136)Abstract:Knowledgebaseisanessentialbasicresourceforvariousnaturallanguageprocess
4、ingtasks.Cur-rently,theconstructionofknowledgebaseisstilladifficultproblem,andtheresearchontheautomaticcon—structionofacomplexsystemofdomainknowledgebaseisstillintheexploratorystage.Thispaperpropo—seSanautomaticconstructionmethodofdomainknowledgebaseundertheentity-attributeframe,w
5、hichaimstoautomaticallyextracttheentityhyponymyandentity··attributerelationshipbyusingtheaerospaceell--cyclopedia.Intermsofentityhyponymyextraction,amulti-strategymethodisadopted,inwhichsuffixmatching,automaticpatternconstructionandnatureextractionaresynchronizedtoreflectthediffer
6、enthy-ponymyintheencyclopedia.TheautomaticpatternconstructionmethodisprovedtObeeffectivewithoutthemanuallylabeledcorpus.Andthepatternmatchingmethodisappliedtotheattributeextractionbasedonthemanuallylabeledcorpus.ExperimentalresultshowsthattheF—SCOreofhyponymyextractionis76.01%.and
7、thatoftheattributeextractioniShigherthan75%.Keywords:domainknowledgebase;entity·attributeflame;hyponymy;attribute;aerospaceencyclopedia现有的一些大规模知识库大都关于通用领域知识。不能满足航空领域的自然语言处理系统对问题求解的知识需求。因此,需要获取专业领域知识,构建领域知识库⋯。20世纪80年代以来,国内外很多学者在知识库构建方面就做了很多的工作,如WordNet‘2J,FrameNet‘3l,HowNett41等。但是这
8、些知识库大都采用手工方式构建,人力耗费比较大。目前除了手工构建技术
此文档下载收益归作者所有