基于本体的故障案例信息抽取方法研究

基于本体的故障案例信息抽取方法研究

ID:46617994

大小:1.35 MB

页数:7页

时间:2019-11-26

基于本体的故障案例信息抽取方法研究_第1页
基于本体的故障案例信息抽取方法研究_第2页
基于本体的故障案例信息抽取方法研究_第3页
基于本体的故障案例信息抽取方法研究_第4页
基于本体的故障案例信息抽取方法研究_第5页
资源描述:

《基于本体的故障案例信息抽取方法研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、2015年6月第41卷第6期北京航空航天大学学报JournalofBeijingUniversityofAeronauticsandAstronauticsJune2015V01.4lNo.6http://bhxb.buaa.edu.cnjbuaa@buaa.edu.cnDOI:10.13700/j.bh.1001—5965.2014.0419基于本体的故障案例信息抽取方法研究柯倩云1,李青“,孙勇2(1.北京航空航天大学机械工程及自动化学院,北京100191;2.中航工业成都飞机设计研究所综保部,成都610000)摘要:以飞机维修保障

2、中的经验知识积累和重用为目的,针对故障案例知识由于缺乏结构化、规范化描述,导致共享与重用困难的问题,对飞机故障案例的知识表达与信息抽取方法进行了研究.首先,根据飞机故障领域的特殊性以及知识共享和重用的实际需求,建立了飞机故障案例知识的本体模型;其次,利用中文分词工具以及文本工程通用框架(GATE),研究了对故障案例信息文档的语义标注以及基于规则的信息抽取技术;最后,利用Jena推理机挖掘出隐性信息,并实现在信息抽取过程中,通过不断发现新知识,主动扩展知识库.在此基础上开发了信息抽取原型系统,实现了从多种不同类型的文档信息中抽取出结构化故

3、障案例信息,并利用数据库进行存储和管理,提高了故障案例知识的重用性,验证了研究方法的可行性.关键词:信息抽取;本体;GATE;知识管理;故障案例中图分类号:V221+.3;TB391文献标识码:A文章编号:1001-5965(2015)06.1080_07在长期的维修保障工作实践中,飞机设计、生产、使用等组织单位的服务保障部门积累了大量的飞机故障知识.然而,由于军机外场服务的特点,故障案例信息通常是隐含在维修13志中的文字描述,缺乏统一的规范,必须进行标准化、结构化处理,才能形成可共享和重用的案例知识.传统的做法是通过人工阅读日报等文档

4、,提取出相关信息,需花费大量人力成本,且效率低下.信息抽取主要是从大量文字资料中自动抽取特定信息,以作为数据库存取之用的技术⋯.在飞机故障案例知识领域运用信息抽取技术,实现案例的结构化存储,有利于后期案例检索与排故引导等活动.目前,国内外学者在信息抽取技术方面进行了大量研究.文献[2]提出了利用文本工程通用框架(GeneralArchitectureforTextEngineering,GATE)对英文文本进行信息抽取的方法,文献[3—5]通过改写GATE的词表文件,实现了中文信息抽取,但是均局限于抽取地名、13期等常用模式的信息,没有

5、利用信息之间的层次关系.文献[6-7]采用了基于本体的信息抽取技术,但是并没有利用实体间的关联关系建立推理规则,抽取出更完整的信息.飞机故障案例文档涉及大量的专业词汇,且具有一定的层次结构关系,目前还没有针对飞机故障领域的信息抽取研究,因此有必要研究针对故障案例文档的信息抽取方法.本文从知识发现的角度,通过对故障案例文档的特征研究和故障案例知识的本体建模,基于信息抽取技术,提出一种将描述型案例信息结构化的方法,对故障案例文档进行规范化处理,抽取成一个个故障案例记录,形成持久化、可共享的故障案例知识,并辅助知识管理员不断从相关文档收稿日期

6、:20144)7-11;录用日期:2014-10-11;网络出版时间:2014.11-0509:35网络出版地址:WWW.cnki.net/kcms/doi/10.13700/j.bh.1001-5965.2014.0419.html作者简介:柯倩云(1989一],女,福建厦门人,硕士研究生,yjmymh2011@163.corn+通讯作者:李青(1961一),女,湖北黄梅人,教授,liqing@buaa.edu.en,主要研究方向为装备保障信息化引用格式:柯倩云,李青,孙勇.墓于本体的故障案例信息抽取方法研究(JJ.北京航空航天大学学

7、报,2015,41∞):1080.1086.KeQY,LiQ,Suny.FaultcaseinformationextractionmethodresearchbasedonontologyfJJ.JournalofBeijingUniversityofAeronauticsandAstronautics,2015,41∞):1080—1086(inChinese).第6期柯倩云,等:基于本体的故障案例信息抽取方法研究1081中发现和收集隐藏在相关信息中的故障知识,进一步实现知识库的扩展与完善,为现场排故人员进行故障知识积累和知识重用提

8、供技术手段.故障信息抽取方法概述信息抽取是指从数字资源中识别、发现和提取出概念、类型、事实及其相关关系、约束规则,以及进行问题求解的步骤、规则的过程¨1.本体是共享概念模型的形式化规范说明¨1.它表达了概念

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。