基于领域本体的信息抽取模式生成与系统实现

基于领域本体的信息抽取模式生成与系统实现

ID:34538073

大小:270.40 KB

页数:6页

时间:2019-03-07

基于领域本体的信息抽取模式生成与系统实现_第1页
基于领域本体的信息抽取模式生成与系统实现_第2页
基于领域本体的信息抽取模式生成与系统实现_第3页
基于领域本体的信息抽取模式生成与系统实现_第4页
基于领域本体的信息抽取模式生成与系统实现_第5页
资源描述:

《基于领域本体的信息抽取模式生成与系统实现》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库

1、情报学报ISSN1000—0135第27卷第2期193—198,2008年4月基于领域本体的信息抽取模式生成与系统实现马静吴一占刘思峰(南京航空航天大学经济与管理学院,南京210016)摘要面对情报工作者日益增长的从Internet中及时获取特定信息或知识的需求,本文展开了web信息抽取技术在情报领域的应用研究。目前,信息抽取模式的自动获取成为一个技术难点,本文尝试引入基于领域本体的半自动抽取模式获取算法,该方法在领域本体的概念层次关系、属性特征和实例的结构本体指导下,选择其主要特征属性为匹配目标,自动学习并获取抽取模式。利用该算法到

2、直升机产品信息抽取,运行结果验证:该算法简单有效,获得了较高的抽取效率和较准确的抽取结果。关键词信息抽取抽取模式产品情报DomainOntology-basedInformationExtractionMaJing,WuYizhanandLiuSifeng(ColegeofEconomicsandManagement,NanjingUniversityofAeronauticsandAstronautics,Nanjing210016)AbstractFacedwiththegrowingneedsofintelligencework

3、erstoacquirespecificinformationorknowledgeformInteract,thispaperlaunchesaWebinformationextractiontechnologyinintelligencefieldofappliedrese~ch.Atpresent,informationex~actionmodeautomaticaccessbecomesatechnicaldificulty,thepapertrytointroducethesemi—automaticextractionmo

4、dealgorithmbasedondomainontology.Withtheguidanceofrelationalhierarchybetweenconcepts,attributepropertiesandinstancesingivendomainontology,choosingthemainattributes8Sthematchedobjective,themethodlearnsandacquiresextractionmodeautomatically.Usingthisalgorithmtoproductinfo

5、rmationfromthehelicopter,operatingresultsshow:Thealgorithmissimpleandefective,achievingrelativelyhighextractioneficiencyandcollectmoreaccurateresults.Keywordsinformationextraction,extractionmode,productionintelligence技情报研究领域的Web信息抽取实用工具,突破传1引言统的信息获取模式。信息抽取技术是针对结构文档、半结构文

6、档、自网络情报收集已经成为情报工作的一种重要手由文档进行的知识抽取,去除文档中不需要的冗余段,针对公开的网络情报资源,抽取重要的信息和知信息,抽取出有用的知识,并存入结构数据库中的技识成为情报界重点关注的技术。近年来国际高新科术⋯。虽然近年来信息抽取技术得以重视和发展,技产品不断翻新,为情报人员的技术跟踪任务增大但该技术的关键和难点在于抽取模式的确定。由于了工作量。尤其是当Internet成为最大的、最及时的信息抽取对象领域性强,往往需要人工制定抽取模情报信息源时,面对信息海洋,情报人员越发不知如式,人工编写的模式库相对比较准确,但却

7、要耗费大何下手了。面对需求,我们尝试探索与开发面向科量的人力和时间。同时,手工编写的模式只能针对收稿日期:2OO7年1O月30日作者简介:马静,女,1966年生,副教授,研究方向:信息管理,知识管理。E-mail:majing5525@126.eom。吴一占,1985年生,本科生。刘思峰,男,1955年生,教授,研究方向:灰色系统理论。1)本论文是2006年国防技术基础基金项目成果之一。情报学报第27卷固定已知的知识,满足不了动态网络信息变化引起的模式不适的特点。因此,模式的自动生成得到了研究者们的极大关注,但由于涉及的技术复杂,其效

8、率和针对性普遍2基于领域本体的模式不高。生成抽取系统框架通常,模式的自动生成需要标注文本,根据对语句分析深度的不同可以把语句的标注信息分成以下模式自动生成的做法通常为:为模式自动生成几个层次:系统提供一定大小的语料库,该

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。