基于领域本体和语块分析的信息抽取的研究与实现

基于领域本体和语块分析的信息抽取的研究与实现

ID:33532413

大小:403.00 KB

页数:6页

时间:2019-02-26

基于领域本体和语块分析的信息抽取的研究与实现_第1页
基于领域本体和语块分析的信息抽取的研究与实现_第2页
基于领域本体和语块分析的信息抽取的研究与实现_第3页
基于领域本体和语块分析的信息抽取的研究与实现_第4页
基于领域本体和语块分析的信息抽取的研究与实现_第5页
资源描述:

《基于领域本体和语块分析的信息抽取的研究与实现》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库

1、JOURNALOFTHECHINASOCIETYFORSCIENTIFIC情报学报ISSN1000—0135ANDTECHNICALINFORMATIONISSN1000一O135第29卷第1期53—58,2010年2月Vo1.29No.1.53—58February2010doi:10.3772/j.issn.1000—0135.2010.O1.008基于领域本体和语块分析的信息抽取的研究与实现’丁晟春刘逶迤熊霞梅健(南京理工大学经济管理学院信息管理系,南京210094)摘要为了提高信息抽取过程中的语义深层次的理解和准确率,本文提出了--一种基于领域本体

2、和语块分析的语义信息抽取方法,在详细说明其信息抽取模型的基础上,重点针对命名实体识别、词性组合模板、基于本体的三元组和二元组规则等关键问题进行了深入的分析和研究,提出了相应的解决方法,并进行了相关试验性研究。结果表明:采用本文所述的系统结构及其技术构建文本信息抽取系统是可行的,其能在深层次语义理解的基础上进一步提高信息抽取的准确率。关键词领域本体语块分析信息抽取ResearchandImplementationofInformationExtractionBasedonDomainOntologyandChunkParsingDingShengchun,L

3、iuWeiyi,XiongXiaandMeiJian(NangUniversityofScienceandTechnology,Nanfing210094)AbstractInordertoimprovedeep.rootedsemanticunderstandingandprecisionininformationextractionprocess,thispaperproposesasemanticinformationextractionmethodbasedondomainontologyandChunkParsing.TheChinesename

4、dentity.recognition,thetemplateofpart—oGspeech’Scombination,thetripleand2-tuplerulesbasedonontologyaswellasthesolutionsaremainlyExperimentalStudied.Theexperimentalresultsshowthatconstructingatextinformationextractionsystembasedonthetechnologyschemesdescribedinthispaperisfeasibly,t

5、hemethodcanimprovetheprecisionofinformationextraction.Keywordsinformationextraction,domainontology,chunkparsing篇章分析技术、多语言文本处理能力、Web信息抽取1问题的提出以及对时问信息的处理等。。在探索深层次理解技术、篇章分析技术方面,基于统计学习方法在解决信息抽取是指从一段文本中抽取指定的事件、自然语言理解的浅层问题方面比较有效,而基于知事实等信息,形成结构化的数据并填入一个数据库识工程方法能解决自然语言理解深层问题,但该方中供用户查询使用的过

6、程⋯。近几年,信息抽取技法要求编制规则的知识工程师对该知识领域有深入术的研究主要侧重于以下几个方面:利用机器学习的了解,开发的过程非常耗时耗力。技术增强系统的可移植能力、探索深层次理解技术、由于领域本体具有良好的概念层次结构和对逻收稿日期:2008年8月11日作者简介:丁晟春,女,1971年生,情报学硕士,南京理工大学信息管理系副教授,研究方向:网络信息资源的开发与利用、企业信息系统的建设。E.mail:todingding@163.corn。刘逶迤,男,1973年生,讲师,南京理工大学情报学博士在读,研究方向:信息构建。熊霞,女,1985年生,中国农业科

7、学院农业信息研究所情报学硕士在读,研究方向:信息组织。梅健,男,1986年生,南京理工大学情报学硕士在读,研究方向:信息抽取。1)本文相关研究得到南京理工大学发展基金(JGQN0706)以及总装备部技术基础项目(08QB019)的资助。情报学报第29卷第1期2010年2月辑推理的支持,基于领域本体的信息抽取不仅能找Stepl:选取Web页面。本文的研究基于这样一到特定类型的待抽取实体,还能通过在本体中的概个假设:每个生成的规则只针对Web数据源中的某念把它链接到其语义描述上来识别它。语块分析是一类页面。一般情况下,所要处理的文档都是成批近年来自然语言处理领

8、域出现的一种新的语言处理的,并且这些文档都是按某一种或几种结构出现

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。