欢迎来到天天文库
浏览记录
ID:34698315
大小:4.52 MB
页数:168页
时间:2019-03-09
《领域文本知识获取方法的研究及其在考古领域中应用的论文》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、领域史奉知识扶取方j土研咒及韭庄考古领域中的应用t摘要摘要互联网时代,信息爆炸,全球一体化,使信息的来源、数量和形式发生了根本的变化。如何用智能化的手段处理网上的海量文本信息已成为一个十分紧迫的问题.将信息转变为知识、将信息基础设施发展为知识基础设施是二十一世纪的重要科研方向,旨在实现。在恰当的时间,以恰当的语言,恰当的粒度,将恰当的信息提供给恰当的人们”的目标。当前最热门的领域之一是“文本挖掘”,即从巨量的非结构化文本中抽取信息。这就为文本知识获取提出了新的挑战和迫切需求.本文主要针对领域概念获取
2、、领域概念上下位关系学习、描述流提取、领域个体知识获取的方法,以及它们在考古领域中的应用,开展了如下几个方面的研究工作:(I)一种提取领域概念的混合式方法.日前,在信息检索、文本分类、主题跟踪和探测等文本处理和分析任务中,通常足以“词”作为特征项的。然而这些词并不一定能忠实地表达文本的内容、类别和主题。这一问题在处理领域文本时显得尤为突出,已经阻碍了文本处理任务的发展。领域概念首先是一个词,并为实体概念、或性质概念、或关系概念。领域概念能够更加准确和忠实地表达文本的内容.本文的混合式方法融汇了规则、
3、统计、句法和语义信息来识别概念。该方法首次引入主动词和语义角色识别来提取领域概念,提出了基于语料学习的主动词识别方法,设计了主动词和面向知识获取的语义模型驱动的语义角色识别方法。通过与分词系统实验结果相比,验证了该方‘法的有效性。(2)多策略的领域概含上下位关系学习方法。领域概念上下位关系学习是指基于已构建的上下位关系概念对来学习未知的上下位关系概念对.本文提出了三种学习策略:种子上下位关系概念对驱动和并列语境启发的学习方法、基于上下位关系语境的学习方法,以及领域概念构词法驱动的学习方法。前两种方法
4、是根据上下位关系概念对所处的上下文来提取的,第三种方法是根据概念的内部构成规律来提取的。这些方法是由学习Agent来完成的,它由已知知识、学习条件和获取知识三部分构成,采用框架和一阶逻辑表示,因此学习Agent具有良好的扩展性。(3)一种领域本体驱动的描述流提取方法。通过信息检索、文本分类和主题检测和跟踪等文本处理和分析等任务,我们能够了解文本的内容。但是,我们仍然难以知道文本描述了主题的哪些方面以及它们的描述顺序。因此,我们提出了一个新的文本分析任务——描述流提取。描述流是指文本的主题、主题的描述
5、方面以及它们出现的偏序关系。本文采用了一种领域本体驱动的描述流提取方法,描述流提取是为领域个体知识获取服务的。通过实验验证了该方法的可行性。领域文奉知识获取方j杰研究及戴在Z古颈域中的应用t摘要(4)一种牺驱动的多层语境的领域个体知识获取方法。首先根据槽词汇在文本中的出现情况,将槽分为显式槽,隐式槽和混合槽。然后根据槽的分类提出了三种领域个体知识获取方法。第一种是本体层级语境与槽驱动的显式槽的知识获取;第二种是本体层级语境与槽值驱动的隐式槽的知识获取;第三种是语言层级语境驱动的隐式槽的知识获取.以往
6、知识获取方法中采用的语境是基于语言层的,一个语言层语境只能提取个体的一个或几个槽的槽值.本文提出了一种本体层语境,是语言层语境的一种抽象和概括,一个本体层语境可以提取个体的一类槽的槽值.它是从本体的角度为知识获取而设计的.根据语境构成、语境关系、语境内容和共享性构建了语境的分类体系,从而将庞杂繁多的语境进行了有机地组织和分类。(5)语境的构建、扩充、匹配和验证方法.语境是进行领域个体知识获取的重要依据,语境的数量和质量对获取知识起着举足轻重的作用。为了快速准确地获取大量领域知识,需要研究语境构建、学
7、习,匹配和验证等问题,目的是减少构建语境的数量和有效解决语境爆炸和人工构建费时费力问题。本文提出了基于聚类的语境构建方法;引入了两种语境之间的操作泛化和合并来扩充语境。基于语境的项之间的等同关系和蕴涵关系,分析了语境匹配冲突的本质原因和面向项的语境匹配冲突消解方法。最后提出了一种基于有序决策表的语境验证方法,用于验证语境的冗余性和矛盾性。关键词;国家知识基础设施,领域知识获取本体,领域概念获取,领域概念上下位关系学习,描述流提取,个体知识获取,信息提取,语境,考古领域领域文奉知识扶取方泣研究压韭在考
8、古颚,点中的应用=AbslradAResearchonMethodsofKnowledgeAcquisitionfromDomain—SpecificTextsandTheirApplicationinKnowledgeAcquisitionfromArchaeologicalTextsZhangChunxia(ComputerSoftwareandTheories)DirectedbyCanCungenIntheCUlleatinteractage,thevolum
此文档下载收益归作者所有