基于汉语框架本体的网络标注模型构建

基于汉语框架本体的网络标注模型构建

ID:9133305

大小:79.00 KB

页数:7页

时间:2018-04-18

基于汉语框架本体的网络标注模型构建_第1页
基于汉语框架本体的网络标注模型构建_第2页
基于汉语框架本体的网络标注模型构建_第3页
基于汉语框架本体的网络标注模型构建_第4页
基于汉语框架本体的网络标注模型构建_第5页
资源描述:

《基于汉语框架本体的网络标注模型构建》由会员上传分享,免费在线阅读,更多相关内容在应用文档-天天文库

1、基于汉语框架本体的网络标注模型构建赵文娟山西大学商务学院网络资源的语义标注和语义挖掘是当前信息检索研宄的重点和难点。为挖掘IM络文本的语义,根据句子的句法结构和句中谓词分析出各实词在句中所承担的语义角色,并作出相应的语义标注。文章根据对网络标注流程和功能的分析,构建了网络标注模型,R在将基于汉语框架本体的语义标注技术应用于互联网,为未来问答式、对话式的智能化检索服务。关键词:框架本体;语义标注;网络标注;标注模型;基金:山西大学商务学院院级科研课题:基于汉语框架的网络事件抽取及和关算法研究(2016009)ConstructionofNetworkAnnotationModelBasedont

2、heFrameworkofChineseOntologyBusinesscollegeofShanXiUniversity;Abstract:Semanticannotationandsemanticminingofnetworkresourcesistheemphasisancldifficultyinthecurrentinformationretrievalstudy.Forminingthenetworktextsemantics,accordingtothesyntacticstructureofthesentenceandsentencepredicateanalysisthese

3、manticroleofeverycontentwordinsentence,andmakecorrespondingsemanticannotation.Thepaperbasedontheanalysisofnetworkannotationprocessesandfunctions,constructingthenetworkmodel.AimedatthesemanticannotationtechniquebasedontheframeworkofChineseontologywillbeappliedtotheInternet,serviceforfuturequestion-an

4、d-answeranddialoguetypeintelligentretrievalservice.Keyword:Frameworkontology;Semanticannotation;Networkannotation;Annotationmodel;一、导言传统的网络标注更多的是对网络数据进行主题分析,将识别其重耍特征的标题词、叙词、关键词、人名等符号设置标签,赋予确切的检索标识,用以反映该文献内容。这样的标注缺少对数据的语义挖掘。语义标注是自然语言处理屮语义分析的主要技术,即根据句子的句法结构和句中每个实词的词义推导出能够反映这个句子意义的某种形式化表示。语义角色标注是语义分析的一

5、种实现形式,对于给定句子的每一个谓词(主要是动词)分析出其在句中相应的语义成分,并作相应的语义标记Ill。网络资源的语义标注是将网络信息进行预处理,通过信息抽取摒弃无用和广告信息,生成核心文本并将文本屮的每一个句法成分都赋予Y特定的含义并形式化的表示出来,是一种满足了未来互联网作为人类的信息库、知识库,并且具备理解语义和自动扩展、联想的能力的方法,并且语义标注方式也能够支持未来的问答式、对话式的智能化检索。二、汉语框架本体及网络标注1、汉语框架本体汉语框架网(ChineseFrameNet)是一个以Fillmore的框架语义学为理论基础、以加州大学克伯利分校的FrameNet工程为参照,以汉语

6、的真实语料为依据的供计算机使用的汉语词汇语义知识库,研究内容涉及语义知识库内容的编写、辅助软件的开发和研允等。汉语框架本体的构建和获取是基于文本语料库的,在构建语料库的基础上,利用现有的叙词表、分类表及其他知识分类体系等现有的知识本体,采取本体学习的策略,通过机器学习从领域语料库中抽取等级关系和相关关系为木体构建人员提供参考,将专家的自顶向下和机器学自底向上的结果相结合构建本体,识别领域内外相关的概念并抽取相关屌性,建立概念间关系,利用概念及关系创建新的本体,最后将己有的本体与新建本体进行融合。2、网络标注语义网出现之后网络标注向着三个方向发展:图像的语义标注、多媒体信息的语义标注和文本数据的

7、语义标注。文本语义标注的方法当前来说主要就三种,分别为人工标注、领域文档模式的概念映射和标注、利用词汇的句法语义分析进行标注。人工标注在网络标注出现之初使用的比较多,手工为文本各个句法成分赋予语义角色,优点是准确率比较高,所以常作为规则总结、自动标注系统学习和测试的范例。缺点是费时费力,不适合网络资源大规模的标注时使用。领域文档模式的概念映射和标注方法m主耍应用于深层网络数据的标注,对各个网络数据

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。