欢迎来到天天文库
浏览记录
ID:34137924
大小:1.94 MB
页数:8页
时间:2019-03-03
《基于新闻语料库的越南语框架语义标注研究_林丽》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库。
1、第27卷第6期中文信息学报Vol.27,No.62013年11月JOURNALOFCHINESEINFORMATIONPROCESSINGNov.,2013文章编号:1003-0077(2013)06-0201-08基于新闻语料库的越南语框架语义标注研究林丽(解放军外国语学院,河南洛阳471003)摘要:越南是中国的重要邻国,相应的越南语海量信息处理正日益凸显其重要性。参考国内外有关框架语义标注的研究和实践,我们在构建越南语新闻语料库,对越南语文本进行分词和词性标注、命名实体标注等研究的基础上,尝试构建越南语框架语义知识库并初步探索了框架语义标注在越南语新闻
2、事件抽取中的应用。关键词:框架语义;标注;越南语;新闻中图分类号:TP391文献标识码:AAStudyonVietnameseFrameSemanticAnnotationBasedontheNewsCorpusLINLi(PLAUniversityofForeignLanguages,HenanLuoyang471003)Abstract:VietnamisanimportantneighboringcountryofChina,thecorrespondingmassiveinformationprocessinghasbecomeincreasingl
3、ynecessaryandimportant.ByreferringtotherelevantstudiesandpracticesontheFrameSe-manticannotationathomeandabroad,webuiltaVietnameseNewscorpus.Onthebasisoftextsegmentationandpartofspeechtagging,namedentitytagging,wetriedtobuildVietnameseFrameNetandinitiallyexploredtheap-plicationofthe
4、FramesemanticannotationintheVietnamesenewseventextraction.Keywords:Framesemantic;annotation;Vietnamese;News可以说,词汇语义知识库是自然语言信息处理领域1引言中的核心工程之一。不论是使用基于规则的方法还是基于统计的方法,信息提取和检索、词义排歧、机越南是中国的重要邻国,在当前信息呈海量爆器翻译、自动文摘、自动问答系统的研究终究都离不炸型增长的背景下,针对越南语的海量信息处理也开词汇语义知识资源基础上的语义分析。日益凸显其重要性。其中,网络新闻方面的需求尤
5、在目前的研究条件下,越南语—汉语机器翻译为突出。如何有效利用现代语言学和信息技术发展难度非常大。这一方面由于机器翻译理论发源于欧成果深入研究越南语网络新闻文本的知识表示、知美,而作为源语的越南语属于意合型语言,缺乏形式识获取对于及时、准确地追踪和发现信息具有重要化标记,难以实现高精度的句法语义分析,另一方意义,是一个值得关注和投入的课题。面,越南也缺乏相关理论和实践上的积累,可以借鉴目前制约自然语言信息处理发展的重要“瓶颈”的资源很少。相比之下,信息抽取可以说是自然语言理解技术和实际应用相折中的产物,其目标是对之一就是计算机对自然语言的语义理解。自然语言文本
6、的有限理解,只关心特定领域,特定类型的信的语义分析和内容信息的理解,离不开语义知识库息。事实上,对海量文本进行信息挖掘离不开高质的支持,它是帮助计算机了解人类语言的一个媒介量的事件内容分析技术,而这些技术的开发又需要和手段,也是让计算机逐渐智能起来的物质前提。高质量的事件语义标注资源支持。“大规模”、“覆盖收稿日期:2013-07-21定稿日期:2013-09-16基金项目:中国-东盟研究中心(广西科学实验中心)课题“越南语通用语料库建设”资助项目(20120146)作者简介:林丽(1979—),女,解放军外国语学院讲师,博士研究生,主要研究方向为语言信息处
7、理和越南语句法语义分析。202中文信息学报2013年6期林丽:基于新闻语料库的越南语框架语义标注研究203204中文信息学报2013年6期林丽:基于新闻语料库的越南语框架语义标注研究205206中文信息学报2013年6期林丽:基于新闻语料库的越南语框架语义标注研究207208中文信息学报2013年
此文档下载收益归作者所有