欢迎来到天天文库
浏览记录
ID:5375553
大小:1.08 MB
页数:8页
时间:2017-12-08
《汉英篇章结构平行语料库的对齐标注研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、第27卷第6期中文信息学报V01.27,No.62O13年11月JOURNALOFCHINESEINFORMATIONPROCESSINGNOV.,2O13文章编号:1003—0077(2013)06-0158-07汉英篇章结构平行语料库的对齐标注研究冯文贺(河南科技学院中文系,河南新乡453003;武汉大学计算机学院,湖北武汉430072)摘要:篇章结构平行语料库是对具有对译关系的双语文本标注了平行篇章结构信息的语料库。对齐标注是汉英篇章结构平行语料库的核心理论基础。该文提出“结构对齐,关系对齐”的对齐标注策略,应用于切分对齐、层次结构对齐、关系对齐、中
2、心对齐等环节,实现了对齐和标注并行、单位对齐和结构对齐共进的平行语料库工作模式。本策略辅之以相应标注平台和工作程序以及相应难点解决方案,被证明是一种高效的篇章结构平行语料库工作方式。关键词:平行语料库;对齐标注;篇章结构中图分类号:TP391文献标识码:AAlignmentandAnnotationofChinese-EnglishDiscourseStructureParallelCorpusFENGWenhe(DepartmentofChineseLanguageandLiterature,HeNanInstituteofScienceandTechn
3、ology,Xinxiang,Henan453003,China;SchoolofComputer,WuhanUniversity,Wuhan,Hubei430072,China)Abstract:Discoursestructureparallelcorpusisacorpusannotatedwithparalleldiscoursestructureinformationforbilingualtext.Thispaperproposessuchanalignmentandannotationstrategy,thestructuralandrela
4、tionalalign—ment,whichisthetheoreticalbasisofChinese—Englishdiscoursestructureparallelcorpus.ThisstrategyisappliedtOthecorpusbuildingprocess,includingsegmental,structural,relational,andcentralalignment,havingachievedanoperationmodeofparallelcorpsalongwithalignmentandannotationwork
5、ingtogether,aswellunitalignmentandstructuralalignment.ThestrategywiththehelpofcorrespondingannotationsoftwareandthesolutionstOthedifficultieshasbeenprovedtObeaneffectiveoperationmodefordiscoursestructureparallelcorpus.Keywords:parallelcorpus;alignment;discoursestructure人却本分实诚。(贾平凹
6、《浮躁》)Thisboy,amemberoftheSunfamily,//[并1前言列]hadbeenbornintheyearofthehorse./[并列]Althoughhewasayearyounger///[并列]anda篇章结构平行语料库是对具有对译关系的双语headshorterthanWaterGirl,//[转折]hewas文本标注了平行篇章结构信息(含篇章单位和层次honestandsincere.(Goldblatt,1991)化结构及关系等)的语料库。例1给出了一个汉英平行语料库和篇章结构语料库近年来都有较大篇章结构的平行标注文本。
7、发展。国际上平行语料库2O世纪90年代以来快速例1少年姓孙,//[并列]属马,/[并列]比小发展,汉英平行语料库基本同步并取得较多进水小着一岁,///[并列]个头也没小水高,//[转折]展引。然而整体上,现有汉英平行语料库除做了一收稿日期:2013—07—15定稿日期:2013—09—28基金项目:国家自然科学基金资助项目(61273320)、教育部人文社科青年资助项目(13YJC740022)、中国博士后基金资助项目(2013M540594)、国家社科基金资助项目(13BYYO26)。作者简介:冯文贺(1976一),男,博士,博士后在站,主要研究方向为计
8、算语言学,语言资源,语言理论。6期冯文贺:汉英篇章结构平行语料库的
此文档下载收益归作者所有