欢迎来到天天文库
浏览记录
ID:9435987
大小:90.83 KB
页数:9页
时间:2018-04-30
《壮族典籍多语平行语料库建设与应用研究》由会员上传分享,免费在线阅读,更多相关内容在应用文档-天天文库。
1、壮族典籍多语平行语料库建设与应用研究秀苗广西百色学院国际教育学院摘要:文章综述Y壮族典籍多语平行语料库的设计、建设和应用研宂,该语料库具有库容大、开放性、便捷性等特点,为语言、文化、文学比较,翻译研宂提供真实语料数据、技术支持等研究基础平台,还可以为其他少数民族典籍多语平行语料库建设提供借鉴和参考。关键词:壮族典籍多语平行语料库;设计;建设;应用;作者简介:周秀苗(1974—),女,广西百色学院国际教育学院教授,院长,主要研宄方向为民族戏剧与翻译研宄。基金:国家社会科学基金2015年度研究课题“中越跨境民族民间戏剧比较
2、研宄”(批准号:15XZW040)近几十年來,语料库、语料库语言学、语料库翻译学研宂在国A外如火如荼,这一研宄广泛应用于词汇、语法、语义、语言对比、词典编撰、二语习得、翻译、文学等领域中,并取得显著成效。为了应用或者研究需要,国内外先后建设了跨学科、多语言、内容多样、库容不同的语料库。目前,语料库特别是平行语料成为国内多语平行语料库建设与应用研究的热点,但语料库语料存在单语或双语语料库为主、多语语料库数量少以及民族典籍多语语料库建设滞后等问题。本研宄首先构建壮族典籍(壮、汉、英)多语平行语料库,然后基于壮族典籍多语平行
3、语料库检索数据,对壮、汉、英三种语言进行语言、文化、文学比较和翻译研宄,以期为其他少数民族典籍多语平行语料库建设提供借鉴和参考鉴。一、多语平行语料库研宄现状就语料库建设而言,近五年,国际上较具代表性的多语平行语料库有:欧洲委员会联合研宄中心研制的DGT-Acquis(2011)、ECDC-TM(2012)以及EAC-TM(2012)等三个语料库,语料主要涉及教育与文化、公共卫生和法律;比利时根特大学(GhentUniversity)(2011)研制的用于翻译学研究的荷兰语平行语料库(DutchParallelCorpu
4、s,DPC)。这些语料库大多存在语料来源范围单一,主要用于语言识别、文档级对齐、专业术语提取等自然语言处理研究。具体信息见如卜表:在国内,多语平行语料库建设研究成果不显著。主要有:张姝、赵铁军等(2004)建设的英、日、汉三语平行语料库一“而向事件的多语平行语料库”,王成平(2012)建设了彝、汉、英三语平行语料库。就平行语料库应用研宄而言,国内专家、学者主要在词汇、词典、语法、教学及翻译等领域开展应用研究。词汇,如谢元花的语料库与词汇研究(2002):语法,如秦洪武、王克非(2009)基于对应语料库的英译汉语言特征分
5、析;词典,如李德俊(2006)的基于英汉平行语料库的词典编写系统CpsDiet;翻译与教学,如于莲江(2004)的基于语料库的翻译教学研宄。EAC-TM文化与教育26种欧洲家语言DPC5种激育、文献、文学、行政管理文件、国际通讯、新闻报3个语种淺语、法语、呑兰语ECDC-TM公共卫生25种欧洲家语言LLI-UAM多语平行语料库存新闻(基于4个新闻文本语料库)3个语种识拉伯语、西0牙语、英语DGT-Acquis法律由此可见,国内多语平行语料库建设与应用研究主要存在以下问题:1.国内语料库语料内容不够丰富,主要为单语或双语
6、语料库,多语语料库数量少。2.平行语料库多以英语为中心的双语语料库为主。3.国内多语平行语料库应用研究领域发展不平衡,主要集屮于语言学、外语教学与词典学研宂,较少用于文学和文化研宄。4.国内民族典籍多语语料库建设滞后,不能适应文化“走出去”的耍求。以上问题为本项目关于壮族典籍多语平行语料库建设与应用研宄留下了空间,本研宄具有以下意义:1.学术价值:壮族典籍多语平行语料库建成可以对现有的壮族史诗、民歌、戏剧等优秀民族文化遗产进行数据采集和档案式保护。同时,为民族语言、文化、文学等领域的比较研宂提供跨语言信息检索服务,也为
7、翻译学和翻译教学研宂提供真实语料与语言转换数据支持,通过课题相关研宄成果,为民族语言文化、文学比较研宄、民族典籍翻译学和翻译教学研宄提供新思路、新方法。2.应用价值:基于语料库检索数据进行以下研究,为壮、汉、英比较提供多学科新思路、新方法:语言、文化比较研宂;文学比较研究;民族典籍翻译与翻译教学研宄;为其他少数民族典籍多语平行语料库建设提供借鉴和参考鉴。二、壮族典籍多语平行语料库前期设计思路(一)整体研宄思路如下图所示:研究问题r-语料库建设r—语料库设计数据采录壮族典籍多语平行语料J论文集数据解析(分析与讨论)(二)
8、语料库设计思路1.文本子库。选取壮族史诗、民歌、戏剧等三大代表性典籍的壮、汉、英三种语言文本作为语料样本,建设以壮语版本为中心的单向平行语料库;壮族典籍文本子库,下设三个二级子库,每个二级子库均以壮语版木为中心,建立一对二,即壮语对汉语、英语的单向平行子库。2.音频子库。建立与壮语文本和对齐的三大典籍的壮语音频子库。壮族典籍多语平
此文档下载收益归作者所有