欢迎来到天天文库
浏览记录
ID:33862642
大小:3.41 MB
页数:58页
时间:2019-03-01
《英汉人名音译的研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、硕士学位论文英汉人名音译的研究ResearchonEnglish-·ChineseNameTransliteration学号:21109172大连理工大学DalianUniversityofTechnology大连理工大学学位论文独创性声明作者郑重声明:所呈交的学位论文,是本人在导师的指导下进行研究工作所取得的成果。尽我所知,除文中已经注明引用内容和致谢的地方外,本论文不包含其他个人或集体已经发表的研究成果,也不包含其他已申请学位或其他用途使用过的成果。与我一同工作的同志对本研究所做的贡献均已在
2、论文中做了明确的说明并表示了谢意。若有不实之处,本人愿意承担相关法律责任。学位论文题目:鍪丛垒鱼鱼鲞鱼塑墨作者签名:垒丑丑日期:丝!生年—互月—卫日大连理工大学硕士学位论文摘要入名音译指利用源语言及目标语言发音规则的异同将源语言形式人名翻译成目标语言形式,在机器翻译、双语语料库对齐等多语言处理任务中有重要作用。本文重点研究如何构建英文来源的英汉人名音译模型及人名来源识别模型。针对英汉人名音译的特点及现有研究存在的问题,提出一种基于音节划分和短语表优化的人名音译方法。本文将人名音译转换为以音节为基
3、本单位的翻译问题,将连续的音节组合看作短语,引入一种基于短语的统计机器翻译方法,实现英汉人名的音译。首先,针对现有音节划分方法存在的问题,提出一种改进的划分方法;其次,训练语料偏小导致短语表中存在杂质信息,提出去除低频词法、基于C-value的除杂法及基于粘结度的除杂法等三种方法优化短语表,实验表明,基于C-value的方法可有效去除短语表的杂质信息;之后,融入汉语人名中首尾字的位置特征,对生成的音译候选重新调整先后顺序,改善了音译候选汉字选取的不合理性;最后,提出在解码阶段引入两阶段音节划分方
4、法,缓解了由于音节划分粒度过大导致在短语表中找不到翻译所引起的音译错误。实验结果表明,通过上述四方面的改进,其音译准确率由63.08%提高到67.62%。不同来源的人名具有不同的发音规则体系,因此,在对人名进行来源识别后再进行音译,其效果会更加准确。本文提出基于发音规则与统计融合的两阶段方法解决人名来源识别问题。首先,利用汉语拼音规则、日语片假名发音规则将人名粗略分为四大类;然后,使用基于统计的方法——朴素贝叶斯分类方法实现最终的语言来源识别。选取基于字符的N-gram语言模型、基于发音单元的N
5、.gram语言模型及基于发音单元的位置特征作为实验的特征,使用不同的特征组合分别进行人名来源识别实验。实验结果表明,给定英文形式人名,判断其来源是汉语、日语还是英语时,使用基于字符的四元模型、基于发音单元的二元模型及基于发音单元的位置特征三者融合后的方法,人名来源识别的效果最优,准确率达到98.39%。关键词:音节划分;短语表优化;发音规则;朴素贝叶斯;N-gram语言模型英汉人名音译的研究ResearchonEnglish—ChineseNameTransliterationAbstractN
6、ametransliterationreferstotranslatingnamefromsourcetotargetlanguagewi血thepronunciationdifferencesbetweensourceandtargetlanguage,whichplaysanimportantroleinmulti-languageprocessingtasks,suchasmachinetranslation,bilingualcorpusalignmentandSOon.Ourresea
7、rchfocusesonhowtobuildaneffectiveEnglish—ChinesenametransliterationmodelofEnglishoriginandthemethodofnameoriginrecognition.InviewofcharacteristicsofEnglish-Chinesenametransliterationandexistingproblems,asyllabificationandphrasetableoptimizationbasedm
8、ethodWasproposed.ThenametransliterationCanbedescribedassyllable—basedtranslation,whichWassolvedthroughanapplicationofaphrase-basedstatisticalmachinetranslationmodel.Firstly,afteranalyzingtheexistingproblemofthecurrentsyllabificationmethod,animproveds
此文档下载收益归作者所有