基于音节双向最大化匹配的英汉名称音译

基于音节双向最大化匹配的英汉名称音译

ID:33018607

大小:83.82 KB

页数:16页

时间:2019-02-19

基于音节双向最大化匹配的英汉名称音译_第1页
基于音节双向最大化匹配的英汉名称音译_第2页
基于音节双向最大化匹配的英汉名称音译_第3页
基于音节双向最大化匹配的英汉名称音译_第4页
基于音节双向最大化匹配的英汉名称音译_第5页
资源描述:

《基于音节双向最大化匹配的英汉名称音译》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库

1、基于音节双向最大化匹配的英汉名称音译蓝杨浙江警官职业学院摘要:目前的众多音译系统屮,比较流行的主要有两种方法:基于短语统计的机器音译法和将翻译对象作为一种标签序列的条件随机域方法。相比于流行方法,研究一种更加简单直观、更具语言性和实用性、通用性的英汉名称音译方法(音节双向最大化兀配),并建立基于此方法的双语词库和音译系统意义深远。关键词:英汉名称音译;音节双向;最大化匹配;双语词库;作者简介:蓝杨(1980-),男,浙江临安人,副教授。研究方向:计算语言学。收稿日期:2017-04-06English-C

2、hineseNameTrans1iterationwithBi-DirectionalSyllable-BasedMaximumMatchingLANYangZhejiangPoliceVocatiorialAcademy;Abstract:Therearetwoparticularlypopularapproachestotransliterationwhicharephrase-basedstatisticalmachinetransliterationandtheConditionalRandomF

3、ieldsintheprcscntstudy.Comparedwiththepopularresearchmethod,thestudyofamoresimpleandmoreintuitiveuniversalEnglishnametransliterationmethod(syllablebidirectionalmaximummatching),whichisofpracticallanguage,andabilinguallexiconandtransliterationsystem,whicha

4、rebasedonthismethodhavefar-reachingsignificanee.Keyword:nanictranslitcration;bi-directionalsyllable;syllable-basedmaximummatching;bilinguallexicon;Received:2017-04-06通过音节音译实现汉英名称互译一直是翻译界的难点,至今没有成系统的规律和业界普遍认同的方法,其根本问题在于汉英两种语言音节的差异性,故导致了英汉名称互译时强烈的非统一性和不匹配性。

5、将英汉两种语言名称的咅节进行概括和分析,归纳其中的部分同质规律并最大程度缩小两种语言的音节差异,是解决此难题时可采取的最优化也是最核心的方案。对此,笔者提出了一种基于音节的最大兀配方法。相比其他大多数常用方法,此方法简单直观,且具有较强的语言性、实用性,并适用于一系列中英名称的简单咅译。基于音节的屮英名称最大匹配音译法则,因具备两大特色而值得大力推广和广泛学习使用:第一为音译的相似度大大提高。音节构成音译的基本单位,名称在目标语言译文中的发音音位最好和源语名称的音位相似,而两种语言的音位结构差异在音译过程

6、中需要做出让步,不相容的音韵结构可能增加额外的音节,由此便带来两种语言咅译匹配度不高的问题。使用该法则极人规避了两种语言咅位结构的差异,从而使得源语和口标语的音译达到最高的融合度。第二为屮英名称音译更具通用性和创新性。本研究提出的音节双向最大匹配法,解决了用同一语块对不同名称中的相同部分进行音译的难题。将音韵学中的起始音首要原则用于拆分英文名称的音节,再将各音节与中文名称对齐匹配,得到包含不同长度的对齐咅节的双语词库,其意义在于可以对以音节为基本单位的源名称进行分割产生的词库进行最大化匹配,实现屮英音译中

7、的“信达雅”。一、相关研究在NEWS2015(Li等)[1]和NEWS2016(Li等)⑵的SharedTask中报告的众多音译系统屮,有两种音译方法特别突出并非常流行:一种是基于短语统计的机器音译法(如Song[3]等;Finch和Sumita[4]);另一种是将翻译对象作为一种标签序列的条件随机域方法(如Shishtla等固)。除这些流行方法以外,近期的研究中还有如Huang等人凹采用非参数化的内叶斯学习法进行音译。对于咅译的基本单位,传统的方法主要基于咅位(如Knight和Graehl[7])。Li

8、等宜提出了一种直接正交映射框架下基于字位的联合信源信道模型。同样,还有基于字符女口Shishtla等[5])、音节(如Wutiwiwatchai和Thangthai[9])、混合单元(如Oh和Cho^lO])的模型。研究表明,除语音特征外,其他特征如人名、语义和音调都能帮助完成音译(如Tao等[ll];Li等[12];KWong[13])o二、数据集本研究测试所使用的音译数据是由NamedEntitiesWorkshop,20

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。