基于最大熵的机器翻译研究与实现

基于最大熵的机器翻译研究与实现

ID:35066188

大小:5.42 MB

页数:87页

时间:2019-03-17

基于最大熵的机器翻译研究与实现_第1页
基于最大熵的机器翻译研究与实现_第2页
基于最大熵的机器翻译研究与实现_第3页
基于最大熵的机器翻译研究与实现_第4页
基于最大熵的机器翻译研究与实现_第5页
资源描述:

《基于最大熵的机器翻译研究与实现》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、毛击种成*赛UNIVERSITYOFELECTRONICSCIENCEANDTECHNOLOGYOFCHINA专业学位硕±学位论文MASTERTHESISFORPROFESSIONALDEGREE、脯^、/3se——■—,论文题目基于最大滴的机器翻译妍究与实现专业学位类别工程硕±'道獨?-.学号201322060631;卿垫;作者姓名应志骄销指导教师秦科副教授..--.'.

2、'-立古一'.■心二^.与二■ ̄'-‘'"--—..--.rT三"??——r'?..T;;—舌直亡己;:南這古驾j分类号密级注1UDC学位论文基于最大熵的机器翻译研究与实现(题名和副题名)应志野(作者姓名)指导教师秦科副教授电子科技大学成都(姓名、职称、单位名称)申请学位级别硕士专业学位类别工程硕士工程领域名称计算机技术提交论文日期2016年3月论文答辩日期2016年5月学位授予单位和日期电

3、子科技大学2016年6月答辩委员会主席评阅人注1:注明《国际十进分类法UDC》的类号。ResearchAndImplementationofMaximumEntropyBasedMachineTranslationAMasterThesisSubmittedtoUniversityofElectronicScienceandTechnologyofChinaMajor:MasterofEngineeringAuthor:ZhiyeYingSupersior:Prof.KeQinSchool:Sc

4、hoolofComputerScience&Engineering独剑性声明本人声明所呈交的学位论文是本人在导师指导下进行的研究工作及取得的研究成果。据我所知,除了文中特别加W标注和致谢的地方夕h论文中不包含其他人已经发表或撰写过的研究成果,也不包含为获得电子科技大学或其它教育机构的学位或证书而使用过的材料。与-我■同工作的同志对本研究所做的任何贡献均己在论文中作了明确的说明并表示谢意。、!作者签名=^4曰期:>0^年月巧曰吁论支使用授杖本学位论文作者完全了

5、解电子科技大学有关保留、使用学位论文的规定,有权保留并向国家有关部口或机构送交论文的复印件和磁盘,允许论文被查阅和借阅?。本人授极电子科技大学可yi将学位论文的全、部或部分内容编入有关数据库进行检索,可缩印或扫描[^采用影印等复制手段保存、汇编学位论文。(保密的学位论文在解密后应遵守此规定)作者签名:导师签名:於日期:谷年占月K?曰摘要摘要我国各民族间合作交流对社会稳定和民族文化融合有重大意义,大量少数民族珍贵文献需要翻译成汉语来得以传承,人工翻译效率很低,而且

6、少数民族语言和汉语之间的机器翻译效果欠佳,因此有必要深入研究语言的机器翻译技术。机器翻译是利用计算机智能地将一种源语言转换成另一种目标语言的过程,随着计算机性能的提升和可用语料数据的快速发展,统计机器翻译(SMT)的优势更加明显,成为主流的机器翻译方式。基于最大熵的统计机器翻译是借鉴最大熵思想形成的一种直接翻译模型,这种模型可以融合多个特征,针对不同领域设计不同的特征选取策略,达到更好的翻译效果。因此本文重点研究了最大熵统计翻译模型的技术细节,然后面向维汉翻译领域对模型的特征进行了针对性改进,最

7、后融合这些特征实现了基于最大熵的维汉统计机器翻译系统。具体地讲,本文完成了以下三方面工作:(1)Skip语言模型和平滑技术的研究。为了缓解语言模型的数据稀疏问题,提出一种基于词频的skip语言模型,并对其进行平滑处理。详细介绍了skip语言模型的训练方式,结合各种平滑技术与n-gram语言模型进行性能对比实验,结果显示skip语言模型结合平滑技术能够降低语言模型的困惑度,提高语言模型质量。(2)针对维汉统计机器翻译的最大熵模型研究。阐述了通用统计翻译的最大熵模型中各个特征的技术细节。然后针对维汉

8、翻译领域的特点,对维吾尔语语料进行词素化处理并提出词缀裁剪的改进方案。考虑到维汉句子结构差异,缩小调序模型的权重,构建了更适合维汉翻译的统计机器翻译最大熵模型。实验验证,使用改进的最大熵模型提高了译文的BLEU评分。(3)设计并实现了基于最大熵的维汉统计机器翻译系统。论述了翻译系统的总体架构和翻译流程,描述了翻译系统中的各模块的原理、功能和模型训练过程中的核心模型文件。对比展示了翻译和模型训练的实际效果。本文提出基于最大熵的维汉统计机器翻译系统框架,包括双语语料的处理、模型训练、性能调优。该系统

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。