基于分布式合成语义的统计翻译模型研究

基于分布式合成语义的统计翻译模型研究

ID:35061570

大小:3.96 MB

页数:74页

时间:2019-03-17

基于分布式合成语义的统计翻译模型研究_第1页
基于分布式合成语义的统计翻译模型研究_第2页
基于分布式合成语义的统计翻译模型研究_第3页
基于分布式合成语义的统计翻译模型研究_第4页
基于分布式合成语义的统计翻译模型研究_第5页
资源描述:

《基于分布式合成语义的统计翻译模型研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、早壶学校代码:10285学号:20134227050襄1牡考SOOCHOWUNIVERSITY基于分布式合成语义的统计翻译模型硏究■I:;esearchofStat鳴斗鸣民isticalTranslationModelBased—"-二-.,三矜祐文v)o打DistribiUedCompositionalSemantics柴漂;靖磋转电!研究生姓名王超超导教师姓名熊德意.指专业名称软件工程‘护1研究方向统计机器翻译所在院

2、部计算机科学与技术学院论文提交日期2016年6月HHHHBS■I苏州大学学位论文独创性声明:本人郑重声明所提交的学位论文是本人在导师的指导下,独立进行研究工作所取得的成果。除文中已经注明引用的内容外,本论文不含其他个人或集体已经发表或撰写过的研巧成果,也不含为获得苏州大学或其它教育机构的学位证书而使用过的材料。对本文的研巧作出重要贡献的个人。和集体,均已在文中臥明确方式标明。本人承担本声明的法律责任■苗(>、会、C}:日(论文作者签名候挺期;j苏州大学学位论文使用授权声明

3、本人完全了解苏州大学关于收集、保存和使用学位论文的规定,即;学位论文著作权归属苏州大学。本学位论文电子文档的内容和纸质论文的内容相一致。苏州大学有权向国家图书馆、中国社科院文献信息情报中屯、、盘中版国科学技术信息研苟所(含万方数据电子出版社)、中国学术期刊(光和)电子杂志社送交本学位论文的复印件和电子文档,允许论文被查阅将借阅,可^采用影印>缩印或其他复制手段保存和汇编学位论文,可^^学位论文的全部或郭分内容编入有关数据库进行检索。涉密论文〇本学位论文属在年_月解密后适用本规定。

4、非论涉密论文□文作者签名;扛暖跋日期:斯点、义J导师签名:挺:么〇/占.与、'日期中基于分布式合成语义的统计翻译模型研究中文摘要基于分布式合成语义的统计翻译模型研究中文摘要统计机器翻译作为人工智能领域的一个重要分支,已经经历了基于单词、短语和句法的三个发展阶段,翻译译文质量不断提高,但是仍然存在着词不达意等诸多问题。针对上述瓶颈,基于语义的统计机器翻译方法受到了计算语言学领域研究者们的广泛关注。本文针对基于语义的统计机器翻译方法,开展了以下三个方面的研究:(1)基于单词分布式语义的统计翻译建模首先,在大规模

5、平行双语语料库中,分别采用单词向量空间表示方法和单词嵌入表示方法获取源语言单词分布式语义信息和目标语言单词分布式语义信息。其次,将源语言语义信息映射到目标语言语义空间,计算同一个语义空间下源语言和目标语言的双语语义相似度,并将该双语语义相似度作为一个新的特征加到层次短语翻译解码过程中。实验结果显示,基于单词分布式语义信息的统计机器翻译方法取得了较好的翻译性能。(2)基于向量混合的短语合成语义统计翻译建模首先,在单词分布式语义表示的基础上,使用向量混合模型中的带权向量加法分别获取源语言短语和目标语言短语合成语义信息。其次,使

6、用非线性映射方法,将源语言短语合成语义信息映射到目标语言语义空间。最后,在同一语义空间下采用翻译相似度模型计算双语翻译相似度。实验结果显示,分布式合成语义信息相比于单词语义信息,对统计机器翻译性能的提升更为优越。(3)基于递归自动编码器的短语合成语义统计翻译建模在前述研究的基础上,我们采用神经网络方法中的递归自动编码器获取短语合成语义信息,并将此短语合成语义信息集成到统计机器翻译解码过程中。具体而言,采用递归自动编码器在双语端获取短语合成语义信息,在此基础上分别比较了线性映射方法和非线性映射方法获取到的同一语义空间下双语翻

7、译相似度对统计机器翻译性能的影响。关键词:统计机器翻译;分布式语义;合成语义;神经网络;翻译相似度作者:王超超指导教师:熊德意IAbstractResearchofStatisticalTranslationModelBasedonDistributedCompositionalSemanticsResearchofStatisticalTranslationModelBasedonDistributedCompositionalSemanticsAbstractAsanimportantbranchofartificia

8、lintelligence,statisticalmachinetranslation(SMT)haswitnessedthreedifferentresearchstagesrangingfromword-basedtophrase-basedandsyntax-basedSMT.Amongthepr

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。