机器翻译技术的探讨

机器翻译技术的探讨

ID:5324785

大小:423.06 KB

页数:9页

时间:2017-12-08

机器翻译技术的探讨_第1页
机器翻译技术的探讨_第2页
机器翻译技术的探讨_第3页
机器翻译技术的探讨_第4页
机器翻译技术的探讨_第5页
资源描述:

《机器翻译技术的探讨》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库

1、机器翻译技术的探讨六院五队-徐允鹏-12060143摘要随着国际交流的日益增多,在计算机、互联网等相关技术日新月异的基础上,机器翻译的技术与应用得到了蓬勃发展。本文详细探讨了基于规则的机器翻译方法、基于语料库的机器翻译方法和混合式机器翻译方法,并讲述了机器翻译的评估方法,最后介绍了机器翻译技术的最新进展。关键词:机器翻译;基于规则;语料库;评估方法1.机器翻译概述随着国际化交流的普遍性,信息通信的日益膨胀,高效的处理不同领域各种语言之间的互译已成为当代人们的普遍需求。翻译是解决自然语言之间通信障碍最直接最有效的方法。传统的翻译工作都是通过专业翻译人员完成,利用语言学知识进

2、行自然语言之间的互译,帮助人们实现信息通信。伴随着计算机技术的成熟与自然语言处理技术的不断进步,利用机器翻译系统帮助人们快速获取外文信息代替人工翻译已成为一种必然的趋势。机器翻译(machinetranslation),又称为自动翻译,是利用计算机把一种自然源语言转变为另一种自然目标语言的过程,一般指自然语言之间句子和全文的翻译。它是自然语言处理(NaturalLanguageProcessing)的一个分支,与计算语言学(ComputationalLinguistics)、自然语言理解(NaturalLanguageUnderstanding)之间存在着密不[1]可分的

3、关系。机器翻译是21世纪要解决的科技难题之一,主要困难是自然语言在各个层次上的歧义性。研究机器翻译具有重要的实践意义和理论意义。国际间的合作与交流,语言的差异是一个非常重要的障碍,各行各业的人们面对大量他们不熟悉的语言的文档资料,如果单纯的依靠人工翻译,这些日益的待翻译材料将是一种非常沉重的负担,而机器翻译可大幅度减轻这种负担。同时,机器翻译对于了解人类语言和思维的基本机制,探讨人工智能技术有着重要的意义。2.机器翻译方法人们一直在寻求更好的解决机器翻译问题的方法,目前机器翻译方法主要有基于规则的机器翻译,基于语料库的机器翻译和混合式机器翻译方法。2.1基于规则的机器翻译

4、方法2.1.1基于分析和转换的机器翻译方法人作翻译时,把一个源语言句子译成目标语言句子,设计到四个基本操作:目标语言单词的检索、调序、删词、增词;机器翻译系统的过程包括检索、分析、转换和生成主要四个阶段,这被称为基于分析和转换的机器翻译系统,也被认为是模拟人类翻译活动最恰当的机[2]制。该方法有三个阶段,为分析—转换—生成。一般情况下,分析以句法为主、语义为辅,正确的句法结构转换加正确的词汇译文可以从源语言向目标语言传递完整的正确信息。以句法结构转换附加一定的[3]语义信息,能够构成转换的基本层次。标准机器翻译系统中句子和短语层次的结构转换是核心,产生式方式的转换规则形式

5、为:S:S1+S2+···SiT1+T2+···Tj:TS是源语言的某个待翻译单位(句子、短语等等),S1~Si是S中的下一级组成单位对于S,如果满足条件,则目标语言中有T1~Tj译文构成了相应的等价物T。上述方法称为基于句法的转换方法,因为S1+S2+···Si一般来说就是源语言的的句法结构表示:也可以称为直接转换方法,因为对于每个源语言的翻译组块,都马上给出一个目标语言组块与之对应[3]应该说,这种转换方法符合人的直觉认识,也能够实现。2.1.2基于中间语言的机器翻译方法基于中间语言的翻译方法是对源语言进行分析以后产生一种称

6、为中间语言的表示形式,然后直接由这种中间语言的表示形式生成目标语言。所谓中间语言就是自然语言的计算机表示形式的系统化,它试图创造出一种独立于各种自然语言,同时又能表示各种自然语言的人工语言。基于中间语言的机器翻译方法的优势是无需一种语言到另一种语言的一一转换,对于多语种的翻译系统可以节约大量的转换知识的手工获取工作量,假如有N种语对需要相互翻译,只要有2N个分析和生成模块就够了。其中一半是源语言分析模块,输入为原文,输出以1L表示:另一半是目标语言生成模块,输入为1L表示,输出为目标语言译文。然而,中间语言的机器翻译方法也常遭到怀疑。因为是否能够构造出表示各种不同的自然语

7、言语法、语义的中间语言至少目前还是未知数。此外,中间语言能不能把各种语言的所有特征保留下来,又能很好生成对应的各种语言也是问题。所以,构造中间语言是一个巨大、复杂的工程,还包含许多理论研究,迄今为止的探索还没[3]有好的答案。基于转换的方法采取了一系列转换生成层次,各种分析多(如词法、句法、语义和语境等),而且在分析的过程中,会出现许多歧义结构,显然,如果没有好的算法,效率就会低;此外,对于那些不符合语法规则的句子,这种方法难于给出正确的翻译结果。2.2基于语料库的机器翻译方法2.2.1基于统计的机器翻译方法基于统计的机器翻译

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。