chp-10.1统计机器翻译

chp-10.1统计机器翻译

ID:9817218

大小:705.56 KB

页数:74页

时间:2018-05-10

chp-10.1统计机器翻译_第1页
chp-10.1统计机器翻译_第2页
chp-10.1统计机器翻译_第3页
chp-10.1统计机器翻译_第4页
chp-10.1统计机器翻译_第5页
资源描述:

《chp-10.1统计机器翻译》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库

1、自然语言理解第十章统计机器翻译宗成庆中科院自动化研究所模式识别国家重点实验室cqzong@nlpr.ia.ac.cnhttp://www.nlpr.ia.ac.cn/English/cip/cqzong.htmNo.95,ZhongguancunEastRoadhttp://www.ia.ac.cnBeijing100080,ChinaTel.No.:+86-10-62554263NLPR第十章统计机器翻译10.1机器翻译的产生与发展q概念:机器翻译(machinetranslation)是使用计算机把一种语言(源语言,s

2、ourcelanguage)翻译成另一种语言(目标语言,targetlanguage)的一门学科。机器翻译是一门学科也是一门技术。机器翻译源语言Machinetranslation目标语言sourcelanguagetargetlanguageNLPR,CAS-IA2005-5-112NLPR10.1机器翻译的产生与发展q起始与发展1)古希腊2)17世纪:笛卡儿(Descartes)莱布尼兹(Leibniz)试图用统一的数字代码编写词典;17世纪中页贝克(CaveBeck)等人出版类似的词典。3)1930s:亚美尼亚法国工

3、程师阿尔楚尼(G.B.Arsouni)提出了用机器来进行语言翻译的想法,并在1933年7月22日获得了一项“翻译机”的专利,叫做机器脑(mechanicalbrain)1933年,前苏联发明家特洛扬斯基设计了用机械方法把一种语言翻译成为另一种语言的机器。NLPR,CAS-IA2005-5-113NLPR10.1机器翻译的产生与发展4)1946年英国工程师布斯(A.D.Booth)和美国洛克菲勒基金会副总裁韦弗(W.Weaver)提出了用计算机进行语言翻译的想法。5)1947年,韦弗发表了以《翻译》为题目的备忘录,正式提出机

4、器翻译问题:a)翻译类似于解读密码的过程:“当我阅读一篇用俄语写的文章时,我可以说这篇文章实际上是用英语写的,只不过它是用另外一种奇怪的符号编了码而已,当我阅读时,我是在进行解码。”NLPR,CAS-IA2005-5-114NLPR10.1机器翻译的产生与发展b)原文和译文“说的是同样的事情”因此,当把语言A翻译为语言B时,就意味着,从语言A出发,经过某一“通用语言(universallanguage)”或“中间语言(interlinguallanguage)”,然后转换为语言B,这种“通用语言”或“中间语言”可以假定是全

5、人类共同的。1954年,美国乔治敦大学在国际商用机器公司(IBM)的协助下,用IBM-701计算机,进行了世界上第一次机器翻译实验,把几个简单的俄语句子翻译成英语。苏联、英国、日本也进行了MT实验,从此MT出现热潮。NLPR,CAS-IA2005-5-115NLPR10.1机器翻译的产生与发展1964年,美国科学院成立语言自动处理咨询委员会(AutomaticLanguageProcessingAdvisoryCommittee,ALPAC),调查机器翻译的研究情况,并于1966年11月公布了一个题为“语言与机器”的报告,

6、简称ALPAC报告,宣称:“在目前给机器翻译以大力支持还没有多少理由”“机器翻译遇到了难以克服的语义障碍(semanticbarrier)”1954~1970(ALPAC):草创时期;1970~1976:复苏阶段;1976~现在:繁荣时期。NLPR,CAS-IA2005-5-116NLPR10.2机器翻译基本方法1)初期:人们一般采用直接翻译的方法,从源语言句子的表层出发,将单词或者词组、短语甚至句子直接置换成目标语言译文,必要时进行一些词序的调整,便可以生成译文的句子。对原文句子的分析仅仅满足于特定译文生成的需要。这类翻

7、译系统一般真对某一个特定的语言对,将分析与生成、语言数据、文法和规则与程序等都融合在一起。NLPR,CAS-IA2005-5-117NLPR10.2机器翻译基本方法2)1957年美国学者V.Yingve在《句法翻译框架》(FrameworkforSyntacticTranslation)一文中提出了对源语言和目标语言均进行适当描述、把翻译机制与语法分开、用规则描述语法的实现思想,这就是基于规则的(Rule-based)转换翻译方法。其翻译过程分成六个步骤:a)对源语言句子进行词法分析b)对源语言句子进行句法分析c)原语言到

8、译文词汇转换d)源语言到译文结构转换e)译文句法生成c)译文词法生成NLPR,CAS-IA2005-5-118NLPR10.2机器翻译基本方法“独立分析-独立生成-相关转换”的翻译方法其代表系统是法国格勒诺布尔(Grenoble)医科大学(现为格勒诺布尔大学)信息、数学与应用研究院(IMAG)的机器翻译

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。