基于规则的机器翻译系统.ppt

基于规则的机器翻译系统.ppt

ID:52220654

大小:423.50 KB

页数:26页

时间:2020-04-02

基于规则的机器翻译系统.ppt_第1页
基于规则的机器翻译系统.ppt_第2页
基于规则的机器翻译系统.ppt_第3页
基于规则的机器翻译系统.ppt_第4页
基于规则的机器翻译系统.ppt_第5页
资源描述:

《基于规则的机器翻译系统.ppt》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、机器翻译原理之基于规则的机器翻译系统(Rule-basedSystem)机器翻译(machinetranslation)机器翻译原理本质:是人类思维和语言活动的模拟;是探索如何借助计算机程序将文字或语言从一种自然语言翻译成另一种自然语言的技术。机器翻译的翻译过程如图所示:(输入)原语分析转换生成目的语(输出)机器翻译(machinetranslation)机器翻译主要有两套系统:一、基于规则的(Rule-basedSystem)二、基于语料库的(Corpus-basedSystem)基于规则的机器翻译系统规则主要包括:1、词法2、句法3、短语规则4、转换

2、生成语法基于规则的机器翻译系统大致可分为三种类型:1、直接翻译2、结构转换翻译3、中间语翻译基于规则的机器翻译系统 之 直接翻译是把原语中的单词或句子直接替换成相应的目的语的单词,必要时对词序进行适当的调整。这是机器翻译最初的构想。从目的语中寻找与原语词汇相对应的单词.但并不是电子词典的word-to-word形式,而是翻译句子中所有的词汇。到后期也加入了一些简单句法甚至语义规则,对替换后的词语进行重新排序,生成目的语文本。其翻译模式如下图:SL输入形态分析双语词典查询语序调整TL输出在孩子的教育问题上,家庭教育与学校教育同等重要Family educa

3、tion play anequally important role inchildren'seducationas school education.由于原语与目的语在句子语法结构上千差万别,翻译出来的句子的可读性可想而知。但它是机器翻译的最实质性的一步,是机器翻译从梦想到现实的一次飞跃。基于规则的机器翻译系统 之 转换系统为了提高译文的可读性,人们更多的从句子的层面来分析处理原语与目的语的特征。于是在直接翻译系统之上,出现了机器翻译的转换系统。基于规则的机器翻译系统 之 转换系统通常包括:分析、转换和生成三部分其中从原语向目的语的转换是该系统的核心。

4、这种方法被认为是模拟人类翻译活动最恰当的机制。机器翻译的三个阶段1957年,美国学者V.Yingve提出了翻译的三个阶段,即:1、用代码化的结构标志转换为目的语句子结构标志(分析阶段)2、把原语句子的结构标志转换为目的语句子的结构标志(转换阶段)3、有目的语句子结构都标志生成目的语句子(生成阶段)个人见解SL表层结构我爱你SL深层分析520TL深层结构TL表层结构FiveTwoZeroILoveYou分析转换生成三阶段的新诠释法国人B.Vouquois将三阶段诠释为六个步骤分析转换生成原句词法原句句法双语词法双语句法目的语句法目的语词法奈达对翻译过程的诠

5、释奈达根据乔姆斯基的“转换生成语法”做的诠释SL表层结构SL深层结构转换TL深层结构TL表层结构分析生成机器翻译中,从原语(SL)句子的表层结构到其深层结构需要经过词法、句法、语义等分析。性层的深层结构是一种树(syntaxtree)。它反映的事一个句子内部的语法结构,这种结构认为是人类抽象思维的逻辑表达式。不同的语言具有相同或相似的深层结构。就像是一座桥梁,把人类不同的语言连接恰来,使彼此可以翻译交流。问题:这两种诠释有什么相似之处?基于规则的机器翻译系统 之 中间语翻译自然语言大多一个单词有多种意思,比如,中文的“方便”二字就有很多不同的意思,容易产

6、生歧义。在机器翻译中,为了简化纷繁的表达结构,避免其含糊不清的语言现象,独立于各种自然语言,同时又能清晰准确地表达各种自然语言的人造计算机语言英语而生。这种人造计算机语言就是中间语(interlingua,IL)基于中间语的机器翻译原理就是不同语言之间建立一个通用的语义-句法表达式,如图所示:SL中间语表达式TLSL词典和语法库SL词典TL词典和语法库合成分析个人见解货币的本质是一种等价物,那意味着所有的物品都可以用货币去衡量,就相当于一种中间语,用货币比喻如图:1000RMB=一头牛100欧元=一个花瓶1000RMB=100欧元=1货币在这个比喻中,虽

7、然不能把一头牛直接等价于一个花瓶,也不能直接把1000RMB直接等价于100欧元,但是它们都有相同的等价物1货币,这1货币就是它们之间的桥梁,它们可以互相交换。这就和中间语的功能是相似的寻找中间语的难度“如果要设计出一种元语言(中间语)用来解释,那么它就必须包含多种语言的所有特征。这种努力不仅毫无止境,而且可能毫无结果”——法国人斯莱德谢谢欣赏演讲人韩旭博NO.23

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。