汉英机器翻译中时体态处理

汉英机器翻译中时体态处理

ID:4126488

大小:213.92 KB

页数:4页

时间:2017-11-29

汉英机器翻译中时体态处理_第1页
汉英机器翻译中时体态处理_第2页
汉英机器翻译中时体态处理_第3页
汉英机器翻译中时体态处理_第4页
资源描述:

《汉英机器翻译中时体态处理》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库

1、汉英机器翻译中时体态处理程节华,戴新宇,陈家骏,王启祥南京大学计算机软件新技术国家重点实验室南京大学计算机科学与技术系,南京,210093摘要作为机器翻译系统,我们必须处理目标语中句子的时态和体态。本文介绍了汉语中句子的时体态形式,给出了汉语中时态、体态抽取分析算法,归纳出汉英机器翻译时时体态转换规则,介绍了时体态处理系统流程。关键词机器翻译,汉语,英语,时体态抽取,时体态转换中图分类号:TP3910前言句子的时态提供了说话的时间和句子中所阐述的事件二者之间的时间关系。无论是自然语言理解和自然语言生成,还是机器翻译中都少不了时态方面的分析。然而在汉语和英语中,其表示时态的方法是不同的。英语中

2、,句子的时态是通过动词的形态变化来表示的,而汉语中没有动词的形态变化,也没有明显的时态标记,其时间表达是隐性的,其时态只能由副词、助词、时间短语、上下文信息等来表示。严格地说,汉语传统意义上的时态概念比较模糊,运用自然语言逻辑方法对汉语时间语义特征进行研究。本文针对汉语提出时态(tense)和体态(aspect)的概念,分析汉语句子中表达的时体态,并将其转换成英语中相应的时体态,完成汉英句子的翻译。本文首先介绍汉语句子时体态形式,然后给出汉语时态、体态分析抽取算法,最后介绍汉英时态转换策略。1汉语中句子时和态抽取分析算法汉语句子的时态、体态比较复杂,各家分类标准不一。而英语只有16种时态:一

3、般过去时、一般现在时、一般将来时、现在完成时、过去完成时、将来完成时、现在进行时、将来进行时、过去进行时、过去将来完成时、现在完成进行时、将来完成进行时、过去完成进行时、过去将来时、过去将来进行时、过去将来完成进行时。根据汉语的特点和汉英时体态转换的方便,本文将汉语的体态分为以下几种:实现态、一般态、进行态、经历态和将行态。汉语中表示时间的概念形式有:过去时、现在时、将来时。由于汉语中没有动词的形式变化,所以其时体态形式只能通过一些特定的词以及上下文信息来表示,其中包括副词、助词以及时间短语等。下面分别介绍汉语中时和体的抽取算法。1.1体态形式抽取分析算法:为了叙述方便,根据汉语的句式:[副

4、词]+V+[助词]+宾语,按照以下方法进行匹配:(i)if句式为V+“了”or“已经”+V+-----+“了”orV+补语且补语为{“完”,“好”,“掉”,“成”….}then句子的语态为{实现态}else(ii)if句式为V+“过”or“曾经”+V+“过”then句子的语态为{经历态}else(iii)if句式为(1)V+“着”(2)V+adv且adv为{“一直”,“不断”,“不停”}(3)“在”+动词性词语(4)“介词结构‘在……’+动词性词语(5)动词性词语+“呢”(6)动词+带“个”的否定状语(7)“从”+处所宾语+(动词)+“来”+宾语(8)“向”+处所宾语+动词+“来/去”(9)

5、“‘边’……‘边’……”(10)名词性词语+动词+“在”+处所词语then句子的语态为{进行态}else(iv)if句式为“将要”+Vor“要”+Vthen句子的语态为{将行态}else(v)if句式为“已经”+“在”+V……+“了/呢”then为“完成—进行态”else(vi)句子的语态为{一般态}……1.2时间信息抽取分析算法汉语的动词没有严格意义的形式变化,只能用分析性手段来表示在某一段时间内的存在或延续。具体来说,时间词语,副词,语境,和部分结构都可以单独或结合起来在句中表示动作发生或状态存在的时间。句中的时间概念可以按以下算法抽取:(1)if含有时间状语为{“今天”,“现在”,“本

6、周”,“今年”,“时下”,“目前”}or含有副词为{“在”,“正”,“正在”,“天天”,“经常”,“常常”,“每天”}or含有助词“呢”or结构为“正……呢”then句子的时间标记为{现在}(2)if有时间状语为{“昨天”,“前天”,“上周”,“去年”,“当年”,“早先”,“战前”,“小时侯”,“文革时期”,“19世纪”}or含有副词为{“曾”,“曾经”,“已经”,“刚”,“刚刚”,“刚才”}or结构为“自从(打)……以来”,“是……的”then句子的时间标记为{过去}(3)if有时间状语为{“明天”,“后天”,“明年”,“后年”,“下周”,“下学期”,一世纪”}or含有副词为{“将”,“将

7、要”,“快”,“快要”}or结构为“快要……了”,“就要……了”,“会……的”then句子的时间标记为{将来}(4)if句子的谓语是形容词或状态助词then句子的时间标记为{现在}(5)if句子的谓语动词为行为动词,且主语是第一人称单数then句子的时间标记为{现在}(6)其余情况句子的时间标记为{过去}(7)当句中时间词语与语气助词、频度副词同时出现时,时间词语有较高的优先级。……时体态的抽取算法中表达时体

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。