机器翻译中汉语动结式生成的过程

机器翻译中汉语动结式生成的过程

ID:23180882

大小:66.00 KB

页数:13页

时间:2018-11-05

机器翻译中汉语动结式生成的过程_第1页
机器翻译中汉语动结式生成的过程_第2页
机器翻译中汉语动结式生成的过程_第3页
机器翻译中汉语动结式生成的过程_第4页
机器翻译中汉语动结式生成的过程_第5页
资源描述:

《机器翻译中汉语动结式生成的过程》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库

1、机器翻译中汉语动结式生成的过程1.引言当电子计算机1946年问世的时候,人们就提出了机器翻译的想法,并且在1954年进行了第一次机器翻译试验。然而与后来的各种语言信息处理研究和应用(语言信息检索、文本自动分类、自动文摘、信息提取等等)相比,机器翻译却是进展最慢的。学者们倾其大半生精力、商家投入为数可观的资金,经历五十多年不懈的研究和开发,得到的成果或者产品却常常不能令人满意。原因是什么呢?从语言研究的角度来说,机器翻译系统分析、理解和生成自然语言的能力都还不到位,处理不了的语言现象很多:有的是句子结构层次弄

2、错了,有的是结构关系弄错了,有的是成分之间的语义关系弄错了,有的是词义辨识错了,还有的错误是源语和目标语之间的对比差异造成的。下面是机器翻译处理汉语动结式不成功的几个例子(来自三个机器翻译系统)。先看生成的情况,机器翻译目前还很难生成汉语的动结式,所以我们很少在汉语译文里见到含有动结式的句子。对于下面这个英译汉的例子,三个系统都不能翻译成他把地扫干净了:Heskickspoil3pairsofshoes.这段路把妈妈走累了。*Theakemothertiredaftertheothertired(ly).*

3、Thisroadmotherdash;结果事件。比如要生成的意思是:小王读了这篇文章,结果小王懂了这篇文章。在汉语生成开始之前,机器翻译系统用中介语言逻辑表达式表示要生成的译文是什么意思。一般来说,如果这个表达式里面有两个谓词结构,并且二者之间有动作结果关系,就可以进入汉语动结式的生成过程。中介语言逻辑表达式是从源语(譬如英语)分析得到的,源语中的述谓结构和动作结果关系会在表达式中有所体现。但这并不是判断能否生成汉语动结式的惟一依据。我们在上一节提到,英语往往没有相当于汉语动结式的结构形式,也很难用转换规则

4、把英语的某些结构形式与汉语动结式联系起来,这是就句法结构来说的。实际上,由于英、汉语之间在动作结果关系表达上的差异,(注:戴浩一(2002)指出:动作结果基模虽然在汉、英语中都存在,但是在汉语中占主导地位,而在英语中占次要甚至边缘地位。而且,这个基模在两个语言对客观情况的构建上也因经验的概念化不同而呈现不同的形式。)在从源语分析得来的语义表达式里,可以用汉语动结式生成的动作结果关系有时是隐含的,与此相关的述谓关系也有不同的表现形式。比如:还有,致使动作结果事件发生的某些因素在汉语里常常可以充当动结式的一个论

5、元角色,(注:袁毓林(2001)称其为外来的致事。)而在英语里它们往往充当其他成分:那场可怕的暴风雪冻死了不少人。Manypeoplefrozetodeathintheterriblesno.沙发把你坐懒了。Youarebeinglazyonthesofa.所以我们需要一组规则,在要生成的语义表达式里判断有没有应该用汉语动结式表达的述谓关系。在这组规则里,除了两个谓词结构及其显性的动作结果关系符合判断条件以外,还应该有能够识别和提取隐含的动作结果关系及其述谓结构的条件。这就需要研究英语和汉语在表达动作结果关

6、系时的差异。这种差异有时在某种类别下表现出来,有时又很个性化,只跟具体词语有关。目前机器翻译系统还没有找到这样的规则。所以我们就暂时只能看到她嫁给了错误的人和他进了错误的门这样的译文。3.2选择词语选择词语需要有一部用于信息处理的汉语词典,告诉我们词语和它们的意义,以及它们的用法(比如,谓词的配价结构及其论元的限制条件)。对于前面的例子,需要先在词典里选出小王、读、懂、文章这些词,然后根据词语的意义和逻辑关系为它们分派语义角色。这些词在中介语言逻辑表达式里是实体和谓词。了、结果、这等是算子或关系,把它们转成

7、词汇形式还需要另外的分析和处理。词语选择和语义角色分派的结果可以表示成树形图或特征集合等形式。即使有一部详尽的词典,要让机器根据意义选择词语也不是一件容易的事情。我们经常需要在几个同义词或近义词当中进行取舍。比如,汉语的看有read的意思,用它来表达我们要生成的意思比读更地道。根据什么样的规则选择看,不选择读?目前汉语词汇和语义的研究还不能形式化地回答这个问题。机器翻译系统只好先根据词语搭配的优先关系来判断。一种作法是,借助描写词语概念的语义词典,用统计语言模型计算语义相似度,让计算机学会表示和比较词语搭配

8、的优先关系。但是,用这种工程化的方法并不能绕过汉语研究的作用,因为一个统计语言模型能否达到比较好的处理效果,很大程度上取决于采用什么样的语言学知识作为参数。3.3判断合法性经过词语选择和角色分派,得到了图2表示的两个谓词结构。这一步的任务是,判断能不能用动结式述语结构表示这两个谓词结构及其关系。具体说就是,看和懂能不能合成看懂,并且表示中介语言逻辑表达式要求的动作结果关系。因此合法性的问题关系到哪些动词和哪些形容

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。