一种基于实例的汉英机器翻译策略1.pdf

一种基于实例的汉英机器翻译策略1.pdf

ID:52288964

大小:235.34 KB

页数:8页

时间:2020-03-26

一种基于实例的汉英机器翻译策略1.pdf_第1页
一种基于实例的汉英机器翻译策略1.pdf_第2页
一种基于实例的汉英机器翻译策略1.pdf_第3页
一种基于实例的汉英机器翻译策略1.pdf_第4页
一种基于实例的汉英机器翻译策略1.pdf_第5页
资源描述:

《一种基于实例的汉英机器翻译策略1.pdf》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、1一种基于实例的汉英机器翻译策略胡国全,陈家骏,戴新宇,尹存燕(南京大学计算机软件新技术国家重点实验室,南京210093)(南京大学计算机科学与技术系,南京210093)摘要:介绍了一种基于实例的汉英机器翻译策略,重点讨论汉英双语语料库的设计和基于该语料库的汉语句子的匹配算法。在进行汉语句子的匹配时,根据汉语的特点直接采用汉字的匹配,而没有进行汉语句子的分词。另外,匹配时确定匹配片断的边界也是基于实例机器翻译的难点之一,在这方面也采取了相应的解决方法。没有对翻译句子的连接装配进行更深入的研究,这是因为该翻译策略是用于多翻译引擎系统的,它要与其它翻译策略配合使用,以提高翻译结果的正

2、确率。基于实例的机器翻译需要大量的双语语料库作为翻译时的依据,而人工建设大型语料库费时费力,所以尝试采用计算机进行汉英双语语料库的自动建立,包括篇章对齐和单词级的对齐。关键词:自然语言处理;机器翻译;基于实例中图分类号:TP391.2AExample-basedChinese-EnglishMachineTranslationStrategyHUGuo-quan,CHENJia-jun,DAIXin-yu,YICun-yan(DepartmentofComputerScienceandTechnology,NanjingUniversity,StateKeyLaboratoryf

3、orNovelSoftwareTechnologyatNanjingUniversityNanjing210093)Abstract:ThispaperpresentsaChinese-EnglishmachinetranslationstrategybasedonEBMT(Example-basedmachinetranslation)technique.EBMTsystemshavetwomaindifficultissues:determiningfragment'sboundaryinmatchingprocessandestablishingbilingual-corp

4、us.WhenprocessingChinese,itdoesn’tanalyzewords.Somestatisticalmethodsareusedtoalignsentencesandwords,forexample,usingco-occurrencefrequency.ConsideringthecharacteristicsofChinese,whenmatchingtwoChinesesentences,itmatchesthemintermsofChinesecharacters.Aboutboundarydetermination,itusesanappropr

5、iatemeasuretosolveit.Wehavenotstudieddeeplyinassemblingmatchingfragments.Thistranslationstrategyismeanttobeusedasoneoftheenginesinamulti-enginetranslationsystem.Itisaverydifficulttasktoconstructabigbilingual-corpusmanually,sothispapertriestousecomputertoprocessitautomatically.Itincludesautoma

6、ticalignmentofbilingualsentencesandwords.KeyWords:naturallanguageprocessing;machinetranslation;Example-based1、前言基于实例的机器翻译(Example-BasedMachineTranslation)思想最早是由著名的日本机器翻译专家长尾真(Nagao.M.)提出的。其基本思想是:利用过去已经翻译过的语料、采用模拟的方法来翻译待翻译的句子。它假设相同的源语言部分对应相同的翻译结果,当以前翻译过的部分再次出现的时候,相同的翻译结果很可能就是正确的。EBMT技术从九十年代起越来

7、越受到人们的关注,与基于规则的机器翻译相比有它自己很多明显的优势,它翻译时所需要的主要信息是一个大型的双语语料库(也可以包含其它1本论文工作得到863项目《面向奥运的多语言信息服务系统》(编号:2001AA117010)经费的资助。胡国全(1975.5-),男,河南省郑州市人,硕士生,主要研究机器翻译;陈家骏教授,博士生导师,主要研究自然语言处理、软件工程;戴新宇博士生,主要研究自然语言处理;尹存燕助教,主要研究自然语言处理。信息,如语义词典等),可以部分解决基于规则系统中翻译规

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。