欢迎来到天天文库
浏览记录
ID:52288964
大小:235.34 KB
页数:8页
时间:2020-03-26
《一种基于实例的汉英机器翻译策略1.pdf》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库。
1、1一种基于实例的汉英机器翻译策略胡国全,陈家骏,戴新宇,尹存燕(南京大学计算机软件新技术国家重点实验室,南京210093)(南京大学计算机科学与技术系,南京210093)摘要:介绍了一种基于实例的汉英机器翻译策略,重点讨论汉英双语语料库的设计和基于该语料库的汉语句子的匹配算法。在进行汉语句子的匹配时,根据汉语的特点直接采用汉字的匹配,而没有进行汉语句子的分词。另外,匹配时确定匹配片断的边界也是基于实例机器翻译的难点之一,在这方面也采取了相应的解决方法。没有对翻译句子的连接装配进行更深入的研究,这是因为该翻译策略是用于多翻译引擎系统的,它要与其它翻译策略配合使用,以提高翻译结果的正
2、确率。基于实例的机器翻译需要大量的双语语料库作为翻译时的依据,而人工建设大型语料库费时费力,所以尝试采用计算机进行汉英双语语料库的自动建立,包括篇章对齐和单词级的对齐。关键词:自然语言处理;机器翻译;基于实例中图分类号:TP391.2AExample-basedChinese-EnglishMachineTranslationStrategyHUGuo-quan,CHENJia-jun,DAIXin-yu,YICun-yan(DepartmentofComputerScienceandTechnology,NanjingUniversity,StateKeyLaboratoryf
3、orNovelSoftwareTechnologyatNanjingUniversityNanjing210093)Abstract:ThispaperpresentsaChinese-EnglishmachinetranslationstrategybasedonEBMT(Example-basedmachinetranslation)technique.EBMTsystemshavetwomaindifficultissues:determiningfragment'sboundaryinmatchingprocessandestablishingbilingual-corp
4、us.WhenprocessingChinese,itdoesn’tanalyzewords.Somestatisticalmethodsareusedtoalignsentencesandwords,forexample,usingco-occurrencefrequency.ConsideringthecharacteristicsofChinese,whenmatchingtwoChinesesentences,itmatchesthemintermsofChinesecharacters.Aboutboundarydetermination,itusesanappropr
5、iatemeasuretosolveit.Wehavenotstudieddeeplyinassemblingmatchingfragments.Thistranslationstrategyismeanttobeusedasoneoftheenginesinamulti-enginetranslationsystem.Itisaverydifficulttasktoconstructabigbilingual-corpusmanually,sothispapertriestousecomputertoprocessitautomatically.Itincludesautoma
6、ticalignmentofbilingualsentencesandwords.KeyWords:naturallanguageprocessing;machinetranslation;Example-based1、前言基于实例的机器翻译(Example-BasedMachineTranslation)思想最早是由著名的日本机器翻译专家长尾真(Nagao.M.)提出的。其基本思想是:利用过去已经翻译过的语料、采用模拟的方法来翻译待翻译的句子。它假设相同的源语言部分对应相同的翻译结果,当以前翻译过的部分再次出现的时候,相同的翻译结果很可能就是正确的。EBMT技术从九十年代起越来
7、越受到人们的关注,与基于规则的机器翻译相比有它自己很多明显的优势,它翻译时所需要的主要信息是一个大型的双语语料库(也可以包含其它1本论文工作得到863项目《面向奥运的多语言信息服务系统》(编号:2001AA117010)经费的资助。胡国全(1975.5-),男,河南省郑州市人,硕士生,主要研究机器翻译;陈家骏教授,博士生导师,主要研究自然语言处理、软件工程;戴新宇博士生,主要研究自然语言处理;尹存燕助教,主要研究自然语言处理。信息,如语义词典等),可以部分解决基于规则系统中翻译规
此文档下载收益归作者所有