欢迎来到天天文库
浏览记录
ID:33018644
大小:72.51 KB
页数:8页
时间:2019-02-19
《基于语料库的机器翻译的现状与展望》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库。
1、考试与评价(大学英语教研版)2017/)545-50基于语料库的机器翻译的现状与展望汪云eg/RJ大军海军航空大学航空基础学院导出/参考文献关注分享收藏打印摘要:机器翻译是探索如何借助计算机程序将文字或语音从一种自然语言翻译成另外一种自然语言的技术。早期是从自然语言学的角度研究机器翻译,产生了基于规则的机器翻译系统。上世纪80年代末以来,针对传统机器翻译的不足在基于规则的技术屮引入了语料库方法。与翻译有关的语料库有三类:平行语料库、多语语料库和可比语料库。基于语料库的机器翻译主耍包括基于统计的方法和基于实例
2、的方法。前者强调从数学上建立统计模型,后者主要是从机器学习的角度通过翻译实例进行推理。基于语义的方法将会成为统计机器翻译未来发展的趋势;而融合各种学科理论和技术的最新成果,进一步建立和发展多模态语料库,则是开发基于语料库的机器翻译系统的发展前景。关键词:机器翻译;语料库;基于统计的方法;基于实例的方法;发展前景;作者简介:汪云(1963-),女,副教授,研究方向:应用语言学作者简介:周大军(1963-),男,教授、博士,研究方向:应用语言学、军事语言学Corpus-basedMachineTranslati
3、onSystems:CurrentDevelopmentandPerspectivesAbstract:Machinetranslation(MT)isatechnologytotranslatefromonenaturallanguageincharacterorspeechformtoanotherbymeansofcomputerprograms.ResearchesonMTinearlierstagewereconductedfromtheangleofnaturallinguistics,thus
4、cameintobeingrule-basedMTsystem.TnallusiontoinadequaciesoftraditionalMT,corpustcchnologyhasbeenintroducedintorule-basedMTsincethelate1980s.TherearethreekindsofcorpusconcerningMT:parallelcorpus,multi-languagecorpusandcomparablecorpus.Corpus-basedMTmainlyinc
5、ludesstatistic-basedMTandexample-basedMTtheformerlaysemphasisonstatisticmodelfrommathematics,thelatterisinferredthroughtremslationexamplefrommachinelearning.SemanticbasedmethodwillbecomethetrendinstatisticMTdevelopment;whiletheperspectivesforcorpus-basedMT
6、systemistocombinethelatestresearchfruitsoftheoriesandtechnologiesofvarioussubjectsconcerned,andtofurtherdevelopmulti-modecorpus.Keyword:machinetranslation(MT);corpus;statistic-basedmachinetranslation;example—basedmachinetranslation;perspective;1.基于语料库的机器翻译
7、概观1.1语料库与机器翻译语料库是指存储于计算机中的原始文本带有语言学信息标注特征的、经过加工的语料文本,是一个由大量在真实情况下使用的语言信息集成的、可供计算机检索的、专门做研究使用的巨型资料库(张政、张晓丹,2010)。它始建于上世纪60年代末的美国布朗大学。语料库的研究与应用近些年来逐步深入,并取得了长足的进步。目前关于双语或多语语料库的研究大致可分为三类:一是研究双语语料的对齐技术,国内外学者就此提出多种策略和方法,现在已经出现了许多对齐双语或多语语料的程序或工具;二是研究双语语料的各种应用,如在基
8、于统计的机器翻译技术、基于实例的机器翻译技术,双语词典编纂技术中,双语语料库都发挥着十分重要的作用;三是双语语料库的设计、采集、编码和管理问题(常宝宝等,2003)o在众多的基丁语料库的研究中,将语料库应用丁翻译领域是当前语料库应用研究的热点之一。机器翻译(machinetranslation,MT)是探索如何借助计算机程序将文字或语音从一种自然语言翻译成另外一种自然语言的技术(赵红梅、刘群,2010)。机器翻译
此文档下载收益归作者所有