欢迎来到天天文库
浏览记录
ID:30789171
大小:53.00 KB
页数:17页
时间:2019-01-03
《timss试题机器翻译系统构建和其效果》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库。
1、TIMSS试题机器翻译系统构建和其效果摘要:研究以范例为基础的机器翻译技术和英汉双语对应的结构辅助英汉单句语料的翻译。翻译范例是运用一种特殊的结构,此结构包含来源句的剖析树、目标句的字符串、以及目标句和来源句词汇对应关系。将翻译范例建立数据库,以提供来源句作词序交换的依据,最后透过字典翻译,以及?用统计式中英词汇对?和语言模型来选词,产生建议的翻译。研究是以2010年国际数学与科学教育成就趋势调查测验试题为主要翻译的对象,以期提升翻译的一致性和效率。以NIST和BLEU的评比方式,来评估和比较在线翻译系统和本系统所达成的翻
2、译质量。关键词:试题;语料;剖析树;自然语言;机器翻译;TIMSS中图分类号:H315.9文献标识码:A文章编号:1672-3104(2013)05?0244?08一、引言国际教育学习成就调查委员会(TheInternationalAssociationfortheEvaluationofEducationAchievement,以下简称IEA)的主要工作是了解各国学生数学及科学(含物?、化学、生物、及地球科学)方面学习成就、教育环境等影响学生学习成效的因素,找出关联性,并在国际间相互作比较。自1970年起开始第一次国际数
3、学与科学教育成就调查后,世界各国逐渐对国际数学与科学教育成就研究感到兴趣,IEA便在1995年开始每四年办?国际数学与科学教育成就研究一次,称为国际数学与科学教育成就趋势调查(TrendsinInternationalMathematicsandScienceStudy,以下简称TIMSS)。中国教育科学研究院于1983年正式成为IEA的团体会员,并计划加入和引进TIMSS的调研活动,以期对中国数学教育和科学教育产生积极的作用。而我国的台湾省于1999年加入TIMSS后,已经开始着手实施相关工作,包括负责试题翻译及测验工作
4、。本文在对国外和台湾的相关试题测试工作进行研究和分析后,对TIMSS试题翻译作了初步的研究分析。以往使用人工翻译虽然可以达到很高的翻译质量,但是需要耗费相当多的人力资源和时间,而且在翻译过程中不同的翻译者会有不同的翻译标准,相同的翻译者也可能在文章前后翻译方式不一致而产生语意上的混淆。因此此类语言转换导致的问题间接影响试题难易程度。若直接将英文词汇透过英汉字典翻译成相对的中文词汇,翻译的结果可能会不符合一般人的用词顺序。另外中文的自由度较高,很容易造成翻译上用词顺序的不同。例如:“下图显示某一个国家所种谷物的分布图”,也可
5、翻译为“某一个国家所种谷物的分布图,如下图显示”。可能会影响到受测者的思绪,使作答时粗心的情形增加。因此,若能?用机器翻译(machinetranslation)的技术来辅助翻译以及调整词序,便可提高翻译的质量和效率。Dorr等学者[1]将现在机器翻译依据系统处?的方式来分类,分成以语言学为基础翻译(linguistic-basedparadigms),例如基于知识(knowledge-based)和基于规则(rule-based)等;以及非语言学为基础翻译(non-linguistic-basedparadigms),例
6、女口基于统计(statistical-based)和基于范例(example-based)等。以知识为基础的机器翻译(knowledge-basedmachinetranslation)系统是运用字典、语法规则或是语言学家的知识来帮助翻译。这种?用字典来帮助翻译的系统,会有一字多义的情形发生,一个词汇在字典中通常有一个以上的翻译。以英翻中为例''cuirent”这个字在字典里就有十多种不同的翻译,即使专家也无法找出一个统一的规则,在何种情况下要用何种翻译,所以在翻译的质量和正确性上很难满足使用者的的需求。因此,翻译系统通常
7、都会限定领域来减少一字多义,例如''current''在电子电机类的文章中出现,最常被翻译为电流,在文学类的文章中,最常被翻译为现代。以范例为基础的机器翻译(example-basedmachinetranslation,以下简称为EBMT)的相关研究已有相当多年历史,在1990年美国学者Brown和Pietra[2]所提出的EBMT是将翻译过程分为分解(decomposition)、转换(transfer)和合成(composition)三步骤。分解阶段是将来源句放到范例库中搜寻,将所搜寻到word-dependency
8、tree当作来源句的word-dependencytree,并且形成来源句的表示式;转换阶段将来源句的表示式转换成目标句的表示式;合成阶段将目标句的表示式展开为目标句的word-dependencytree,并输出翻译结果。Al-Adhaileh等学者[3]将strueturedstringtreeco
此文档下载收益归作者所有