机器翻译评测的新进展

机器翻译评测的新进展

ID:37671133

大小:530.86 KB

页数:8页

时间:2019-05-28

机器翻译评测的新进展_第1页
机器翻译评测的新进展_第2页
机器翻译评测的新进展_第3页
机器翻译评测的新进展_第4页
机器翻译评测的新进展_第5页
资源描述:

《机器翻译评测的新进展》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库

1、维普资讯http://www.cqvip.comil1;;}{.}≯{}{●f},{{中文信息学报第17卷第6期JOURNALOFCItlN~EINFORMATIONPROCESSINGVoi.17No.6文章缩号:1003—0077(2003)06—0001—08机器翻译评测的新进展张剑,吴际2,周明0(1.北京邮电大学信息工程系,北京100876;2.北京航空航天大学计算机系,北京100083;3.徼软亚洲研究院,北京m0080)摘要:机器翻译评测对机器翻译的研究和开发具有至关重要的作用,对其的研究一直

2、是国内外机器翻译界的重点课题。本文首先全面地介绍了最近出现的而且受到极大关注的机器翻译评测技术,即IBM公司的BLEU机器翻译评测标准和NIST采用的机器翻译评测技术。实验表明,自动翻译评测技术能够接近人工评价,评测结果也是可接受的。因此,采用自动翻译评测技术能够给自然语言处理的研究人员和开发人员带来很大的便利性。本文还展示了一个开放式的可扩展的自动翻译评测的平台,完全实现了BI、I和NIST评测标准。并做出了一定的改进使得该系统具有良好的使用性和可扩展性。关键词:人工智能;机器翻译:自动评测中圈分类号:1

3、]P391.2文献标识码:ATheImprovementofAutomaticMachineTranslationEvaluation,ZHANGJian,wuji2,ZHOUMiI1g3(1.nept.ofInfo,∞nee血g,iIlgUniver~wofPostsandTdeemamunicatiom,Beiih-~100876,China;2.Dept.dQII叫.Sd&.,B两.噶UniversitydA∞.&A.stro.,8eij.噬100083,Claire;3.M.n∞R目耐IA,Bt蛐1

4、00080,Q妇)Almraet:Evaluationplaysacriticalroleinthemachinetranslation.Theresearchofautomaticmachinetranslatione.valuationisanurgentneedforthenat~allanguageprocessingresearchersanddevelopers.paperbfidlyde-scribesthebadmdofevaluationofmachinetranslationandtwo

5、importanttechnologyofautomaticevaluation:.BIEIandNISTmetrics.Then,wepresentssorileimprovementsforthesemetricsbytheideash吼textretrieval。whichiscalledTFIDF-weightedmetric.ThismethodavoidstheshortcomingofBIEImetricandachievesal蜘F-ratiovalue.Asaresult,itcaI1gi

6、veamnarkableeffectontheautomaticevaluationofmachinemmslation.Wea1.s0describeanevaluationplatformwhichc&ntakeInoreconveniencetotheresearchesandd_d懒.,rw~~ds:artificialintdligence;machinetnmslation;automaticevaluation一、引言近年来,在自然语言研究领域中,评测问题越来越受到广泛的重视,可以说,评测是整

7、个自然语言领域最核心和关键的部分。国际上为了推动自然语言研究的评测,在过去的几年中,进行了若干次有影响的评测活动,如MUC评测专名识别问题,TREC评测信息检索的发展,还有许多机器翻译和语音技术的评测活动,所有这些评价活动都有力地促进了相关学科的发展。收稿日期:2003—05—28作者简介:张剑(1977一),男,博士生,研究方向为自然语言处理,数据挖掘.本文是微软亚洲研究院机器翻译课题,系作者在微软亚洲研究院访问期间完成.’’.1.维普资讯http://www.cqvip.com髦维普资讯http://w

8、ww.cqvip.com中,使得人们能够跨越语言的障碍,不论信息载体是语音还是文字,都可以快速地发现和解释信息。这个项目中有几个核心的技术,首先是信息侦测,就是要能够感知到信息的存在。其次,是能够从特定的信息载体中,抽取出关键的事实、实体和各类事件一实体之间的关系。然后,通过摘要,把最重要的信息抽取出来,从而减少阅读的时间和代价。但不论是哪种技术,都是在跨语言的环境中进行的,处理的对象都是多语言的形式,因此翻译是

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。