资源描述:
《一种基于元规则的自然语言生成规则解释技术new》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库。
1、*一种基于元规则的自然语言生成规则解释技术**孙明欣,尹存燕,戴新宇,陈家骏(南京大学计算机软件新技术国家重点实验室,南京,210093南京大学计算机科学与技术系,南京,210093)摘要:结合一个基于规则的日汉机器翻译系统,给出了自然语言生成规则的一种解释技术。该解释技术着眼于汉语生成规则语言的表达能力、自然性以及可扩充性,在实现中采用了基于元规则的方法,使得可以很方便地对规则语言进行扩充;另外,元规则的描述主要采用了自动机模型。所述的原则和技术也适用于一般的基于规则的自然语言处理系统。关键词:机器翻译,生成,规则语言,元规则,
2、自动机中图分类号:TP391AMeta-Rule-BasedApproachtoNLGRulesInterpretationSunMing-Xin,YinCun-Yan,DaiXin-Yu,ChenJia-Jun(StateKeyLaboratoryforNovelSoftwareTechnology,DepartmentofComputerScienceandTechnology,NanjingUniversity,Nanjing,210093,China)Abstract:Rule-basedapproachesarestil
3、lwidelyusedinmachinetranslationevenwhenstatistic-basedapproachesaremoreandmorepopular.Inarule-basedsystem,RDLs(ruledescriptionlanguage)shouldbewelldesignedfortheconvenienceofpowerofexpressionandextensibility.ThispaperpresentsanapproachtotheimplementationoftheRDL,which
4、isusedforChinesegenerationinarule-basedJapanese-Chinesemachinetranslationsystem.Ameta-rule-basedinterpretingtechniqueisusedintheimplementation.ThemetarulesactastheintermediabetweenChinesegenerationrulesandtheruleinterpreter.ThustheupdatingoftheRDLwillonlyresulttoaddin
5、g,deletingorchangingthemetarulesandtheinterpretercanworkwellwithoutanymodifying.Insomemetarules,anautomatonmodelisusedtodescribesomeelementsoftheRDLascomplexcombinationsofatomoperations.AndothermetarulesshowthatsomeotherelementsoftheRDLcanexpressedaslinearcombinations
6、ofatomoperations.Theprinciplesandtechniquesdiscussedinthispaperarealsoapplicabletoothergeneralrule-basednaturallanguageprocessingsystems.Keywords:machinetranslation,generation,RDL(ruledescriptionlanguage),metarules,automata随着信息的急剧增加、国际交流的日趋频繁以及计算机网络的迅速发展普及,语言障碍*基金项目:国
7、家863项目“面向奥运的多语言信息服务系统”(2002AA117010-04)**通讯联系人,E-mail:chenjj@nju.edu.cn1[1,2]问题显得越来越严重,机器翻译的潜在需求越来越大。机器翻译所采用的方法可以分为两大类:基于规则和基于语料库的方法,其中基于规则的方法在20世纪90年代以前一直是[2,3,4]主流的方法,并且现在有影响的机器翻译系统也都是基于规则的。[5]基于规则的机器翻译的核心问题是构造完备的或适应性较强的规则系统。一个好的规则系统应当描述能力强、易于扩充,并且表达方式要自然。基于上述原则,本文结
8、合一个日汉机器翻译系统给出了一种基于元规则的自然语言生成规则的解释技术,其中元规则的描述主要采用了自动机模型。这使得规则语言易于扩充,当增加、删除规则语言的某些成分或改变其含义时,只需要增加、删除或修改相应的元规则。该技术也适用于其它的基于规则的自