欢迎来到天天文库
浏览记录
ID:5385236
大小:225.31 KB
页数:10页
时间:2017-12-08
《机器翻译中基于语法、语义知识库的汉语词义消歧策略》由会员上传分享,免费在线阅读,更多相关内容在应用文档-天天文库。
1、♣机器翻译中基于语法、语义知识库的汉语词义消歧策略王惠北京大学计算语言学研究所,北京,100871摘要:词义消歧研究在自然语言处理的许多应用领域中具有重要的理论和实践意义,在机器翻译中更是如此,它直接关系到译文质量的提高。但目前已有的词义消歧系统基本上都面临着消歧知识获取的瓶颈问题。本文认为,要真正有效地提高词义知识库的质量,需要在词类划分基础上,增加词义的语法功能分析和语义搭配限制,综合利用现有的语法、语义资源,提取多义词的每个意义在不同层级上的各种分布特征。以此为基础,本文提出了一种汉英机器翻译系统中基于语法、语义知识库的汉语词义消歧分析算法。初步的实验结果表明,该
2、方法可以高质量地进行汉语名词、动词、形容词的词义消歧。关键词:词义消歧(WSD)汉英机器翻译语法词典语义词典AStudyofChineseWordSenseDisambiguationinMTBasedonGrammatical&SemanticKnowledge-basesWang,Hui(InstituteofComputationalLinguistics,PekingUniversity,Beijing100871,China)AbstractWordsensedisambiguation(WSD)playsanimportantroleinMachineTra
3、nslationandmanyotherareasofnaturallanguageprocessing.TheresearchonWSDhasgreattheoreticalandpracticalsignificance.ThemainworkinthispaperistostudywhatkindofknowledgeisusefulforWSDinsystem,andestablishamulti-levelWSDmodelbasedonsyntagmaticfeaturesandsemanticinformation,whichcanbeusedtodisam
4、biguatewordsenseinMandarinChineseeffectively.ThemodelmakesfulluseoftheGrammaticalKnowledge-baseofContemporaryChineseasoneofitsmainmachine-readabledictionary(MRD),whichcanproviderichgrammaticalinformationfordisambiguationsuchasChineselexicon,parts-of-speech(POS)andsyntaxfunction.Anotherre
5、sourceofthemodelistheSemanticDictionaryofContemporaryChinese,whichprovidesathesaurusandsemanticcollocationinformationof68,000Chinesewords.TheresultsofthisstudyindicatethatthetwoMRDresourcesareeffectiveforwordsensedisambiguationinMTandarelikelytobeimportantforgeneralChineseNLP.Keywords:Wo
6、rdSenseDisambiguation,Chinese-EnglishMachineTranslation,GrammaticalKnowledge,SemanticDictionary♣本项研究得到国家973项目“面向新闻领域的汉英机器翻译系统”(项目号:G1998030507-4)的支持。11.引言由于自然语言中一词多义现象普遍存在,在机器翻译中,要让计算机进行准确的译文选择(translationchoice),一个重要的前提条件就是能够在某个特定上下文中,自动排除歧义,确定多义词的词义。因此,词义消歧(Wordsensedisambiguation,WSD)
7、从50年代初期开[1,2]始机器翻译研究起就一直备受计算语言学家的关注。早期人们所使用的词义消歧知识一般是凭人手工编制的规则。由于手工编写规则费时费力,存在严重的知识获取的“瓶颈”问题。20世纪80年代以后,语言学家提供的各类词典成为人们获取词义消歧知识的一个重要知识源。Lesk、Luk根据《OxfordAdvancedLearner’s[3,4]Dictionary》中的释义文本来判断多义词在上下文中的词义。Dagan和Gale利用双语对照[5,6]词典来帮助多义词消歧。Voorhees、Resnik从不同角度利用WordNet中的上下
此文档下载收益归作者所有