机器翻译中基于语法、语义知识库的汉语词义消歧策略

机器翻译中基于语法、语义知识库的汉语词义消歧策略

ID:5385236

大小:225.31 KB

页数:10页

时间:2017-12-08

机器翻译中基于语法、语义知识库的汉语词义消歧策略_第1页
机器翻译中基于语法、语义知识库的汉语词义消歧策略_第2页
机器翻译中基于语法、语义知识库的汉语词义消歧策略_第3页
机器翻译中基于语法、语义知识库的汉语词义消歧策略_第4页
机器翻译中基于语法、语义知识库的汉语词义消歧策略_第5页
资源描述:

《机器翻译中基于语法、语义知识库的汉语词义消歧策略》由会员上传分享,免费在线阅读,更多相关内容在应用文档-天天文库

1、♣机器翻译中基于语法、语义知识库的汉语词义消歧策略王惠北京大学计算语言学研究所,北京,100871摘要:词义消歧研究在自然语言处理的许多应用领域中具有重要的理论和实践意义,在机器翻译中更是如此,它直接关系到译文质量的提高。但目前已有的词义消歧系统基本上都面临着消歧知识获取的瓶颈问题。本文认为,要真正有效地提高词义知识库的质量,需要在词类划分基础上,增加词义的语法功能分析和语义搭配限制,综合利用现有的语法、语义资源,提取多义词的每个意义在不同层级上的各种分布特征。以此为基础,本文提出了一种汉英机器翻译系统中基于语法、语义知识库的汉语词义消歧分析算法。初步的实验结果表明,该

2、方法可以高质量地进行汉语名词、动词、形容词的词义消歧。关键词:词义消歧(WSD)汉英机器翻译语法词典语义词典AStudyofChineseWordSenseDisambiguationinMTBasedonGrammatical&SemanticKnowledge-basesWang,Hui(InstituteofComputationalLinguistics,PekingUniversity,Beijing100871,China)AbstractWordsensedisambiguation(WSD)playsanimportantroleinMachineTra

3、nslationandmanyotherareasofnaturallanguageprocessing.TheresearchonWSDhasgreattheoreticalandpracticalsignificance.ThemainworkinthispaperistostudywhatkindofknowledgeisusefulforWSDinsystem,andestablishamulti-levelWSDmodelbasedonsyntagmaticfeaturesandsemanticinformation,whichcanbeusedtodisam

4、biguatewordsenseinMandarinChineseeffectively.ThemodelmakesfulluseoftheGrammaticalKnowledge-baseofContemporaryChineseasoneofitsmainmachine-readabledictionary(MRD),whichcanproviderichgrammaticalinformationfordisambiguationsuchasChineselexicon,parts-of-speech(POS)andsyntaxfunction.Anotherre

5、sourceofthemodelistheSemanticDictionaryofContemporaryChinese,whichprovidesathesaurusandsemanticcollocationinformationof68,000Chinesewords.TheresultsofthisstudyindicatethatthetwoMRDresourcesareeffectiveforwordsensedisambiguationinMTandarelikelytobeimportantforgeneralChineseNLP.Keywords:Wo

6、rdSenseDisambiguation,Chinese-EnglishMachineTranslation,GrammaticalKnowledge,SemanticDictionary♣本项研究得到国家973项目“面向新闻领域的汉英机器翻译系统”(项目号:G1998030507-4)的支持。11.引言由于自然语言中一词多义现象普遍存在,在机器翻译中,要让计算机进行准确的译文选择(translationchoice),一个重要的前提条件就是能够在某个特定上下文中,自动排除歧义,确定多义词的词义。因此,词义消歧(Wordsensedisambiguation,WSD)

7、从50年代初期开[1,2]始机器翻译研究起就一直备受计算语言学家的关注。早期人们所使用的词义消歧知识一般是凭人手工编制的规则。由于手工编写规则费时费力,存在严重的知识获取的“瓶颈”问题。20世纪80年代以后,语言学家提供的各类词典成为人们获取词义消歧知识的一个重要知识源。Lesk、Luk根据《OxfordAdvancedLearner’s[3,4]Dictionary》中的释义文本来判断多义词在上下文中的词义。Dagan和Gale利用双语对照[5,6]词典来帮助多义词消歧。Voorhees、Resnik从不同角度利用WordNet中的上下

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。