基于可比较语料库中英文词表的构建地地研究

基于可比较语料库中英文词表的构建地地研究

ID:32657391

大小:8.59 MB

页数:69页

时间:2019-02-14

基于可比较语料库中英文词表的构建地地研究_第1页
基于可比较语料库中英文词表的构建地地研究_第2页
基于可比较语料库中英文词表的构建地地研究_第3页
基于可比较语料库中英文词表的构建地地研究_第4页
基于可比较语料库中英文词表的构建地地研究_第5页
资源描述:

《基于可比较语料库中英文词表的构建地地研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、苏州大学学位论文使用授权声明本人完全了解苏州大学关于收集、保存和使用学位论文的规定,即:学位论文著作权归属苏州大学。本学位论文电子文档的内容和纸质论文的内容相一致。苏州大学有权向国家图书馆、中国社科院文献信息情报中心、中国科学技术信息研究所(含万方数据电子出版社)、中国学术期刊(光盘版)电子杂志社送交本学位论文的复印件和电子文档,允许论文被查阅和借阅,可以采用影印、缩印或其他复制手段保存和汇编学位论文,可以将学位论文的全部或部分内容编入有关数据库进行检索。涉密论文口本学位论文属在年_月解密后适用本规定。非涉密论文口论文作者签名:导师签名:E

2、l期:塑』兰!笸:jEl期:垄堕丝12基十可比较语料库的中英文词表构建研究中文摘要基于可比较语料库的中英文词表构建研究中文摘要双语词表作为跨语言信息处理的基本纽带,是自然语言处理领域的重要资源,在统计机器翻译和跨语言信息检索等应用中发挥着重要的作用。本文在深入研究现有从可比较语料库构建双语词表方法的基础上,以中文和英文为例,提出了基于依存关系映射模型的双语词表构建方法,旨在提高其性能。研究内容主要包括:1)实现了基于依存上下文模型的中英文词表构建系统。参考传统的依存上下文模型,从句子的依存树结构中抽取词语的前驱节点和后继节点词语作为其上下文

3、来实现了本文的基准系统,并考察了窗口大小、关联强度衡量方法和相似度计算方法对双语词表构建性能的影响:2)提出了基于依存关系映射模型的双语词表构建方法。针对依存上下文模型所存在的缺点,本文提出了基于依存关系映射的中英文词表构建方法,通过同时匹配依存树中的上下文词语、依存关系类型来实现双语词表的构建;3)研究了依存关系映射的自动获取和优化方法。针对手工制定依存映射规则所存在的局限性,提出了依存映射规则的自动获取方法,并通过分离测试算法过滤依存映射规则,然后再利用感知器学习算法优化映射规则的权值,以期进一步提高双语词表构建的性能和适用性。在中英文

4、词表构建系统的实验表明,本文提出的基于依存映射模型的方法能显著提高中文瑛文和英文一中文两个方向上的词表构建性能,同时,依存映射规则的自动获取和过滤方法能有效梳理出关键的映射规则,再经过感知器算法进行权值优化后,进一步提高了双语词表构建的性能,同时也增强了依存映射模型的适用性。关键词:双语词表构建,依存上下文,依存关系映射,感知器算法作者:徐华指导老师:钱龙华AbstractResearchonBilingualLexiconConstructionbetweenChineseandEnglishfromComparableCorporaRe

5、searchonBilingualLexiconConstructionbetweenChineseandEnglishfromComparableCorporaBilinguallexicons,asfundamentallinkageforcross-languageinformationprocessing,areimportantresourcesinnaturallanguageprocessing,andplayanimportantroleinmanyapplications,suchasmachinetranslationa

6、ndcross-languageinformationretrievaletc.Afterin-depthstudyofexistingbilinguallexiconconstructionmethods,thispaperproposesadependencyrelationshipmappingmodeltoimprovebilinguallexiconconstruction(BLC)betweenChineseandEnglishfromcomparablecorpora.Thecontributionsliein:1)Imple

7、mentingabaselineBLCsystembasedonadependencycontextmodel.Followingatraditionaldependencycontextmodel,thispaperextractsthewordsinthedependencytreewithinafixedwindowsizetoformthewords’contextsandtherebyconstructslexiconsbetweenChineseandEnglish.Theeffectofwindowsize,associati

8、onstrengthmetricsandsimilaritycalculationmethodsarealsocompared.2)Proposingadependencyrel

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。