基于可比较语料库的中英文词表的构建研究

基于可比较语料库的中英文词表的构建研究

ID:6255112

大小:238.00 KB

页数:44页

时间:2018-01-08

基于可比较语料库的中英文词表的构建研究_第1页
基于可比较语料库的中英文词表的构建研究_第2页
基于可比较语料库的中英文词表的构建研究_第3页
基于可比较语料库的中英文词表的构建研究_第4页
基于可比较语料库的中英文词表的构建研究_第5页
资源描述:

《基于可比较语料库的中英文词表的构建研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、膅莅薁袈肁蒄蚃肄羇蒄螆袇基于可比较语料库的中英文词表的构建研究苏州大学学位论文独创性声明本人郑重声明:所提交的学位论文是本人在导师的指导下,独立进行研究工作所取得的成果。除文中已经注明引用的内容外,本论文不含其他个人或集体已经发表或撰写过的研究成果,也不含为获得苏州大学或其它教育机构的学位证书而使用过的材料?对本文的研究作出重要贡献的个人和集体,均已在文中以明确方式标明。本人承担本声明的法律责任。期:二丝竺?论文作者签名:』绉扯日苏州大学学位论文使用授权声明本人完全了解苏州大学关于收集、保存和使用学位论文的规定,

2、即:学位论文著作权归属苏州大学。本学位论文电子文档的内容和纸质论文的内容相一致。苏州大学有权向国家图书馆、中国社科院文献信息情报中心、中国科学技术信息研究所含万方数据电子出版社、中国学术期刊光盘版电子杂志社送交本学位论文的复印件和电子文档,允许论文被查阅和借阅,可以采用影印、缩印或其他复制手段保存和汇编学位论文,可以将学位论文的全部或部分内容编入有关数据库进行检索。涉密论文口本学位论文属在年月解密后适用本规定。非涉密论文口论文作者签名:日期:塑』兰:笸:导师签名:日期:垒堕堑基十可比较语料库的中英文词表构建研究中

3、文摘要基于可比较语料库的中英文词表构建研究中文摘要双语词表作为跨语言信息处理的基本纽带,是自然语言处理领域的重要资源,在统计机器翻译和跨语言信息检索等应用中发挥着重要的作用。本文在深入研究现有从可比较语料库构建双语词表方法的基础上,以中文和英文为例,提出了基于依存关系映射模型的双语词表构建方法,旨在提高其性能。研究内容主要包括:实现了基于依存上下文模型的中英文词表构建系统。参考传统的依存上下文模型,从句子的依存树结构中抽取词语的前驱节点和后继节点词语作为其上下文来实现了本文的基准系统,并考察了窗口大小、关联强度衡

4、量方法和相似度计算方法对双语词表构建性能的影响:提出了基于依存关系映射模型的双语词表构建方法。针对依存上下文模型所存在的缺点,本文提出了基于依存关系映射的中英文词表构建方法,通过同时匹配依存树中的上下文词语、依存关系类型来实现双语词表的构建;研究了依存关系映射的自动获取和优化方法。针对手工制定依存映射规则所存在的局限性,提出了依存映射规则的自动获取方法,并通过分离测试算法过滤依存映射规则,然后再利用感知器学习算法优化映射规则的权值,以期进一步提高双语词表构建的性能和适用性。在中英文词表构建系统的实验表明,本文提出

5、的基于依存映射模型的方法能显著提高中文瑛文和英文一中文两个方向上的词表构建性能,同时,依存映射规则的自动获取和过滤方法能有效梳理出关键的映射规则,再经过感知器算法进行权值优化后,进一步提高了双语词表构建的性能,同时也增强了依存映射模型的适用性。关键词:双语词表构建,依存上下文,依存关系映射,感知器算法作者:徐华指导老师:钱龙华,,,.,,.:.,’,...,,..,,..Ⅱ,..,,.:,,,::目录第章绪论.研究背景和意义?.研究现状?..双语词表构建研究现状?....中英文词表构建研究现状。.本文的研究内容?

6、.本文的组织结构?.第章相关知识介绍.语料库介绍..语料库介绍及其预处理?。..训练集与测试集?..依存句法分析介绍??....依存语法概述..依存句法分析??....依存分析工具.实验评价标准?...相关支撑技术及软件介绍??....词性标注?....自动词形分析..双语语料对齐.本章小结..第章基于依存关系映射的双语词表构建??一.基于上下文模型的方法....上下文模型..依存上下文模型?..本文的基准系统?..依存上下文模型存在的问题??..依存关系映射模型..依存路径转换与依存异质性..依存关系映射..依

7、存关系映射的手工产生...依存关系映射模型的实现.实验结果与分析。..基准系统及其性能..复合系数口对性能的影响..不同依存关系映射对性能的影响..方向特征对性能的影响?.本章小结?第章依存关系映射的自动获取和优化??...自动依存关系映射方法?..自动依存关系映射...依存关系映射的过滤.依存关系映射的权值优化..感知器算法介绍?...感知器算法应用?....基于感知器算法的依存关系映射..实验结果与分析?..自动依存关系映射下的性能??...依存映射过滤后的性能?..感知器算法对词表构建的作用?.本章小结..

8、第章总结与展望??...研究工作总结.下一步工作展望?参考文献?.攻读学位期间公开发表的论文?.攻读学位期间参与的科研项目?.致谢?.“柒于町比较语料库的中英文侧表构建研究第章绪论第章绪论双语词表作为跨语言信息处理任务的基本纽带,是自然语言处理领域的重要资源,在统计机器翻译和跨语占信息检索等跨语言自然语言处理任务中发挥着重要作用,因而双语词表构建成为跨语言自然语言处理的重

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。