基于双语的中文零指代研究

基于双语的中文零指代研究

ID:35062495

大小:3.92 MB

页数:64页

时间:2019-03-17

基于双语的中文零指代研究_第1页
基于双语的中文零指代研究_第2页
基于双语的中文零指代研究_第3页
基于双语的中文零指代研究_第4页
基于双语的中文零指代研究_第5页
资源描述:

《基于双语的中文零指代研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、■学校代码;1〇28514学号:201342270?M1牡考SOOCHOWUNIVERSITY.非1留醒H凶没飄钱藝留基于双语的中文零指代研究 ̄""=R园础。化?。曲.onBilingualApproach研究生姓名黄学华指导教师姓名周国栋专业名称计龍科学与技术研究方向中文信息与自然语言处理 ̄ ̄ ̄■ ̄"‘rSSI护;心桿、;;巧在院部计算机科学与技术学院B论文提交日期20W年5月苏州大学学位论文独创性声明本人郑重声明:所提交的学位论文是本人在导师的指导下

2、,独立进行研究工作所取得的成果。除文中已经法明引用的内容外,本论文不含其他个人或集体已经发表或撰写过的研巧成果,也不含为获得苏州大学或其它教育机构的学位证书而使用过的材料。对本文的研究作出重要贡献的个人和集体,均已在文中W明确方式标明。本人承担本。声明的法律责任. ̄荐论文作者签名:^平B期:ipils'i!苏州大学学位论文使用授权声明本人完全了解苏州大学关于收集、保存和使用学位论文的规定,邑。P:学位论文著作权归属苏州大学本学位论文电子文档的内容和纸一致质论文的内容相。苏州大学有权向国家图书馆、中国社科院文献信息情报中也、

3、中国科学技术信息研究所(含万方数据电子出版社)、中国学术期刊(光避版)电子杂志化送交本学位论文的复印件和电子文档,允许论文被查阅和借阅,可W采用影印、缩印或其他复制手段据保存和汇编学位论文,可1^^1将学位论文的全部或部分内容编入有关数库进行检索。本涉密论文口学位论文属在年_月解密后适用本规定。非涉密论文ty^论文作者签名:某、T曰期:弓‘1飞.^导师.签名;外曰期;如媒巧氏I基于双语的中文零指代研究摘要随着互联网与计算机技术的飞速发展,全球各国都在进入一个高速发展的信息化阶段。海量的信息在给人类的生活提供便利的同时

4、,也带来了信息灾难。尤其是最近几年移动互联网与智能手机等高科技的火爆,信息数据更是呈现爆炸式的指数增长,在信息的海洋里如何获得用户所需要的内容成为一个热点。在这些海量信息中存在着很多的省略,这些省略常常指向前文中的某些实体。中文零指代研究旨在对汉语中省略的句法成分进行识别并恢复。因为零指代项没有词法、性别、单复数等表面信息,所以中文零指代研究比传统的中文指代消解研究有着更大的挑战。本文紧紧地围绕中文零指代研究展开,分别做了以下的探索与研究。首先,使用机器学习方法构建了一个基于最大熵的中文零指代项识别系统,为了尽最大的可能来提升中文零指代项的识别性能,我们在此系统上探索

5、了中文零指代项上下文的词法、中文零指代项的句法等多种平面和结构化的特征。紧接着,本文同样使用机器学习方法搭建一个基于SVM(支持向量机)的中文零指代项消解系统。在此系统上探索了中文零指代项、候选先行词以及两者的联合特征,来提升最终的零指代项消解性能。然后将中文零指代项识别系统与中文零指代项消解系统进行整合,构建一个有着完整统一框架的中文零指代研究系统。最后本文提出了一个基于双语的方法来提升中文零指代研究的性能。完整的中文零指代研究系统包括:中文零指代项识别系统与中文零指代项消解系统。我们在中文零指代研究系统上进一步的探索研究,并探索融入英文的作用,在基于双语的基础上进

6、行中文零指代消解性能的提升。实验结果表明,与单语相比较,本文基于双语的方法在实验中取得了更好的实验效果。关键词:中文零指代;零指代项;识别;消解;双语作者:黄学华指导老师:周国栋孔芳IResearchofChineseZeroPronounBasedonBilingualApproachAbstractWiththerapiddevelopmentofInternetandcomputertechnology,countriesaroundtheworldaresteppingintoanewstageofinformation.Whilevastamountsofi

7、nformationisfacilitatinghumanlife,italsobringsdisasterofinformation.Especiallyinrecentyears,withmobileInternet,smartphonesandotherhightechnologydeveloping,themessagedataisshowingexplosiveexponentialgrowth.Howtoobtainwhathumanneedfromtheoceanofinformationisbecomingahottopic.Ther

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。