欢迎来到天天文库
浏览记录
ID:35102177
大小:1.81 MB
页数:64页
时间:2019-03-17
《面向机器翻译的藏语功能组块识别研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、面向机器翻译的藏语功能组块识别研究王天航2016年1月中图分类号:TP391.1UDC分类号:004.9面向机器翻译的藏语功能组块识别研究作者姓名王天航学院名称计算机学院指导教师史树敏答辩委员会主席廖乐健申请学位工学硕士学科专业计算机科学与技术学位授予单位北京理工大学论文答辩日期2016年1月AnMT-orientedResearchonRecognitionofTibetanSyntacticFunctionalChunkCandidateName:TianhangWangSchoolorDepartment:ComputerScien
2、ceandTechnologyFacultyMentor:ShuminShiChair,ThesisCommittee:LejianLiaoDegreeApplied:MasterofPhilosophyMajor:ComputerScienceandTechnologyDegreeby:BeijingInstituteofTechnologyTheDateofDefense:January,2016研究成果声明本人郑重声明:所提交的学位论文是我本人在指导教师的指导下进行的研究工作获得的研究成果。尽我所知,文中除特别标注和致谢的地方外,学
3、位论文中不包含其它人已经发表或撰写过的研究成果,也不包含为获得北京理工大学或其它教育机构的学位或证书所使用过的材料。与我一同工作的合作者对此研究工作所做的任何贡献均已在学位论文中作了明确的说明并表示了谢意。特此申明。签名:日期:摘要随着藏语基础研究的不断深入、藏语信息处理取得了很大进展。针对藏语语言进行句法分析、语义理解等更深层次的探索逐渐成为目前的研究热点。特别是藏语句法功能组块的研究对于藏语智能化信息处理具有重要的理论价值与现实意义。一方面,从功能组块角度进行句法分析,避免了因藏语自身不确定性和复杂性而造成的完全句法分析效果差的问题,
4、可以作为深层分析的一条可行途径;另一方面,有效的句法功能组块分析能够提升机器翻译、自动问答等应用系统的性能。本文从藏语本身语言特点出发,面向实际藏汉机器翻译系统,开展藏语句法功能组块的识别研究。主要工作如下:1、依据藏语句法功能组块分类标注体系,从现代藏语语言现实情况出发,将功能组块分析任务细化为功能组块边界识别和功能组块类型标注两部分,并结合藏语自身特点,基于条件随机场模型以音节为单位对功能组块边界进行识别。实验F值达到79.12%。2、鉴于以藏语音节为单位进行功能组块分析数据匮乏的现状,引入了分词和词性标注信息,实验结果表明可以进一步
5、将功能组块边界识别F值提升到86.76%。同时开展了多种常见统计机器模型进行藏语功能组块边界识别的对比实验,验证了不同模型对功能组块边界识别的有效性。3、将错误驱动的学习思想引入到组块边界识别研究之中,分别利用基于转换规则的错误驱动学习方法和基于新特征的条件随机场模型识别功能组块边界。进一步提高了边界识别,F值达到94.58%。并基于上述工作基础,完成了功能组块类型标注任务,整体F值达到83.15%。4、将本文提出的藏语功能块研究方法应用到实际藏汉机器翻译系统中,通过具体翻译实例分析,验证了提出方法的有效性和由此识别出的藏语功能块在提高机
6、器翻译结果中所起到的积极作用。关键词:藏语,句法功能组块,错误驱动策略,机器学习模型,藏汉机器翻译,音节粒度IAbstractWiththegraduallydeepeningofresearchesonTibetanlinguistictheory.DeeplystudysyntacticparsingandthesemanticunderstandingofTibetanhasincreasinglybecometherecenthotspot.Tibetansyntacticchunkparsingplaysanimportantr
7、oleinthefurtherstudyofTibetanlanguageprogressing.Ontheonehand,syntacticfunctionalchunkparsingcanbeusedasaneffectivewaytosolvethecompletesyntacticparsingproblem.Ontheotherhand,syntacticfunctionalparsingcanbedirectlyappliedtoothernaturallanguageprocessingfields,suchasmachin
8、etranslation,automaticquestionanswering,informationretrievalandsoon.Inthispaper,wedothesyntactic
此文档下载收益归作者所有