欢迎来到天天文库
浏览记录
ID:36603307
大小:7.49 MB
页数:65页
时间:2019-05-12
《基于多层CRFs的汉语介词短语识别研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、硕士学位论文基于多层CRFs的汉语介词短语识别研究ResearchonChinesePrepositionalPhraseIdentificationBasedonMulti-·layerConditionalRandomFields学号:21017001完成日期:2013—05—27大连理工大学DalianUniversityofTechnologylIIIIIIIIlUlMIIIIIIIIl—Y2417320大连理工大学学位论文独创性声明作者郑重声明:所呈交的学位论文,是本人在导师的指导下进行研究工作所
2、取得的成果。尽我所知,除文中已经注明引用内容和致谢的地方外,本论文不包含其他个人或集体已经发表的研究成果,也不包含其他已申请学位或其他用途使用过的成果。与我一同工作的同志对本研究所做的贡献均已在论文中做了明确的说明并表示了谢意。若有不实之处,本人愿意承担相关法律责任。学位论文题目:基±垒昱受堡&鱼这语企词筮篮趔盈壑作者签名:雏态日期:2Ql主年上_L月丑日大连理工大学硕士学位论文摘要介词短语是汉语中一种重要的短语类型,在汉语中占有较大的比例。介词短语的正确识别可以简化句子结构;缩小中心动词的选择范围;降低句
3、法分析的难度。基于介词短语识别的重要性,本文提出了基于条件随机场(ConditionalRandomFields,CI讧s)的汉语介词短语识别方法,并采用基于转换的错误驱动学习方法对结果进行校正,较好地完成了介词短语识别任务。本文将介词短语识别问题转化为序列标注问题,基于CRFs模型在序列标注上的优点,选用CRFs模型作为标注模型,通过分析介词短语的结构特征,为CRFs模型选取了6个有效的特征,并采用递增式的学习方法选择特征模板,优化了模型的性能;针对句子中含有多个介词短语识别效果不理想的现状,提出了多层识
4、别的方法,分层识别每一个介词短语,将识别出的介词短语用特殊的符号替换,进而简化句子结构,缩短句子的长度;本文为了进一步提高介词短语识别的效果,采用基于转换的错误驱动学习方法对基于CRFs模型的识别结果进行校正。论文对基于单层CRFs模型、基于多层CRFs模型及加入错误驱动学习方法分别进行实验。实验证明,本文采用的多层CRFs模型的介词短语识别方法是有效的。通过对人民日报2000年语料中的7000多个介词短语进行五倍交叉实验,精确率、召回率、F1值分别为91.45%、91.39%和91.42%。在引入基于转换
5、的错误驱动的学习方法对识别结果进行校正后,精确率、召回率、F1值分别达到91。98%、91.92%和91.96%,进一步提高了识别的效果。本文对介词短语识别的研究取得了较好的成果,可以将该成果应用到句法分析、机器翻译等领域。关键词:介词短语识别;条件随机场模型;多层方法;基于转换的错误驱动学习基于多层CRFs的汉语介词短语识别研究ResearchonChinesePrepositionalPhraseIdentificationBasedonMulti-·layerConditionalRandomFiel
6、dsAbstractPrepositionalphrases,asaclassofimportantphrases,accountforaratherlargeproportioninChinese.Therefore,prepositionalphraseidentificationhassignificantmeaningwhichsimplifiesthes缸uctureofsentence.reducesthenumberofcandidatemainverbsandmakestheparsinge
7、asily.Inthispaper,wepresentasystemofprepositionalphraseidentificationbasedonConditionalRandomFields(CRFs).Moreover,atransformation-basederror-drivenlearningapproachisadoptedtorevisetheprepositionalphraseidentificationresultsofCI心smodel.Thispapercovertsthet
8、askofprepositionalphraseidentificationintosequencelabeling.andadoptCRFsmodelasouridentificationmodel.Throughanalyzingthestructuralcharacteristicofprepositionalphrases,sixfeaturesareextractedasourfeaturesetand
此文档下载收益归作者所有