欢迎来到天天文库
浏览记录
ID:25693882
大小:2.09 MB
页数:43页
时间:2018-11-22
《最大熵模型和条件随即场在自然语言处理中的应用(计算机科学与技术本科毕业论文)》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库。
1、复旦大学学士毕业论文题目:最大熵模型和条件随机场在自然语言处理中的应用系别:计算机科学与技术系专业:计算机科学与技术姓名:徐智婷指导教师:张玥杰2008年5月31日中文摘要中文自然语言处理中有最基本的三个问题:分词、命名体识别和词性标注。中文不同于英文,因为中文词间没有空格,于是中文自然处理比英文困难得多。本文讨论了最大熵模型和条件随机场在中文自然语言处理中的应用。针对每个模型,本文首先介绍数学背景以及模型的推导,然后介绍实现中的相应细节,最后介绍如何将模型应用在中文自然语言处理中。针对命名体识别
2、,本文详细介绍了如何基于领域知识抽取特征,并且介绍了全局特征的应用。本文使用《人民日报》和SIGHANbakeoff4两个语料集进行实验。实验结果表明条件随机场无论从查全率和查准率都较最大熵模型更好,并且领域知识能平滑模型,并在一定程度上缓解过拟合问题。关键词:最大熵模型,条件随机场,局部特征,全局特征,分词,命名体识别,词性标注IABSTRACTTherearethreebasicproblemsinChineseNaturalLanguageProcessing:Seg-mentation,N
3、amedEntityRecognitionandPart-Of-SpeechTagging.ChinesediffersalotfromEnglishasthereisnoblankbetweenChinesewords,andthusitismuchhardertohandlewithChinese.ThispaperdiscussesMaximumEntropyModelandConditionalRandomFieldsforChineseNaturalLanguageProcessing.
4、Foreachmodel,wefirstintroducemathe-maticalideasandinductions.Then,weintroducedetailsofimplementation,andfinally,weintroducefeaturesweusedfortheproblems.Thispaperintroduceshowtoextractfeaturesfromdomainknowledge,andtheusageofglobalfeatures.Thispaper’se
5、xperimentsbasedonPeople’sdailyandSIGHANbakeoff4.TheresultsshowthatConditionalRandomFieldsperformbetterthanMaximumEntropyModelonbothprecisionandrecall.Besides,domainknowledgecanhelptosmooththemodel,andhelptoovercometheproblemofoverfitting.Keywords:Maxi
6、mumEntropyModel,ConditionalRandomFields,LocalFeatures,GlobalFeatures,Segmentation,NamedEntityRecognition,Part-Of-SpeechTaggingIII目录第1章绪论.........................................................................................11.1本文研究的背景和意义............
7、..........................................................11.2国内外研究历史现状及其分析.............................................................11.3本文研究工作概述...........................................................................21.4本文的组织结构.................
8、.............................................................2第2章最大熵模型.................................................................................32.1最大熵模型概述..............................................................................32.
此文档下载收益归作者所有