最大熵模型和条件随即场在自然语言处理中的应用(计算机科学与技术本科毕业论文)

最大熵模型和条件随即场在自然语言处理中的应用(计算机科学与技术本科毕业论文)

ID:25693882

大小:2.09 MB

页数:43页

时间:2018-11-22

最大熵模型和条件随即场在自然语言处理中的应用(计算机科学与技术本科毕业论文)_第1页
最大熵模型和条件随即场在自然语言处理中的应用(计算机科学与技术本科毕业论文)_第2页
最大熵模型和条件随即场在自然语言处理中的应用(计算机科学与技术本科毕业论文)_第3页
最大熵模型和条件随即场在自然语言处理中的应用(计算机科学与技术本科毕业论文)_第4页
最大熵模型和条件随即场在自然语言处理中的应用(计算机科学与技术本科毕业论文)_第5页
资源描述:

《最大熵模型和条件随即场在自然语言处理中的应用(计算机科学与技术本科毕业论文)》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、复旦大学学士毕业论文题目:最大熵模型和条件随机场在自然语言处理中的应用系别:计算机科学与技术系专业:计算机科学与技术姓名:徐智婷指导教师:张玥杰2008年5月31日中文摘要中文自然语言处理中有最基本的三个问题:分词、命名体识别和词性标注。中文不同于英文,因为中文词间没有空格,于是中文自然处理比英文困难得多。本文讨论了最大熵模型和条件随机场在中文自然语言处理中的应用。针对每个模型,本文首先介绍数学背景以及模型的推导,然后介绍实现中的相应细节,最后介绍如何将模型应用在中文自然语言处理中。针对命名体识别

2、,本文详细介绍了如何基于领域知识抽取特征,并且介绍了全局特征的应用。本文使用《人民日报》和SIGHANbakeoff4两个语料集进行实验。实验结果表明条件随机场无论从查全率和查准率都较最大熵模型更好,并且领域知识能平滑模型,并在一定程度上缓解过拟合问题。关键词:最大熵模型,条件随机场,局部特征,全局特征,分词,命名体识别,词性标注IABSTRACTTherearethreebasicproblemsinChineseNaturalLanguageProcessing:Seg-mentation,N

3、amedEntityRecognitionandPart-Of-SpeechTagging.ChinesediffersalotfromEnglishasthereisnoblankbetweenChinesewords,andthusitismuchhardertohandlewithChinese.ThispaperdiscussesMaximumEntropyModelandConditionalRandomFieldsforChineseNaturalLanguageProcessing.

4、Foreachmodel,wefirstintroducemathe-maticalideasandinductions.Then,weintroducedetailsofimplementation,andfinally,weintroducefeaturesweusedfortheproblems.Thispaperintroduceshowtoextractfeaturesfromdomainknowledge,andtheusageofglobalfeatures.Thispaper’se

5、xperimentsbasedonPeople’sdailyandSIGHANbakeoff4.TheresultsshowthatConditionalRandomFieldsperformbetterthanMaximumEntropyModelonbothprecisionandrecall.Besides,domainknowledgecanhelptosmooththemodel,andhelptoovercometheproblemofoverfitting.Keywords:Maxi

6、mumEntropyModel,ConditionalRandomFields,LocalFeatures,GlobalFeatures,Segmentation,NamedEntityRecognition,Part-Of-SpeechTaggingIII目录第1章绪论.........................................................................................11.1本文研究的背景和意义............

7、..........................................................11.2国内外研究历史现状及其分析.............................................................11.3本文研究工作概述...........................................................................21.4本文的组织结构.................

8、.............................................................2第2章最大熵模型.................................................................................32.1最大熵模型概述..............................................................................32.

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。