小议基于突发事件新闻标题的过滤方法研究

小议基于突发事件新闻标题的过滤方法研究

ID:34826892

大小:2.55 MB

页数:53页

时间:2019-03-11

小议基于突发事件新闻标题的过滤方法研究_第1页
小议基于突发事件新闻标题的过滤方法研究_第2页
小议基于突发事件新闻标题的过滤方法研究_第3页
小议基于突发事件新闻标题的过滤方法研究_第4页
小议基于突发事件新闻标题的过滤方法研究_第5页
资源描述:

《小议基于突发事件新闻标题的过滤方法研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、万方数据山西大学2010届硕士学位论文基于突发事件新闻标题的过滤方法研究作者姓名指导教师学科专业研究方向培养单位学习年限许满英张永奎教授计算机软件与理论中文信息处理计算机与信息技术学院2007年9月至2010年6月二。一。年六月万方数据ThesisforMaster’sdegree,ShanxiUniVersity;2010FilteringMethodResearchBasedonEme曙encyNewsHeadlinesStlldentNameMan—yingXuSupeⅣisorPro£Yong—kuiZhangM萄orSpecialtyCompmersoRwar

2、eaIldtheo巧ChilleseiIlfomlationprocessiIlgD印aItmentComputer&Infomation慨llIlologyResearChDm-ation2007.09—20lO.06June,20lO万方数据目录中文摘要⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯IABSTRACT⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.III第一章绪论⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯l1.1论文研究背景⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.11.1.1问题的提出⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯11.1.2信息过滤的研究现状⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯

3、.11.1.3基于标题研究的现状⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.21.2文本信息过滤概述⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯21.2.1文本过滤的概念、特点和分类⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯..21.2.2文本过滤模型⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.31.2.3实现文本过滤的各个阶段⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯31.3论文研究内容和组织结构⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯41.3.1研究内容⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯41.3.2组织结构⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯5第二章突发事件新闻标题特点分析及预处理⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯..72.1新闻标题的功能⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯

4、。.72.2突发事件新闻报道在标题中的体现⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.72.2.1突发事件的定义及特点⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯72.2.2突发事件报道在标题中的体现⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯..82.3新闻标题提取⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.82.4标题分词⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯..92.4.1突发事件新闻语料库中的未登录词⋯⋯⋯⋯⋯⋯⋯⋯⋯.92.4.2未登录词的识别⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.102.5去停用词⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.12第三章基于突发事件新闻标题的文本过滤模型⋯⋯⋯⋯⋯⋯⋯⋯⋯..133.1基于突发事件新闻标题过滤的基

5、本思想⋯⋯⋯⋯⋯⋯⋯⋯⋯..133.2过滤模型整体框架流程⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.133.3用户兴趣类的描述⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯..143.4待过滤标题文本的表示⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.153.4.1兴趣相关度的计算依据⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯..15万方数据3.4.2特征词的兴趣相关度的计算⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.153.5待过滤标题与用户兴趣描述的匹配⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯173.6过滤阈值的调整⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.183.7用户反馈与用户兴趣描述的更新⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯..19第四章类别特征在基于新闻标题过滤中的应用⋯⋯⋯⋯

6、⋯⋯⋯⋯⋯..2l4.1突发事件类别关键字⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯214.1.1类别关键字的定义⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯214.1.2突发事件类别关键字库的建立⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯..2l4.2用类别关键字过滤流程图⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯..224.3过滤过程⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.224.4类别特征在基于新闻标题过滤模型中的应用⋯⋯⋯⋯⋯⋯⋯⋯.234.4.1类别特征库的建立⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯234.4.2加入类别特征的基于标题的过滤流程图⋯⋯⋯⋯⋯⋯⋯..234.4.3待过滤标题特征相关度的计算⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯..244.4

7、.4考虑特征共现相似度的过滤匹配⋯⋯⋯⋯⋯⋯⋯⋯⋯..254.4.5用户反馈和兴趣描述更新⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯..⋯26第五章实验与实验分析⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.275.1实验语料准备⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯275.2文本过滤性能评测⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯..275.3试验结果与分析⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.275.3.1实验安排⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯..275.3.2实验结果与分析⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯..28第六章结束语⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯316.1工作总结⋯⋯⋯

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。