基于web内容的中文文本信息过滤的研究与实现

基于web内容的中文文本信息过滤的研究与实现

ID:35059059

大小:7.18 MB

页数:66页

时间:2019-03-17

基于web内容的中文文本信息过滤的研究与实现_第1页
基于web内容的中文文本信息过滤的研究与实现_第2页
基于web内容的中文文本信息过滤的研究与实现_第3页
基于web内容的中文文本信息过滤的研究与实现_第4页
基于web内容的中文文本信息过滤的研究与实现_第5页
资源描述:

《基于web内容的中文文本信息过滤的研究与实现》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、—--■?—';—.,-j>甘-,1子;六占iv!子^_y—''‘;:学校代码—:10004国密级:公开^3胆謂胃mBEIJINGJIAOTONGUNIVERSITY硕女专业学位论文1基于Web内容的中文文本信息过滤的j研究与实现—作者姓名杨立涛工程领域计算机技术—六,or謂㈱ig:賴!^諭^1驅《纖自麵谓^g如交道乂讓硕±专业学位论文基于Web内容的中文文本信息过滤的研究与实现The民esearchandImlementationof化6Chine

2、seTextInformationpFiheringBasedonWebCon1;ent作者:杨立涛导师;王移芝北京交通大学2016年6月学位论文版权使用授权书本学位论文作者完全了解北京交通大学有关保留、使用学位论文的规定。特授权北京交通大学可W将学位论文的全部或部分内容编入有关数据库进行检索,提供阅览服务,并采用影印、缩印或扫描等复制手段保存、汇编W供查阅和借阅。同意学校向国家有关部口或机构送交论文的复印件和磁盘。学校可W为存在馆际合作关系的兄弟高校用户提供文献传递服务和交换服务。(保

3、密的学位论文在解密后适用本授权说明)学位论文作者签名;导师签名:V签字日期:>/(年月^日签字日期:如冷年月y日^10学校代码:004密级:公开北京交通大学硕±专业学位论文基于Web内容的中文文本信息过滤的研究与实现TheResearchandImlementationoftheChineseTextInformationpF化eringBasedonWebCon化nt作者姓名:杨立涛学号:14125209导师姓名:王移芝职称;教授工程硕±专业领域:计算机技术

4、学位级别:硕±北京交通大学2016年6月致谢光阴似箭,岁月如歌。研究生的生活即将结束,回想起这两年的生活,是那样的快乐与美好。两年的学习生活教会了我许多做人做事的道理,也使我各方面的能力得到了提升,这些收获和进步都离不开老师的耐也教导和同学们的无私帮、、,。因此,在论文完成之际助更离不开家人的关屯和支持,对他们表示最衷屯的感谢和祝福。首先。本论文从选题到完成都是在王老师,要特别感谢我的导师王移芝教授一、的悉屯指导下完成的,每步都倾注了王老师的大量必血。正是她的悉也指导为一一直坚持不放弃。她严谨的治学态

5、我指明了前进的方向,是她每次的鼓励让我,度,高都将是我今后学习生活中的榜样。,坦荡的胸襟尚的人格一其次,他,更重要的是,感谢每位授课老师们不仅无私的传授给我们知识。他们严谨的治学态度和高尚的人格品德教会了我们更多为人处事的道理在此,对每一位平凡却伟大的老师表示深深的敬意巧美好的祝福。同时,,他,感谢实验室的同学和朋友在本论文的完成过程中们提供了很多建议和帮助一。感谢研究生期间的每位同学,是他们让我的研究生生活别样丰富多彩。在即将毕业之际,祝福他们将来的路越走越宽。一感谢我的家人直W来对我的默默支持一次跌倒时给我再次

6、,是他们在我每一奋斗的力量、,在我每次失意时给我最温暖的安慰和关怀。他们是我不断奋斗不断前进的强大动力。、最后,,衷屯感谢在百忙之中评阅此稿的专家和老师感谢你们对本文提出的宝贵意见和建议。北京交通大学硕±专业学位论文摘要摘要,互联网上的信息资源呈指数级増长随着网络技术和信息技术的飞速发展。丰富的信息资源在给用户查询信息、利用信息带来方便的同时,也给用户带来了像信息迷向、正确信息获取率低、垃圾信息泛滥等诸多问题。如何从海量的信息,成为目前亟待解决的问题资源中及时、准确地获取用户需要的信息。W一定的方法从大

7、规模的eb文本信息过滤,是指根据用户的信息需求,利用动态信息流中筛选出用户感兴趣的文本信息,同时屏蔽掉无用信息的过程eb。W、中文文本的信息过滤涉及的技术主要有:Html页面文本内容的提取中文分词、特征项提取与权重计算、、文本表示模型用户兴趣模板的构建W及文本过滤算法等一eb。在对Web文本信息过滤进行研究的基础上,本文实现了个W文本信息过滤系统模型,并通过实验证明了该系统模型在过滤性能上的提升。本文主要的工作有下几点:一(1)设计与实现了种多层次的Web文本信息过滤系统模型。该系统模型的过滤方法模仿人在阅读报纸时

8、对信息的过滤过程。多层次过滤方法的原理是:在eb文本,对W进行过滤时,先采用关键字匹配的过滤方法对文本标题进行过滤如果通过筛选,

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。