毕业论文--基于中文分词的搜索引擎的设计与实现

毕业论文--基于中文分词的搜索引擎的设计与实现

ID:35952183

大小:643.00 KB

页数:61页

时间:2019-04-26

毕业论文--基于中文分词的搜索引擎的设计与实现_第1页
毕业论文--基于中文分词的搜索引擎的设计与实现_第2页
毕业论文--基于中文分词的搜索引擎的设计与实现_第3页
毕业论文--基于中文分词的搜索引擎的设计与实现_第4页
毕业论文--基于中文分词的搜索引擎的设计与实现_第5页
资源描述:

《毕业论文--基于中文分词的搜索引擎的设计与实现》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、太原理工大学毕业设计(论文)用纸毕业设计论文题目:基于中文分词的搜索引擎的设计与实现学院:软件学院专业班级:软件1019班姓名:指导老师:太原理工大学毕业设计(论文)用纸太 原 理 工 大 学毕业设计(论文)任务书第1页毕业设计(论文)题目:毕业设计(论文)要求及原始数据(资料):1.综述国内外搜索引擎技术研究现状;2.深入了解搜索引擎的基本原理;3.熟练掌握中文分词算法的原理与应用,训练基于Lucene全文检索引擎工具包编写程序的能力;4.设计并实现基于中文分词的搜索引擎;5.训练检索文献资料和利用文献资料的能力;6.训练撰写技术文档与学

2、位论文的能力。太原理工大学毕业设计(论文)用纸第2页毕业设计(论文)主要内容:1.综述搜索引擎的开发背景以及意义;2.深入了解搜索引擎的基本原理;3.了解中文分词算法的分类、特点,确定合适的中文分词算法。4.熟悉基于Lucene全文检索引擎工具包开发搜索引擎的帮助文档;5.深入分析中文分词算法的原理并编码实现基于中文分词的搜索引擎;6.测试开发的基于中文分词的搜索引擎是否符合需求;7.对搜索引擎的搜索结果进行分析评价。学生应交出的设计文件(论文):1.内容完整、层次清晰、叙述流畅、排版规范的毕业设计论文;2.包括毕业设计论文、源程序等内容在

3、内的毕业设计电子文档及其它相关材料。太原理工大学毕业设计(论文)用纸 第3页主要参考文献(资料):[1]李艳红.校园网内中文搜索引擎的设计与实现[D].西安电子科技大学,2007[2]谢兵.土豆网视频搜索引擎系统的设计与实现[D].上海交通大学,2010[3]刘兴建.中文搜索引擎的应用、分析和比较[J].福建电脑,2010,(11)[4]周君,王艳红.一种基于词典的中文分词法的设计与实现[J].黑龙江科技信息,2008,(25)[5]高磊,徐东平.启发式算法在搜索引擎的应用[J].电脑知识与技术,2007,1(2)[6]卢亮,张博文.搜索引

4、擎原理、实践与应用[M].电子工业出版社,2007,55[7]李颖,李志蜀,邓欢.基于Lucene的中文分词方法设计与实现[J],2008,45(5)[8]梁斌.走进搜索引擎[M].电子工业出版社,2007,191-250[9]彭波.搜索引擎的混合索引技术[J].计算机工程与应用,2004,40(22):18[10]费红晓,康松林,朱小娟,等.基于词频统计的中文分词研究[J].计算机工程与应用,2005,11(7):69[11]王莉云,王华,陈刚,等.基于Lucene的全文检索系统的设计与实现[J].计算机工程与设计,2007,28(24)

5、:60[12]Lucene[EB/OL].2002.http://lucent.apache.org/java/docs/index.html[13]WangQingbo,DaiYafei.NeShot—AnInfrastructureForScalableWide-AreaLocationAndRouting[14]A.CrespoandH.Garcia-Molina.RoutingIndicesforPeer-to-PeerSystems.InICDCS,July2002[15]SylviaRatnasamy,ScottShenker,

6、IonStoica.RoutingAlgorithmsforDHTs:SomeOpenQuestions.InIPTPS’02,January2002[16]CallanJ.P.andM.Connell.Query-basedsamplingoftextdatabases.ACMTransactionsonInformationSystems,19(2):97-130,2001[17]张秋余,张红,马彦宏.基于概念的中文搜索引擎技术[J].计算机科学,2004(21)[18]余海燕,张仲义.太原理工大学毕业设计(论文)用纸基于单汉字索引的全

7、文检索系统的优化研究[J].中文信息学报,2001,15(4):14-20专业班级软件1019班学生要求设计(论文)工作起止日期2014年3月17日~2014年6月27日指导教师签字日期2014年3月17日教研室主任审查签字日期系主任批准签字日期太原理工大学毕业设计(论文)用纸摘要网络中的资源非常丰富,但是如何有效的搜索信息却是一件困难的事情。建立搜索引擎就是解决这个问题的最好方法。本文首先详细介绍了基于英特网的搜索引擎的系统结构,然后从网络机器人、索引引擎、Web服务器三个方面进行详细的说明。为了更加深刻的理解这种技术,我使用Java编程

8、技术实现了一个自己的搜索引擎——基于中文分词的搜索引擎。基于中文分词的搜索引擎是从指定的Web页面中按照超连接进行解析、搜索,并把搜索到的每条新闻进行索引后加入数据库。然后通过W

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。