站内全文搜索引擎的设计与实现

站内全文搜索引擎的设计与实现

ID:30048332

大小:226.50 KB

页数:20页

时间:2018-12-26

站内全文搜索引擎的设计与实现_第1页
站内全文搜索引擎的设计与实现_第2页
站内全文搜索引擎的设计与实现_第3页
站内全文搜索引擎的设计与实现_第4页
站内全文搜索引擎的设计与实现_第5页
资源描述:

《站内全文搜索引擎的设计与实现》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、毕业论文(设计)论文(设计)题目:站内全文搜索引擎的设计与实现目录摘要1ABSTRACT2第1章绪论31.1课题的研究背景与意义31.2研究现状41.3本文的工作4第2章站内搜索引擎相关技术介绍62.1全文检索技术62.2.NET相关技术72.2.1.NET平台72.2.2VisualStudio2012开发平台72.3Lucene.NET介绍8第3章站内搜索引擎的设计与实现93.1站内搜索引擎功能需求93.2站内搜索引擎总体设计及数据库设计10第4章站内搜索引擎关键代码实现114.1主界面11第5章总结与展望14

2、参考文献15摘要淘宝的出现,电子商务井喷式的发展,以及越来越多的社交网站、团购网站、专门类信息网站的出现,海量的数据蕴含在网站之内。巨大的信息量无疑是把双刃剑,在给用户提供丰富信息的同时,也给用户提了一个大大的难题,如何在这海量信息中找到用户想得到的信息,尤其是当用户提供的是一组信息不是十分明确的词组时,如何能讲有用的信息条理清晰地提供给用户,这进一步刺激了站内搜索技术的发展。本文在总结站内搜索功能的同时,在研究了站内搜索相关技术的基础上,设计并实现了一个简易的站内搜索引擎,实现了在内搜索的主要功能。关键词:站内搜

3、索;.NET;Lucene.NET17ABSTRACTTheTaobaoemergenceofe-commercedevelopmentspurt,aswellasagrowingnumberofsocialnetworkingsites,groupbuyingsites,theemergenceofspecializedclassinformationwebsitecontainsvastamountsofdatawithinthewebsite.Ahugeamountofinformationisundoubt

4、edlydouble-edgedsword,givingusersawealthofinformation,butalsotoprovidetheuserabigproblem,howtofindauserwantsinformationinthismassofinformation,especiallywhentheuserisofferedawheninformationisnotveryclearsetofphrases,howcanspeakclarityofusefulinformationavailab

5、letousers,whichfurtherstimulatedthedevelopmentofthestationsearchtechnology.Thispapersummarizesthestationsearchfunctionatthesametime,inthestudyofthestationsearchrelatedtechnologies,basedonthedesignandimplementationofasimplesitesearchengine,includingtherealizati

6、onofthemainfunctionsofthesearch.Keywords:SiteSearch;.NET;Lucene.NET17第1章绪论自从有了计算机以后,人类开始用计算机保存信息,有保存就需要查找,于是出现了检索技术。文本检索技术的发展从最初的SMART文档检索系统到AltaVista搜索引擎,到现在的搜索巨头Google,人们习惯在互联网上搜索需要的信息[1]。同时在同一个网站内往往拥有大量的资源,怎样在网站内部使用户能够迅速的找到所需信息,已成为一个网站能够吸引用户的重要方面。随着信息地快速增长,

7、这一方面的需求越来越大,在很大程度上严重影响到Web站点的成功[2]。因此,建立站内搜索引擎成为必要。所谓站内搜索无非就是对数据库信息的检索,当然,数据库通过SQL查询也在一定程度上提供了这样的功能。但是,数据库所提供的Like’%key-word%’查询,不但效率不高,尤其是在多字段查询时,而且所提供的仅仅是关键字的全信息匹配,所查询到的内容必须是“key-word”的顺序匹配,这对于大多数网站,尤其是大型网站来说,基于数据库查询的站内搜索往往出现检索数据不准确、更新慢、无法控制检索等问题[3]。那么,如何来解决

8、这个问题呢?搜索引擎的出现给了人们带来了一线希望。诸如Google、Baidu等全文搜索引擎能够提供一种基于全文信息的搜索方式,并且能够在所提供的一个或一组词中分离出具有一定含义的词,并以这些词为关键字搜索并得到包含这些关键字的信息[4]。然而,我们无法做到在自己的网站中做出一个如Baidu、Google那样的搜索引擎。但是,Lucene的出现,使这种实现成

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。