20款开源搜索引擎

20款开源搜索引擎

ID:41393268

大小:57.69 KB

页数:3页

时间:2019-08-24

20款开源搜索引擎_第1页
20款开源搜索引擎_第2页
20款开源搜索引擎_第3页
资源描述:

《20款开源搜索引擎》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库

1、名称语言&平台简介SphiderPHP、mysqlSphider是一个轻量级,采用PHP开发的webspider和搜索引擎,使用mysql来存储数据。可以利用它來为自己的网站添加搜索功能。Sphider非常小,易于安装和修改,已经有数千网站在使用它。RiSearchPHPPHPRiSearchPHP是一个高效,功能强人的搜索引擎,特别适用于中小型网站。RiSearchPHP非常快,它能够在不到1秒钟内搜索5000-10000个页血RiSearch是一个索引搜索引擎,这就意味着它先将你的网站做索引并建立一个数据库來存储你网诂所有页血的关键词以便快速搜索。Risear

2、ch是全文搜索引擎脚本,它把所有的关键词都编成一个文档索引除了配置文件里面的定义排除的关键词。RiSearch使用经典的反向索引算法(与大型的搜索引擎相同),这就是为什么它会比其它搜索引擎快的原因。PhpDigPHPPhpDig是一个采用PHP开发的Web爬虫和搜索引擎。通过对动态和静态页面进行索引建立一个词汇表。当捜索查询吋,它将按一定的排序规则显示包含关键字的搜索结果页面。PhpDig包含一个模板系统并能够索引PDF,Word,Excel,和PowerPoint文档。PHPdig适用于专业化更强、层次更深的个性化搜索引擎,利用它打造针对某一领域的垂直搜索引擎是

3、最好的选择。OpenWebSpiderOpenWebSpider是一个开源多线程WebSpider(robot:机器人,crawler:爬虫)和包含许多冇趣功能的捜索引擎。EgothorJavaEgothor是一个用Java编写的开源而高效的全文本搜索引擎。借助Java的跨平台特性,Egothor能应用于任何环境的应用,既可配迸为单独的搜索引擎,乂能用于你的应用作为全文检索之用。NutchJavaNutch是一个开源Java实现的搜索引擎。它提供了我们运行口己的搜索引擎所需的全部工具。包括全文搜索和Web爬虫。LuceneJavaApacheLucene是一个基于

4、Java全文搜索引擎,利用它可以轻易地为Java软件加入全文搜寻功能。Lucene的最主要工作是替文件的每一个字作索引,索引讣搜寻的效率比传统的逐字比较大大提高,Lucen提供一组解读,过滤,分析文件,编排和使川索引的API,它的强大Z处除了高效和简单外,是最垂要的是使使川者可以随时应自已需耍口订其功能OxyusJava是一个纯java写的web搜索引擎。BDDBotBDDBot是一个简单的易于理解和使用的搜索引擎。它目前在一个文本文件(urls.txt)列出的URL小爬彳丁,将结果保存在一个数据库中。它也支持一个简单的Web服务器,这个服务器接受来自浏览器的查询

5、并返回响应结果。它可以方便地集成到你的Web诂点中。Zilverline乙Iverline是个搜索引擎,它通过web方式搜索木地硬盘或intranet上的内容。Zilverline可以从PDF,Word,Excel,Powerpoint,RTF,txt,java,CHM,zip,rar等文档中抓取它们的内容来建立摘要和索引。从本地硕盘或intranet中查找到的结果可重新再进行检索。Zilverline支持多种语言其屮包括中文。XQEngineJavaXQEngine用于XML文档的全文木搜索引擎。利用XQuery做为它的前端查询语言。它能够让你杳询XML文档集合

6、通过使川关键字的逻辑组合。冇点类似于Google与其它搜索引擎搜索HTML文档一样。XQEngine只是一个用Java开发的很紧凑的对恢入的组件。MG4JMG4J可以让你为人疑的文档集合构建一个被压缩的全文木索引,通过使内插编码(interpolativecoding)技术。JXTASearchJXTASearch是一个分布式的捜索系统。设计用在点对点的网络与网站上。YaCyYaCy基于p2p的分布式Web搜索引擎。同时也是一个Http缓存代理服务器。这个项冃是构建基于p2pWeb索引网络的一个新方法。它可以搜索你自己的或全局的索引,也可以Crawl白己的网页或启

7、动分布式Crawling等。Red-PiranhaRed-Piranha是一个开源搜索系统,它能够真正”学习”你所要查找的是什么。Red-Piranha可作为你桌面系统(Windows,Linux与Mac)的个人搜索引擎,或企业内部网搜索引擎,或为你的网站提供搜索功能,或作为一个P2P搜索引擎,或与wiki结合作为一个知识/文档管理解决方案,或搜索你要的RSS聚合信息,或搜索你公司的系统(包括SAP,Oracle或:其它任何Database/Datasource),或用于管理PDF,Word和其它文档,或作为一个提供搜索信息的WebService或为你的应用程序(

8、Web,S

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。