面向主题的搜索引擎的设计与实现网络毕

面向主题的搜索引擎的设计与实现网络毕

ID:24970877

大小:93.00 KB

页数:20页

时间:2018-11-17

面向主题的搜索引擎的设计与实现网络毕_第1页
面向主题的搜索引擎的设计与实现网络毕_第2页
面向主题的搜索引擎的设计与实现网络毕_第3页
面向主题的搜索引擎的设计与实现网络毕_第4页
面向主题的搜索引擎的设计与实现网络毕_第5页
资源描述:

《面向主题的搜索引擎的设计与实现网络毕》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库

1、面向主题的搜索引擎的设计与实现网络毕  关键词:主题 搜索引擎 自动分类 特征值 向量空间模型  论文摘要:由于互联网的飞速发展,普通搜索引擎无法满足人们的需要;早期的搜索引擎把因特网中的资源服务器的地址收集起来,根据其提供的资源类型的不同而分到不同的目录,再一层层地进行分类。人们要找自己想要的信息可按他们的分类一层层进入,就能最后到达目的地,找到自己想要的信息;但是这只适用于因特网信息不多的时候,但是如果信息一旦多起来,查找的时候所花费的时间就会变长;因此,在一个tage、PeterDeutsch、Bill

2、ITMatthepStation、Colorado大学OliverMcBryan的TheentionofMcBryan'setaSearchEngineRoundup)。用户只需提交一次搜索请求,由元搜索引擎负责转换处理后提交给多个预先选定的单独搜索引擎,并将从各单独搜索引擎返回的任何查询结果,集中起来处理后再返回给用户。第一个元搜索引擎,是etacrawler。元搜索引擎概念上好听,但搜索效果始终不理想,所以没有哪个元搜索引擎有过强势地位。  大约在1996年出现的第二代搜索引擎系统大多采用分布式方案(多个

3、微型协同工作)来提高数据规模、响应速度和用户数量,它们一般都保持一个大约50,000,000web文档的索引数据库,每天能够响应10,000,000次用户检索请求。1997年11月,当时最先进的几个搜索引擎号称能建立从2,000,000到100,000,000的web文档索引。  目前,搜索引擎的研究、开发十分活跃,各大搜索引擎公司都在投巨资研制搜索引擎系统,同时也不断地涌现出新的具有鲜明特色的搜索引擎产品,搜索引擎已经成为信息领域的产业之一。它要用到了信息检索、人工智能、数据库、数据挖掘、自然理解等领域的理

4、论和技术,具有综合性和挑战性。又由于搜索引擎有大量的用户,由此衍射出许多商机,具有很好的价值。  根据搜索引擎所用的技术原理,主要可以分为以下三类:  (1)目录式搜索引擎:以人工方式或半自动方式搜集信息,由编辑员查看信息之后,人工形成信息摘要,并将信息置于事先确定的分类框架中。信息大多面向网站,提供目录浏览服务和直接检索服务。该类搜索引擎因为加入了人的智能,所以信息准确、导航质量高,缺点是需要人工介入、维护量大、信息量少、信息更新不及时。典型有:Yahoo(现已采用Robot技术)、LookSmart、Op

5、enDirectory等。  (2)基于Robot搜索引擎:基于Robot的搜索引擎多提供对全文的检索,有时也叫做全文搜索引擎(FullText)。通过Robot程序从互联网上搜集信息而建立索引数据库,检索与用户查询条件匹配的相关记录,然后按一定的排列顺序将结果返回给用户。这类搜索引擎的代表是:Google、Fast/AllTheySQL是现在绝佳的组合。你还可以自己编写外围的函数取间接存取数据库。通过这样的途径当你更换使用的数据库时,可以轻松的更改编码以适应这样的变化。PHPLIB就是最常用的可以提供一般事

6、务需要的一系列基库。  (2)PHP可扩展性就像前面说的那样,PHP已经进入了一个高速发展的时期。对于一个非程序员来说为PHP扩展附加功能可能会比较难,但是对于一个PHP程序员来说并不困难。  (3)面向对象编程  PHP提供了类和对象。基于od_perl,JSP)。PHP就可以以这种方式安装,虽然很少有人愿意这样以CGI方式安装它。内嵌的PHP可以具有更高的可伸缩性。  2.2MYSQL数据库简介  MySQL是最流行的开放源码SQL数据库系统,它是由MySQLAB公司开发、发布并支持的。MySQLAB是由

7、多名MySQL开发人创办的一家商业公司。它是一家第二代开放源码公司,结合了开放源码价值取向、方法和成功的商业模型,它具有很多优点:  )MySQL是一种数据库管理系统。  (2)MySQL是一种关联数据库管理系统。  (3)MySQL软件是一种开放源码软件。  (4)MySQL数据库服务器具有快速、可靠和易于使用的特点。  (5)MySQL服务器工作在客户端/服务器模式下,或嵌入式系统中。  (6)有大量可用的共享MySQL软件。  MYSQL最大表尺寸增加到了65536TB(2567–1字节),因此MySQ

8、L数据库的最大有效表尺寸通常是由操作系统对文件大小的限制决定的,而不是由MySQL内部限制决定的,ySQL服务器采用了多层设计和独立模块。在此列出一些:  (1)Replication(稳定)  大量使用复制功能的服务器均处于生产模式下,结果良好。  (2)InnoDB表(稳定)  自3.23.49版以来,InnoDB事务存储引擎一直很稳定。InnoDB正用于大型、重负荷生产系统。  (3)BDB表

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。