互联网搜索引擎及其发展趋势

互联网搜索引擎及其发展趋势

ID:46320510

大小:89.50 KB

页数:9页

时间:2019-11-22

互联网搜索引擎及其发展趋势_第1页
互联网搜索引擎及其发展趋势_第2页
互联网搜索引擎及其发展趋势_第3页
互联网搜索引擎及其发展趋势_第4页
互联网搜索引擎及其发展趋势_第5页
资源描述:

《互联网搜索引擎及其发展趋势》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库

1、互联网搜索引擎及其发展趋势互联网搜索引擎技术及具发展趋势【摘耍】木文肖先介绍了互联网搜索引擎的技术原理及具发展状况,分析了现有的网络支付系统基木构成及功能特点,并対传统的网络信息安全技术体系进行了研究探讨。【关键字】搜索引擎检索趙势随着互联网上资源的日趋丰富,面对拥有海量信息的Internet坏境,为了能快速、高效地寻找到冇用信息,搜索引擎应运而牛。经过几年的发展和摸索,越來越贴近人们的需求,搜索引擎的技术也得到了很大的发展,如今搜索引擎已经是互联网应用中不可缺少的一部分。在浩如烟海的Internet±,特别是其上的Web(Wo

2、rldWideWeb万维网)上,不会搜索,就不会上网。二、搜索引擎的概论(一)搜索引擎的定义搜索引擎是指根据一定的策略、运用特定的计算机程序搜集互联网上的信息,在对信息进行组织和处理后,并将处理后的信息显示给用户,是为用户提供检索服务的系统。(二)搜索引擎的组成搜索引擎由搜索器、索引器、检索器和川户接口组成。搜索器的其功能是在互联网中漫游,发现和搜集信息。索引器的功能是理解搜索器所搜索到的信息,从中抽取出索引项,川于表示文档以及生成文档库的索引表。检索器的功能是根据用户的查询在索引库中快速检索文档,进行1相关度评价,对将要输出的

3、结果排序,并能按用户的查询需求合理反馈信息。用户接口的作用是接纳用户查询、显示杳询结果、提供个性化查询项。三、搜索引擎的分类(一)全文索引全文搜索引擎引擎是名副其实的搜索引擎,国外代表有Google,国内则有著名的百度搜索。它们从互联网提取各个网站的信息(以网页文字为主),建立起数据库,并能检索与用户杳询条件相匹配的记录,按一定的排列顺序返冋结果。根据搜索结果來源的不同,全文搜索引擎可分为两类,一类拥有自己的网页抓取、索引、检索系统,有独立的“蜘蛛”程序、或爬山、或“机器人”程序(这三种称法意义相同),能自建网页数据库,搜索结果

4、直接从自身的数据库中调用,上面提到的Google和百度就属于此类;另一类则是租用其他搜索引擎的数据库,并按口定的格式排列搜索结果,如Lycos搜索引擎。(二)目录索引L!录索引虽然有搜索功能,但严格意义上不能称为真正的搜索引擎,只是按LI录分类的网站链接列表而已。用户完全可以按照分类目录找到所需要的信息,不依靠关键字进行查询。LI录索引屮最具代表性的莫过于大名鼎鼎的Yahoo>新浪分类目录搜索。(三)元搜索引擎这类搜索引擎一般都没有自己网络机器人及数据库,它们的搜索结果是通过调用、控制和优化其它多个独立搜索引擎的搜索结果并以统一

5、的格式在同一界而集中显示。元搜索引擎虽没有“网络机器人”2或“网络蜘蛛”,也无独立的索引数据库,但在检索请求捉交、检索接口代理和检索结果显示等方而,均有自己研发的特色元搜索技术。比如“MetaFisher元搜索引擎”。它就调用和整合了Google、Yahoo、AlltheWeb.百度和OpenFind等多家搜索引擎的数据。(四)垂直搜索引擎垂直搜索是针对某一•个行业的专业搜索引擎,是搜索引擎的细分和延伸,是对网页库屮的某类专门的信息进行一次整介,定向分字段抽取出需要的数据进行处理后再以某种形式返回给用户。垂直搜索引擎和普通的网页

6、搜索引擎的最大区别是对网页信息进行了结构化信息抽取,也就是将网页的非结构化数据抽取成特足的结构化信息数据,好比网贝搜索是以网页为最小单位,基于视觉的网页块分析是以网页块为最小单位,而垂巴搜索是以结构化数据为最小单位。然后将这些数据存储到数据库,进行进一步的加工处理,如:去重、分类等,最后分词、索引再以搜索的方式满足用户的需求。整个过程中,数据由非结构化数据抽取成结构化数据,经过深度加工处理后以非结构化的方式和结构化的方式返回给用户。垂直搜索引擎的应用方向很多,比如企业库搜索、供求信息搜索引繁、购物搜索、房产搜索、人才搜索、地图搜

7、索、mp3搜索、图片搜索…几乎各行各业各类信息都可以进一步细化成各类的垂眉••搜索引擎。举个例子來说明会更容易理解,比如购物搜索引擎,整体流程大致如下:抓取网页后,对网页商品信息进行抽取,抽取出商品名称、价格、简介……甚至可以进一步将笔记本简介细分成“品牌、型号、CPU、内存、硬盘、显示屏、……”然后对信息进行清洗、去重、分类、分析比较、数据挖掘,最后通过分词索引提供用户搜索、通过分析挖掘提供市场行情报告。垂肓搜索引擎是相对通川搜索引擎的信息量人、查询不准确、深3度不够等提出來的新的搜索引擎服务模式,通过针对某一特定领域、某一特

8、定人群或某一特定需求提供的有一定价值的信息和相关服务。其特点就是“专、精、深”,口•具有行业色彩,相比较通用搜索引擎的海量信息无序化,垂直搜索引擎则显得更加专注、具体和深入。垂直搜索引擎大体上需要以卜•技术:一是网页结构化信息抽取技术或元数据采集技术;二是分词和

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。