元 搜 索 引 擎 的资 料 挖 掘

元 搜 索 引 擎 的资 料 挖 掘

ID:15445069

大小:34.00 KB

页数:3页

时间:2018-08-03

元 搜 索 引 擎 的资 料 挖 掘_第1页
元 搜 索 引 擎 的资 料 挖 掘_第2页
元 搜 索 引 擎 的资 料 挖 掘_第3页
资源描述:

《元 搜 索 引 擎 的资 料 挖 掘》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库

1、元搜索引擎的资料挖掘武汉理工大学图书馆旃群邮编(430070)摘要:元搜索引擎是一站式搜索引擎,促进人们对网络信息资源的有效利用。通过元搜索引擎的概念、特点和工作原理介绍,对比独立搜索引擎,指出元搜索引擎的资料挖掘等不足,倾向网络搜索,专业搜索欠缺,指出元搜索引擎资料挖掘的发展方向。关键词;元搜索引擎独立搜索引擎信息检索资料挖掘面对无限增长的网络信息空间,信息资源的淹没和信息资源获取的迷向,如何快速有效的获取有用信息,成为信息时代的基本问题,各种网络搜索引擎应运而生。但各个搜索引擎要逐一搜索无尽无序的网站网页,信息源有限,检全率、检准率不尽人意

2、,耗时,检索结果相关性内容小,对不停更新的网站网页错误链接,而作为下一代功能更强大、更具智能的搜索引擎,元搜索引擎使用一个多元搜索引擎,可以同时检索多个搜索引擎的数据库,并获得有序的、可点击的结果,这是独立搜索引擎不能比拟的。一元搜索引擎的概念1995年华盛顿大学硕士生EricSelberg和OrenEtzioni推出第一个元搜索引---Metacrawler以来,这一新型的网络检索工具异军突起,发展迅速,目前可用的元搜索引擎已近百种。尽管元搜索引擎存在着这样那样的功能局限,但其以含盖较多的搜索资源,能够在尽可能短的时间内提供相对全面、准确的检

3、索结果等诸多优异功能受到用户的青睐,已渐成为一种不可或缺的极具潜力的网络检索工具。解决逐一登陆各搜索引擎,并在各搜索引擎中分别多次输入同一检索请求(检索字串)等烦琐操作,元搜索引擎应运而生。元搜索引擎尽可能地减少和优化了检索操作,实现了“一次检索输入,多引擎同时搜索”,是对多个独立搜索引擎的整合、调用、控制和优化利用,是对分布于网络的多种检索工具的全局控制机制。整合、调用、控制和优化利用源搜索引擎的技术,称为“元搜索技术”(Meta-searchingtechnique),是元搜索引擎的核心,集成了独立搜索引擎的不同性能和不同风格的搜索引擎,并

4、发展了一些新的查询功能,查一个搜索引擎相当查多个独立搜索引擎,查询效果事半功倍。元搜索引擎按搜索机制划分为:并行式和串行式,主要是查询请求发向和查询结果呈现方式不同,并形式搜索时间响应和结果呈现优于串行式。按功能划分,元搜索引擎包括多线索式搜索引擎和All-in-One式搜索引擎;按运行方式的差异可分为在线搜索引擎和桌面搜索引擎。二元搜索引擎的工作原理,特点元搜索引擎由三部分组成:检索请求提交机制,检索入口代理机制,检索结果显示机制,直接用游览器软件或代理服务器进行多线程查找,有自己独特的工作原理:自由集成源搜索引擎,可对其进行随意添加,删除,

5、开启,关闭的调用切换选择,迎合个性化检索需求;返回结果在数量,检索时间段,结果相关度优化有选择排序呈现;强大的检索请求处理功能和不同搜索引擎间检索语法规则,字符的“本地化”转化功能,表现出很强的适用范围,可扩展性,方便建立成员搜索引擎;对于返回的结果系统会进行重复排除、重新排序等处理,详尽全面的检索结果信息描述;支持多种语言检索,服务方式为面向网页的全文检索。元搜索引擎是搜索引擎的搜索,特点显著:元搜索引擎没有自己的网页数据库和Robot,利用其他的数据库不侵权,但按内容集中了多个专门的搜索引擎的查询界面,可实现一站制对各数据库进行搜索,节约存

6、储设备;通过对多个全文数据库按一定标准(如DC)进行标引后,组成一个元数据集,通过一个发布系统(WEB服务器)与客户端进行交互。得到一个集成后的多数据库查询系统,有对对原始数据的描述信息。通过一个特定连接,用户可以直接从原始数据库中得到原文数据,结果是二次搜索引擎加工;把多个搜索引擎的检索结果重新组织,按照相关性大小重新排序,结果显示"负责所有源搜索引擎检索结果的去重、合并、输出处理等元搜索引擎的出现,能按用户意愿对检索结果进行分级编排,以统一的界面呈现给用户,也可以说元搜索引擎仅是一种代理机制式的查询。三元搜索引擎得优势和缺点自动对查询结果进

7、行处理,滤出重复冗余结果,查询结果进行相关度排序(如:PorFusion);高级搜索健全,使用※作为通配符,支持+、-词操作,支持词组查询方式(如:MetaCrawler);自动将搜索策略转换成符合各搜索引擎的语法,保证搜索效果;查询结果统一处理成统一格式,方便浏览;搜索时间(以分、秒)执行限时处理;网络覆盖面广,快速响应用户的信息提问,得出准确相关回答;支持AND和OR两种逻辑组合选择,查询结果的自动依次设置(如:Highway);和语言及内码相关的功能:支持多内码(GB,BIG5,GBK)、内码间的自动转换、中英文混合搜索、翻译查询(用中文

8、查询英文或用英文查询中文);基于某种专有的模式匹配和概念搜索的算法,可以自动根据文本中的概念进行分类,自动标引,按用户兴趣自动匹配出个性化、多侧面的直

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。