基于web的资源搜索引擎

基于web的资源搜索引擎

ID:33986719

大小:1.73 MB

页数:65页

时间:2019-03-02

基于web的资源搜索引擎_第1页
基于web的资源搜索引擎_第2页
基于web的资源搜索引擎_第3页
基于web的资源搜索引擎_第4页
基于web的资源搜索引擎_第5页
资源描述:

《基于web的资源搜索引擎》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、独创性声明本人声明所呈交的学位论文是本人在导师指导下进行的研究工作及取得的研究成果。据我所知,除了文中特别加以标注和致谢的地方外,论文中不包含其他人已经发表或撰写过的研究成果,也不包含为获得电子科技大学或其它教育机构的学位或证书而使用过的材料。与我一同工作的同志对本研究所做的任何贡献均已在论文中作了明确的说明并表示谢意。刃年牛耐日关于论文使用授权的说明本学位论文作者完全了解电子科技大学有关保留、使用学位论文的规定,有权保留并向国家有关部门或机构送交论文的复印件和磁盘,允许论文被查阅和借阅。本人授权电子科技大学可以将学位论文的全部或部分

2、内容编入有关数据库进行检索,可以采用影印、缩印或扫描等复制手段保存、汇编学位论文。(保密的学位论文在解密后应遵守此规定)签名:盟导师签名:牡嗍冲6月a1日第一章绪论1.1引言我们正处在一个新时代的起点。Int锄既和wcb已经改变了人们的学习、生活和工作等各个方面,它们的影响力已经渗透到了社会的各个层面,当今社会正逐步迈入信息社会。信息已经不再是个抽象的不可捉摸的东西,人们已经切身的感受到它对整个社会的巨大冲击力了,其重要性不言而喻。无论政府,企业还是个人,谁能更快地获取有效的信息,谁就在竞争中占据了先机。社会的各行各业都在努力实现自身

3、的信息化,都在努力的收集,加工,管理和利用着与自身密切相关的信息。在信息化社会里,一方面我们对信息有着强烈的需求,总希望能及时得到最新的,准确的,全面的信息,另一方面信息铺天盖地的向我们扑来,叫我们穷于应付,大喊着信息爆炸,埋怨着信息污染。尤其随着互联网的迅速发展,在网上传递的信息不仅容量巨大,时效性也更强。这一方面为我们搜集信息带来了便利,另一方面也给信息的筛选,过滤带来了更大的挑战。仅仅依靠人工搜集,整理来跟踪国内外信息动态已愈来愈不能满足实际需要。于是,面对着波涛汹涌的信息海洋,就产生了这样一种困惑:我们怎样才能获取有效的信息服

4、务呢?VannevarBush在1945年提出的MemexⅢ代表了人类长久以来的一个梦想:让每个人都可以十分容易的访问人类积累下来的知识并且十分容易的共享自己的见解。Memex被描述成一个存放了无数本书籍的书桌,这些书籍的内容被超链接互相连接起来,同时其它形式的知识载体,如图片、声音录音等也被放进来。人们可以通过链接在Memex中浏览,也可以通过简单的界面,比如口头的命令来搜索和查询。w曲的出现使Memex不再仅仅是一个梦想。万维网(WorldWideweb,简记为Web)起源于1989年欧洲粒子物理研究室CERN,最初计划是由cEI

5、Ⅲ的物理学家TimBemers.Lee于1989年3月提出,在1993年2月,随着第一个图形界面Mosaic电子科技大学硕士学位论文的发布而开始迅速发展01。据估计每年wcb流量增加100%。1,每天增加大约100万的新网页Ⅲ。至iJ2004年4月,Google声称提供对4,285,199,774个网页提供检索服务fGoogle],但这还只是Web上已有网页中很小的一部分。一。Web的核心技术是超文本和超媒体,它通过将文本、图形、图像、音频、视频等信息的有机结合,给人们提供了丰富的信息表示空间。同时wcb使得信息发布变得前所未有的简单

6、,也让信息浏览十分方便。整个web相当于一个巨大的知识库,越来越多的文本、书籍被数字化提供在线服务,越来越多的文字以数字化的形式创建和存储。Web规模的迅速增长和内容不断丰富,也给人们进行有效访问带来了困难。人们需要web具有Memex中那样理想的搜索和查询的功能,以帮助自己快速、准确的在信息的海洋中找到自己需要的内容。搜索引擎正是由这样一种需求推动而得到快速发展的信息服务形式。根据统计,约85%的用户使用搜索引擎去定位他们需要的信息,并且,几个著名的通用搜索引擎一直都稳定的处于全球访问量最大的50个网站之列。搜索引擎已经成为了人们进

7、行信息获取的一个基础设施。搜索引擎的检索系统建立在信息检索技术之上。广义的信息检索是研究信息的结构、分析、组织、存贮和检索的学科。其中,非结构化的文本信息检索是信息检索领域研究的重点,当前搜索引擎的检索系统就是这一类的信息检索系统。信息检索从1960年代开始,一直坚持采用统计的方法处理语言和文本数据,强调评估方法和评估实验,逐步建立了大规模的测试数据集和评估环境,取得了丰硕的研究成果。web搜索是信息检索研究的多种信息获取类型中的一种,Web上的用户查询是多种用户信息需求类型中很重要的一部分,搜索引擎可以从信息检索领域研究成果中选取成

8、熟的技术。同时,web搜索本身的特点也为信息检索研究带来了新的研究问题,比如Web搜索下的巨大数据规模和用户数量,web数据的超文本结构,web搜索下用户短查询的特点等等。随着Web的日益重要,w曲搜索成为计算机学科多个

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。