资源描述:
《网络搜索引擎的现状分析与发展探析毕业论文》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、网络搜索引擎现状分析与发展探析本科生论文论文题目网络搜索引擎的现状分析和发展探析作者姓名所在学院学科(专业)所在班级 目录11网络搜索引擎现状分析与发展探析摘要:1关键词:1前言11.搜索引擎的原理与技术11.1分类目录检索11.1.1主题分类法21.1.2学科分类法21.1.3分面组配分类法21.1.4图书分类法21.2关键词检索21.2.1网页抓取31.2.2文档分析31.2.3建立索引31.2.4文档表示42.搜索引擎的比较分析43.网络搜索引擎的现状63.1网络搜索引擎的分类63.1.1全文搜索
2、引擎63.1.2目录式搜索引擎63.1.3元搜索引擎63.2搜索引擎的主要性能指标73.3搜索引擎的主要技术73.3.1搜索器73.3.2索引器73.3.3检索器73.3.4用户接口84.目前搜索引擎存在的不足84.1个性化能力较差84.2关键词标引不符合语义理解的需要84.3返回结果的显示方式过于简单84.4系统交互性较差94.5缺乏适应信息源动态变化的有效应变机制94.6不能访问动态生成的页面95.搜索引擎的发展动向95.1提高信息查询结果的精度与检索的有效性95.2智能、个性化的搜索引擎。105.
3、2.1加权的启发式搜索方法105.2.2协同式检索方法115.2.3智能代理115.3实现统一的自动分类115.4引入受控语言125.5MXL搜索引擎125.6基于内容的信息检索125.7突出专业性特色,深化服务内容1311网络搜索引擎现状分析与发展探析5.8采用分布式体系结构提高系统规模和性能135.9用户友好化的进一步提高13参考文献1411网络搜索引擎现状分析与发展探析网络搜索引擎的现状分析与发展探析摘要:随着互联网的快速发展,越来越丰富的信息呈现在人们面前,但人们却越来越难以获得其最需要的信息。
4、为了解决此问题,网络搜索引擎应运而生。搜索引擎能帮助我们在整个互联网上快速地查找到目标信息。。文章概述了搜索引擎的原理与技术,分析了搜索引擎的现状以及不足,并对搜索引擎的未来发展动向进行了展望。关键词:搜索引擎;原理;现状;动向过去,人们查阅资料首先想到的是拥有大童书籍资料的图书馆,而在互联网普及的今夭很多人都会选择一种更方便、快捷、全面、准确的查阅方式—互联网。随着互联网和宽带上网的普及,搜索引擎在中国异军突起,不断地被应用到人们的日常生活中。搜索引擎能帮助我们在整个互联网上快速地查找到目标信息。搜索
5、引擎是指根据一定的策略、运用特定的计算机程序搜集互联网上的信息,经过对信息进行组织和处理后,为用户提供检索服务的系统。搜索引擎提供的导航服务已经成为互联网上非常重要的网络服务,搜索引擎站点也被美誉为“网络门户”,搜索引擎技术因而成为计算机工业界和学术界争相研究、开发的对象。1搜索引擎的原理与技术搜索引擎的主要功能是信息组织和信息检索。基于层次检索的分类目录检索和基于词语检索的关键词检索是搜索引擎的两种基本类型。1.1分类目录检索网络分类目录提供按类浏览查询方式。分类搜索引擎工作原理:由人工发现、抓取、辨
6、别网上信息、依靠编目、标引人员的知识按照图书分类、学科分类或其他分类依据,建立主题树分层目录,将采集、筛选后的信息分门别类。分类搜索引擎采用网站登录/收录方式,依据主旨、用户对象及网络资源状况构建分类体系,把收集到的本地的网站页面进行人工编辑,层层类分,形成纵向隶属、横向关联的网站目录数据库。用户依据类目体系及其规则分类检索,逐类浏览,直至获得所需资源。用户在使用分类目录时,通过搜索引擎的分类目录,从顶层逐步向下查询子目录,网络资源目录所采用的分类法有主题分类法、学科分类法、图书分类法和分面组配分类法。
7、1.1.1主题分类法11网络搜索引擎现状分析与发展探析主题分类法把事物纳入相关的主题目录,与此事物相关的内容全部集中在主题目录下,便于用户的特性检索。主题法一般设置多个一级主题类目,再下设次级目录,其层次多为4级在最后一级列出超文本的链接点,多数链接点伴有相应网页内容介绍。这种分类法以事物为线,适应交叉主题的主题查找,但对网络资源的覆盖率有限。1.1.2学科分类法学科分类法以学科作为分类的标准,在一级类目下设立二级、三级类目。这种分类法容量大,便于用户的族性检索。1.1.3分面组配分类法这类搜索引擎一般
8、设计两个分面,查询时两个分面的类目以及子类目可相互组配,从而提高专指度,查准率较高。1.1.4图书分类法图书分类法以科学体系为基础,容量大,版本更新及时,可直接使用图书分类法机读版本。1.2关键词检索大多数搜索引擎一般在首页中都有检索对话框,允许用户输入欲查询的关键词搜索结果由搜索引擎的检索软件进行处理。搜索引擎由5部分构成:搜索器、搜索引擎数据库、索引器、检索引擎和用户接口。搜索器对应抓取过程,索引器完成文档分析和建立索引的工作,文档表示