欢迎来到天天文库
浏览记录
ID:23803457
大小:2.40 MB
页数:52页
时间:2018-11-10
《基于web的社会化搜索引擎研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、武汉理工大学硕士学位论文第1章绪论1.1研究背景及意义上世纪90年代,互联网得到了自诞生以来最为迅猛的发展,互联网的业务功能、用户规模、信息容量等都呈现不同程度地扩张,互联网成为人们在工作和[1]生活中获取所需资源和交流沟通的重要信息平台。然而,伴随着互联网技术的迅猛发展以及互联网用户规模的不断扩大,网络信息过于庞杂、内容结构松散、不稳定变化快等特点使得用户在互联网上查找自己所需资源信息的难度大大增[2]加。因此,一个方便快捷、功能强大的信息检索工具成为用户日益关注的问题,从而促使信息检索成为研究的重点和热点,无论是研究者还是互联网厂商,已经投入大量精力大力发展信息检索技术,以方便
2、广大互联网用户能够有效地获取信息。信息检索技术的发展使得用户在网上快速找到准确的信息成为可能,极大地增强了人们查询和锁定信息的能力,成为互联网上不可或缺的工具。搜索引擎的出现,让用户在互联网可以方便快捷地获取信息,但随着用户规模的增大、网络信息量的爆炸式增加,检索方式也越来越多样化,但其本身的检索能力已经受到质疑,也存在许多技术难关需要攻克。目前大部分搜索引擎属于传统搜索引擎,如谷歌、微软、百度、搜狗等,它们都是基于关键词的机械搜索,针对同一搜索请求,提供同样的搜索结果,并不会因为不同的用户而作调整,无[3]法就用户的个性化需求提供有针对性的搜索结果。纵观传统搜索引擎这些年的发展,
3、有了先进的人工智能技术支持,搜索引擎可以返回更多的结果给用户,但这些结果往往需要用户作进一步的检验选取,要查到自己真正所需的信息仍然如大海捞针般困难。为了改善传统搜索引擎存在的查询结果过多但无效结果也多的问题,人们开始在传统搜索引擎的基础之上引入元搜索,元搜索引擎的核心思想是依靠多个单个的成员搜索引擎来检索,虽然能够弥补传统搜索引擎的一些不足,但实际依然存在机械搜索带来的种种问题。为了从根本上突破传统搜索引擎的机械搜索模式,人们开始以元搜索为基础将社会化搜索引入以达到二者的有效结合。社会化搜索最早是由Yahoo在2004年提出来的,是一种以人为中心的互动化的搜索方式,旨在通过众互联
4、网用户的集体智慧获取或改善检索结果,使得用户在使用检索到的内容的同时,也是搜索内容的制造者。身处社交网络的用户,搭建了自己的社交关系网,描述了用户兴趣、社交行为等特征,这些用户个性化1万方数据武汉理工大学硕士学位论文信息可以得到最大化利用,作为用户检索请求的附加信息,使得搜索引擎能够理解用户的特定需求,将更贴合用户的内容检索出来。1.2国内外研究现状1.2.1搜索引擎的发展现状搜索引擎的最早雏形是来自加拿大的AlanEmtage于1990年发明的Archie,但它并非现代意义上的搜索引擎,只是具有相似的检索方式。总体来讲,搜索引擎的发展大致历经三个阶段,但这三个阶段的划分又有不同的
5、说法。目前较为普遍的一种说法是:基于文档内容的超级目录索引被认为是现代意义上的第一代搜索引擎,Yahoo最早采用这种检索方式,让搜索引擎为众人所知并得到迅速发展;第二代则是基于关键字和词匹配的网页检索模式,Google的成功让这种搜索模式成为市场主流;基于Web2.0技术和社区网络的发展,用户的个性化与互动式的需求成为新的关注点,社会化的交互共享理念融入到搜索引擎中,发展成为一[4]种新型的检索模式,搜索引擎进化到第三代。目前,搜索引擎仍然是用户最常使用的网络工具之一,各大IT公司力推各自的搜索产品,奋力争夺搜索引擎市场份额。在全球范围内,Google依旧占据搜索引擎市场份额第一,
6、紧随其后的是Bing和Yahoo,呈现三足鼎立的局面。然而,随着Google退出中国大陆,以及这三大搜索引擎在国内较差的适应性,使得它们在国内的发展日渐式微。在国内,主打互联网安全的奇虎360推出自己的搜索产品,在近几年迅速抢占市场份额,虽然使得百度在国内的市场份额有所下降,但是百度仍以绝大的优势在使用率和占有率上占据中国搜索引擎的第一把交椅,而360好搜则紧随其后。1.2.2元搜索引擎的发展现状像Google、百度这些搜索引擎虽然在商业上取得了巨大的成功,但是依然存在搜索的查准率不高、返回太多无用结果等问题。元搜索引擎的核心思想是依靠多个单个的成员搜索引擎来对用户的请求进行检索,
7、再重新整合返回的搜索结果,排序后生成最终搜索结果供用户使用。很显然,相较于传统搜索引擎,元搜索引擎并不拥有单独的索引库,还是需借助其各成员搜索引擎的索引数据库来实现检索。元搜索引擎的优势在于查询出来的数据容量更大、内容覆盖面也更广,但是并没有从本质上解决传统机械搜索带来的查准率不高、无个性化需求的问题[5]。2万方数据武汉理工大学硕士学位论文纵观近几年来元搜索引擎的发展历程,不难发现主要集中在如何对用户的请求进行处理转换、如何调用成员搜索引擎来更好地搜索以及如何对返回
此文档下载收益归作者所有