欢迎来到天天文库
浏览记录
ID:33836891
大小:132.56 KB
页数:3页
时间:2019-02-28
《个性化元搜索引擎的研究》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库。
1、第8卷%第7期软件导刊Vol.8No.72009年7月SoftwareGuideJul.2009个性化元搜索引擎的研究段艳明,肖辉辉(河池学院计算机与信息科学系,广西宜州546300)摘要:针对现有搜索引擎的局限性和当前用户的个性化需求,以用户兴趣模型为基础,对个性化元搜索引擎的基本原理和结构、方法及关键技术进行了研究,并在此基础上提出了用户个性化元搜索引擎的简单实现。关键词:个性化;搜索引擎;用户模型;个性化搜索;元搜索引擎;个性化元搜索引擎中图分类号:TP393.01文献标识码:A文章编号:1672-7800(2009)07-0124-03分提高站点的服务质量和访问效率,从而吸引更
2、多的访问者。0引言元搜索引擎在一定程度上弥补了传统搜索引擎覆盖率和不相关信息过载上的不足,而个性化元搜索引擎则是弥补元搜随着Web技术的发展,Internet已经发展成为一个巨大的索引擎不考虑用户的不同信息需求上的缺陷。个性化元搜索引全球化信息空间。在这种情况下,用户面对浩瀚的信息海洋,往擎最终要为用户提供个性化搜索服务。根据目前个性化搜索技往无法准确找到自己所需要的信息。传统搜索引擎的出现在一术实现的现状,元搜索引擎要实现个性化搜索服务,可以从以定程度上解决了Web信息检索困难的问题。但是,由于不同的下几方面考虑:搜索引擎所采用的算法和搜索范围各异,导致返回结果的重复(1)根据用户个
3、性特征以及用户搜索的历史信息,建立用率不到34%。如果想得到相对全面,准确的搜索结果,必须同户兴趣模型(UserProfile)。只有构建了用户兴趣模型,元搜索时使用多个搜索引擎,在这样的背景下便产生了元搜索引擎。引擎才能根据用户的兴趣特征来提供个性化搜索服务。用户兴个性化元搜索引擎的出现与互联网的飞速遍及全球有着不可趣模型是元搜索引擎实现个性化搜索的基础。分割的联系,它是一种更适合人们在纷繁复杂而又动态化的网(2)为了给用户提供个性化搜索,元搜索引擎需要对提交络世界里高效而准确地进行信息检索的工具。的用户查询进行查询优化,并参考用户兴趣模型最大可能地识1个性化元搜索引擎别用户的查询意
4、图。(3)个性化元搜索引擎应该能参考用户兴趣模型选择最适元搜索引擎是一种基于集成搜索引擎的搜索引擎,主要通合用户查询的成员引擎来为用户提供搜索服务。过成员搜索引擎选择、文本选择、结果融合三个主要步骤来完(4)元搜索引擎获得各成员引擎返回的结果后,在合成结成信息检索任务,用于提供与查询需求相关的信息线索或者全果时参照用户兴趣模型,过滤与用户查询不相关的结果和对结文。元搜索引擎通过自己定制的检索界面,能够同时对多个搜果重新进行排名。索引擎进行检索,为用户提供一个统一的查询界面,用户只需提交一次检索请求,由元搜索引擎负责转换处理后提交给各个2个性化元搜索引擎的关键技术独立的搜索引擎,由这些成
5、员搜索引擎完成实际的信息检索,最后将所有查询结果经过处理后集中起来以统一的格式返回2.1个性化用户兴趣模型给用户。用户兴趣模型用于捕捉并记录用户的需求兴趣点,存储和个性化元搜索引擎是元搜索引擎和个性化技术的结合,它管理用户的历史行为和用户的背景信息,通过建立模型来记一方面能够提高搜索引擎的查全率,用户不用同时查询多个搜录、管理用户的兴趣,描述用户可能的潜在兴趣需求。模型中记索引擎;另一方面它能为不同用户提供不同的服务,以满足不录下了用户的历史行为以及对系统的评价,以此优化查询行同的需求。个性化服务通过收集和分析用户信息来学习用户的为,优选查询结果。用户兴趣模型不仅仅是用户个体的兴趣描兴
6、趣和行为,从而达到主动推荐的目的。个性化服务技术能充述信息,而是一种面向算法的、具有特定数据结构的、形式化的作者简介:段艳明(1978-),女,江西永新人,江西理工大学硕士研究生,河池学院计算机与信息科学系讲师,研究方向为计算机网络、人工智能;肖辉辉(1977-),男,江西永新人,江西理工大学硕士研究生,河池学院计算机与信息科学系讲师,研究方向为GML空间数据库理论与应用、数据库技术、GIS应用开发。第7期段艳明,肖辉辉:个性化元搜索引擎的研究·125·用户兴趣描述。(2)合并结果列表中重复的条目,消除重复的算法如下:作为个性化服务的基础和核心,用户兴趣模型的建立要求a.归并完全相同的
7、URL。准确,完善。通常有两种方法用于建立模型:一是通过用户主动b.比较URL的相似性。如果主机IP地址相同、路径完全相提出自己的兴趣爱好来建立模型;一是通过日志文件,观察用同,则认为是同一个文件;如果只是路径的最后多了如同de-户所访问的页面并从其中挖掘相关信息从而建立模型。fault.htm(asp),index.htm(asp)的文件名,也认为是同一文件。如2.2成员搜索引擎的调度策略果只是文件名相同而主机地址或路径存在差异,则要综合文档
此文档下载收益归作者所有