基于internet个性化信息检索技术的分析与研究

基于internet个性化信息检索技术的分析与研究

ID:23344109

大小:52.00 KB

页数:7页

时间:2018-11-07

基于internet个性化信息检索技术的分析与研究 _第1页
基于internet个性化信息检索技术的分析与研究 _第2页
基于internet个性化信息检索技术的分析与研究 _第3页
基于internet个性化信息检索技术的分析与研究 _第4页
基于internet个性化信息检索技术的分析与研究 _第5页
资源描述:

《基于internet个性化信息检索技术的分析与研究 》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库

1、基于Internet个性化信息检索技术的分析与研究摘要随着Inter上的信息量急剧增加,如何使用户获得有用的信息已成为信息检索系统急需解决的问题,个性化的信息检索是解决目前存在问题的关键。本文对目前的个性化检索的关键技术进行了分类分析,并讨论搜索引擎个性化的发展趋势。关键词信息检索;个性化;Agent;挖掘;推送1引言网上信息极度膨胀导致查找信息犹如大海捞针,虽然Google等优秀搜索引擎提供了大量的信息资源,但仍需根据检索到的地址信息,按照页面屏幕的提示向下追踪。特别是对于那些对专业信息有迫切需求的专业人士来说,难以迅速、准确地获得有价值的网上信息资源因此

2、用户迫切希望找到一种能够在信息海洋中自动获取实用、准确、精炼的信息的工具。为了改善信息检索与提供信息的质量,就必须实现信息检索的个性化,下面针对实现信息检索个性化的关键技术进行分析。2个性化信息检索关键技术2.1智能代理Agent[1]-[6]智能代理又称智能体,它是在用户没有明确具体要求的情况下,根据用户需要,代替用户进行各种复杂的工作,如信息查询、筛选及管理,并能推测用户的意图,自主制定、调整和执行工作计划。它使用自动获得的领域模型(如ationfilteringagents),提供个性化报纸、个性化计算机新闻、进行邮件过滤、新闻组过滤等,并根据用户的描

3、述,自动下载相关的主页;通知代理(notificationagents),如果用户关注的url内容发生变化,将通知用户,如果用户关注的其他事件发生,则提醒用户;此外还有提供其他服务的agent,如提供娱乐方面的服务、提供各种咨询服务、提供分类广告服务,介绍工作提供商业信息服务等等。用于信息服务的智能Agent主要完成以下功能:导航,即告诉用户所需要的资源在哪里;解惑,即根据网上资源回答用户关于特定主题的问题;过滤,即按照用户指定的条件,从流向用户的大量信息中筛选符合条件的信息,并以不同级别(全文、详细摘要、简单摘要、标题)呈现给用户;整理,即为用户把已经下载

4、的资源进行分门别类的组织;发现,即从大量的公共原始数据中筛选和提炼有价值的信息,向有关用户发布。这些都是使信息服务走向个性化主动服务不可缺少的功能。目前在此方面己经有了一些能够使用的系统,但智能化的程度还远远不够,且主动有余的过滤不足己经造成了一些负面的影响,有待尽快发展更先进的人工智能技术予以解决。2.2网络信息挖掘(ining)技术[7]-[8]网络信息挖掘源于数据挖掘。数据挖掘就是指从大量数据(如数据库)中提取抽象的、潜在的有用信息的过程,它是数据库中知识发现KDD的核心,为大量数据的利用提供了有效的工具。数据挖掘的成功使研究人员将数据挖掘技术用于因特

5、网,但是由于上的数据不同于传统数据,故产生了一个新的研究方向—网络信息挖掘。网络信息挖掘,又称为基于l等)挖掘的目的是对页面信息进行聚类、分类和关联分析,以及利用ationPush),即由信源将信息主动推送给用户;信息拉取(InformationPull),即由用户主动从信源拉取信息;推拉结合(PushandPull),即在信息获取过程中既有来自信源的推送也有用户自身的主动拉取.一、信息推送模式,网上信息的推送主要采用下面几种方式:1.频道式推送频道式网络播送技术是目前网上普遍采用的一种推送方式,它将某些网页定义为浏览器中的频道,用户可以选择收看感兴趣的、通

6、过网络播送的信息。2.邮件式推送用电子邮件方式主动将有关信息发布给列表中的用户。3.网页式推送在特定网页上将信息提供给感兴趣的用户。4.专用式推送通过机密的点对点通信方式,将指定的信息发送给专门的用户。信息推送模式及时性好,应用面广,对用户没有技术上的要求,但信息针对性差,难以满足用户的个性化需求。二、信息拉取模式网上的信息拉取技术是数据库查询、检索技术的扩展。在因特网应用的早期,人们主要是在网上进行漫游和浏览,现在随着因特网应用的日渐深入,人们愈来愈迫切地希望能从因特网中快速获取自己所需的特定信息,各种“搜索引擎”应运而生。目前流行的搜索引擎主要有两类:1

7、.分类式搜索引擎按网站的目录分类,对站点、及摘要信息进行搜索2.全文检索式搜索引擎提供全文检索功能,用户利用关键词可将与该词相关的各个网页的地址及相应的一段全文信息提取出来。信息拉取模式针对性强,能满足用户的个性化需求,但及时性差,对用户要求较高。三、信息推拉模式信息推拉技术是将信息推送与拉取两种模式结合,使二者优势互补。根据推、拉结合顺序及结合方式的差异,又分以下四种不同推拉模式:1.推后拉—先由信源及时推送公共信息,再由用户有针对性地拉取个性化信息;2.拉后推—根据用户拉取的信息,信源进一步主动推送与之相关的信息;3.推中有拉—在信息推送过程中,允许用户

8、随时中断并定格在感兴趣的网页上,以拉取更有针对性的信

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。