基于概念的数字图书馆信息过滤系统研究new

基于概念的数字图书馆信息过滤系统研究new

ID:34036581

大小:282.58 KB

页数:3页

时间:2019-03-03

基于概念的数字图书馆信息过滤系统研究new_第1页
基于概念的数字图书馆信息过滤系统研究new_第2页
基于概念的数字图书馆信息过滤系统研究new_第3页
资源描述:

《基于概念的数字图书馆信息过滤系统研究new》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、2007年6月第6期现代情报June12007No.6基于概念的数字图书馆信息过滤系统研究许春漫(福建师范大学社会历史学院,福州350007)〔摘 要〕 本文结合向量空间技术和概念检索技术提出了基于概念的数字图书馆信息过滤系统,该系统能够从词汇所表达的概念意义层次上来处理文档与用户的信息需求,系统根据用户提供的初始信息和反馈信息建立并更新用户模板,并在此基础上,主动从大量的动态信息流中挑选出满足用户需求的信息推送给用户。〔关键词〕 数字图书馆;信息过滤;用户模板■〔Abstract〕Thispaperpresentsaconc

2、ept-basedinformationfilteringsystemindigitallibrarywhichusesvec2torspacetechnologyandconcept-basedinformationretrievaltechnology.Thissystemdealswiththedocumentandtheuserpsinterestinformationbasingonconcepts.Thissystembuildstheuserprofileaccordingtotheinformationprov

3、idedinitiativelybytheuser,updatestheuserprofileaccordingtotheuserpsfeedbackinformation.Byusingtheuserprofile,thissystemcanfilternecessaryinformationfrommassinformationandpushittotheuserwhoneedit.〔Keywords〕digitallibrary;informationfiltering;userprofile〔中图分类号〕G250176

4、 〔文献标识码〕C 〔文章编号〕1008-0821(2007)06-0077-03  为用户提供优质的信息服务是传统图书馆的服务宗旨,用户的信息需求,从而提高推送的准确性和全面性。同样也是数字图书馆永恒的主题。随着互联网的快速发展,1 系统的体系结构网络信息正以指数级的速度增长,面对浩如烟海的网络信信息过滤的工作基本上可以概括为两项:一是建立用息资源,如何有效获取自己感兴趣的信息,屏蔽不相关的户需求模板(简称用户模板),即将用户的信息需求以计算信息成为困扰用户的突出问题。用户迫切希望数字图书馆机能够识别的形式揭示出来;二是信息

5、匹配计算,即根据能改变传统的“人找信息”的服务模式为“信息找人”的用户模板判断信息与用户需求的相关度。信息过滤系统体服务模式,做到“把最好的信息,用最方便的方法,在最系结构如图1所示。好的时机,送到最需要的人手中”,从而减轻用户检索信息本系统引入概念词典的目的是为了实现词汇到概念之数的负担。间的相互转换。在概念词典中,概念与词汇是多对多的映字现有的信息过滤系统中有相当一部分是建立在词语而射关系,给定一个词汇,通过该词典能知道它可以表达哪图书非概念的基础上,系统对于用户需求的表达以及信息的匹些概念,而给定一个概念,又可以得到描述

6、该概念的所有馆配和推送都是基于词语的外在形式而不是它们所表达的概词汇。这样,文档和用户模板中的词汇通过该词典都可转技术念,所以常常推送给用户无关的信息,或导致密切相关信换成概念,因此就将同一概念的多种描述元素之间的形式论息的遗漏。例如,当用户表现出对万里长城方面的信息感差别屏蔽掉,实现了概念层次上的同义扩展过滤。由于很坛兴趣,系统可能将一些含有“长城”字样诸如“长城集多词汇在不同领域中的含义完全不同,比如ATM既可以归团”、“长城饭店”等无关信息也一并推送给用户;当用户为“异步传输模式”,又可以归为“自动提款机”,因此概表现出

7、对计算机方面的信息感兴趣,系统可能只给用户推念词典应该是针对领域的,不同领域有不同的概念词典。送含有“计算机”一词的文档,其实有许多含有“电脑”文档分析模块的功能是从文档中抽取出概念,建立基却不含有“计算机”一词的文档也是用户感兴趣的信息,于概念的文档库,在文档库中每个文档都有一个文档号。但过滤系统却没有将其推送给用户。用户模板建立模块通过分析用户提供的信息需求,生成不为了解决以上问题,本文综合利用向量空间技术和概同用户的初始需求模板;学习模块根据用户反馈信息更新念检索技术提出基于概念的数字图书馆信息过滤系统,该用户模板;过滤

8、模块自动搜集用户可能最感兴趣的信息,系统能够根据用户的信息需求,主动从大量的动态信息流然后以用户指定的方式(如电子邮件等)将其传递至用户中挑选出满足用户需求的信息推送给用户,同时本系统还指定的地点。能够从词汇所表达的概念意义层次上来认识和处理文档与收稿日期:2007—02—0

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。