欢迎来到天天文库
浏览记录
ID:15057020
大小:26.50 KB
页数:3页
时间:2018-08-01
《数据挖掘在图书馆个性化服务中的应用.doc》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、数据挖掘在图书馆个性化服务中的应用 【摘要】随着信息技术的发展,数据挖掘技术在信息的利用和提取中发挥着日益重要的作用。本文通过对数据挖掘技术以及图书馆个性化服务相关内容的介绍,探讨了数据挖掘在数字化图书馆中的应用,说明数据挖掘技术在数字图书馆应用的必要性,以及在提升图书馆服务质量和服务水平方面的发挥的重要作用。 【关键词】数据挖掘个性化服务数字图书馆 一、数据挖掘技术概述 数据挖掘是从大量的、不完全的、有噪声的、模糊的、随机的数据中,提取隐含在其中的、人们事先不知道的、新颖的、可被人理解的、但又是潜在有用的模式的过程。其主要特点是
2、对数据库中的大量数据进行抽取、转换、分析和其他模型化处理,从中提取辅助决策的关键性数据。数据挖掘根据其主要研究对象的数据结构形式的不同,一般分为数据挖掘、文本数据挖掘、Web数据挖掘三类。 1.数值数据挖掘,通常称为数据挖掘,它的任务一般可以分为描述和预测两类,具体地说,挖掘功能包括发现概念/类描述、关联、分类、预测、聚类、趋势分析、偏差分析和类似性分析。常见的数据挖掘方法主要有:归纳学习方法、仿生物技术、公式发现、统计分析方法、模糊数学方法、决策树、遗传算法、贝叶斯信念网络、粗糙集及可视化技术等,由于各种方法都有自身的功能特点以及应用领域。
3、 2.文本数据挖掘是面向文本信息的数据挖掘。当数据挖掘的对象完全由文本类型组成时,结合使用数据挖掘算法与信息检索算法对巨量文本信息进行自动化信息处理与分析的过程叫文本数据挖掘。它包括特征提取、文本摘要、文本分类与聚类、概念操作以及探索性数据分析等工作。文本数据挖掘所应用的技术包含用于表示文档的词频反文献频率向量表示法、词串表示法,用于文本分类的贝叶斯分类算法、词集合算法,基于概念的文本聚类算法以及K—最近邻参照分类算法等。 3.基于Web的数据挖掘。Web数据挖掘的定义是:针对包括Web页面内容、页面之间的结构、用户访问信息、电子商务信息等在内
4、的各种Web数据,应用数据挖掘方法以发现有用的知识来帮助人们从WWW中提取知识,改进站点设计,更好地开展电子商务。 通过Web数据挖掘,我们可以从数以亿计存储大量多种多样信息的Web页面中提取出我们需要的有用的知识,包括用户访问行为、频度、内容等内容,根据这些内容和知识,来改进站点设计,优化我们的Web页面,包括页面内容安排、页面间关联结构优化以及开展有针对性活动和特色服务内容等,使更多用户能够更方便、更快捷的找到所需要的信息和享受到所提供的服务。Web数据挖掘在数字图书馆的开发和利用将发挥越来越重要的作用。根据Web数据挖掘对象的不同可分为:
5、Web结构挖掘、Web内容挖掘和Web日志。 二、图书馆的个性化服务概述 3 所谓个性化服务,就是服务要体现个性,同时具有主动性的特点,实现个性化服务的关键是在“信息找人”过程中什么信息找什么人。其本质就是对于不同的人、不同的要求提供不同的服务,以满足不同用户的特定需求。常见的服务方式有个性化推荐、个性化检索、个性化网站。个性化推荐服务如信息推送服务,一种按用户指定时间或发生的事件把用户选定的数据自动发送给用户的技术,其本质就是主动性服务,几乎不需要用户做什么事,系统自动按照用户的信息需求提供相应的服务。个性化主动服务将使用户通过尽可能
6、小的努力获得尽可能好的服务。数字图书馆的个性化信息服务首先就是要为用户创建个性化的信息资源库,即个人数据库。通过图书馆网络,用户向图书馆系统提交所定制的个性化信息,用于构建个人信息数据库,建立个性化网站。针对不同的个人信息,即对不同的用户采用不同的服务策略,提供不同的服务内容,如提供个人书架和信息检索服务等,不同人的个人书架内容是不完全相同的;对于相同的检索提问,系统反馈给专家的以及普通用户的内容应该有所区别的。 三、数据挖掘在图书馆个性化服务中应用 1.优化馆藏资源配置,提高资源利用率 传统图书馆资源的配置、服务的提供,由于受人工采集
7、信息的影响,因此不可避免的受到采集者的知识层次、知识结构以及个人爱好等因素的影响,而带有主观性。采用数据挖掘技术则可以较好的解决这一问题。(1)利用数据挖掘技术,对流通记录、检索请求等日志数据进行分析,就可以得到各类文献流通借阅情况,了解读者的借阅行为和爱好。根据这些信息,有针对性的补充和丰富文献资源,剔除过时文献资源,或减少文献信息资源的副本数,甚至可以根据这些挖掘信息,调整图书馆的人力、物力资源的分配,从而达到资源优化配置,合理布局目的。(2)对数字图书馆的结构进行挖掘,目的是发现数字图书馆页面的结构和结构模式,在此基础上对页面进行分类和聚类
8、,或对相关网页进行分析,从而可以评价网页的质量,优化检索方式,指导网站建设,便利用户对数字图书馆使用,提高数字图书馆的利用率。 2.完
此文档下载收益归作者所有