基于大数据数字图书馆的信息资源组织与信息检索

基于大数据数字图书馆的信息资源组织与信息检索

ID:28086366

大小:57.12 KB

页数:4页

时间:2018-12-08

基于大数据数字图书馆的信息资源组织与信息检索_第1页
基于大数据数字图书馆的信息资源组织与信息检索_第2页
基于大数据数字图书馆的信息资源组织与信息检索_第3页
基于大数据数字图书馆的信息资源组织与信息检索_第4页
资源描述:

《基于大数据数字图书馆的信息资源组织与信息检索》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、基于大数据数字图书馆的信息资源组织与信息检索赵新宇山东财经大学山东济南250014摘要:随着时间的流逝数字图书馆的信息资源会越积越多,再加上计算机技术和社交网络的不断更新用户产生的信息资源也会越来越多。数字图书馆信息服务需要大数据技术,数字图书馆信息服务建立在大数据的基础上将极大地改善用户对数字图书馆信息服务的满意度。数字图书馆的信息资源组织与信息检索作为大数据图书馆信息服务的重要内容之一,是实现数字图书馆有序运行的重要保障。关键词:大数据数字图书馆;信息资源组织;信息检索数字图书馆作为一种可检索复用的庞

2、大信息系统,它是分布性、大规模的和有组织的数据库和知识库的集合体。对于用户来说,他们对这些数据库和知识库进行一致性访问,目的以获取自己对需要的最终信息。而要达到这种需求和结果之间的精确对应,就需要他们之间有某种“默契'一致性的匹配方式,就是说,在数字图书馆短,为了便于用户获取有效信息资源,进行信息共享,就首先需要对数字资源进行合理科学准确适当的描述和组织,形成从分、有效、有序、准确的组织信息,为用户提供可检索和操作的入口,从而达到利用数字资源的效果。大数据环境下,数字图书馆的信息资源的数量大、结构形式多样

3、化,对数字资源进行组织就显得尤为重要。大数据的出现对数字图书馆信息检索影响很大,大数据时代数据的更新速度非常快,如何快速处理这些快速更新的数据,为用户提供最新的检索信息成为基于大数据的数字图书馆信息检索服务的难点。一,信息资源组织目前数字图书馆信息资源组织存在的问题主要有四方面:信息组织A•体操作中的问题、信息组织的要求问题、信息组织的方式方法问题和信息组织的标准化与协调问题。信息资源组织只体操作中的问题中乂括两个方面:A•体组织对象难以选择和只体信息特征难以揭示。数字化信息存储的特点是不同主题的信息可以

4、存储在同一载体上。如何选择组织对象成为一个问题。信息组织的要求来自数字信息资源本身对计算机软硬件设备的要求和技术的更新能否适应新环境。数字化信息资源的产生的方式很多,到0前为止没有形成统一的规范和标准,所以具体的信息特征很难揭示。信息组织方式很多,其中最基本的是主题法和分类法,到0前为止沒有规范统一的方法将分类法和主题法结合起来。数字图书馆是奋许多数据库和知识库组成的庞大信息系统,构建一个统一平台实现不同数据库和知识库中的数据流通成为一个问题。信息资源组织是治有信息人员运用专门的信息技术手段对大量的、分散

5、的、杂乱的各种源数据进行搜集选择,采用科学方法,将搜集的信息经过优化、加工处理和分析整序,形成一个便于冇效利用的系统的过程。人数据的数据来源冇结构化数据,半结构化数据和非结构化数据,面对这种复杂的数据通过处理和批处理等信息组织方式对这些数据进行处理,使数据呈现出一定规律。数字图书馆信息资源包括馆藏信息和网络信息资源。馆藏信息包括实体信息资源和虚拟信息资源。网络信息资源的范围比较广,凡存储在互联网上的信息都可以成为网上信息资源,包括电子出版信息,用户浏览网页产生的信息。馆藏信息和网络信息发展到一定程度会是数

6、据呈几何倍增长,形成人数据。目前的主题树方式、数据库方式、文件方式和超媒体方式等信息资源组织不能满足从大数据从及吋高效分析和挖掘出有用的信息,所以要将大数据的组织引入数字图书馆信息组织钟来,更好的为用户提供服务。大数据组织方式包括流处理和批处理。这两种方式主要是针对非结构化数据进行信息资源组织。二,数字图书馆的信息检索信息检索是数字图书馆信息服务的必不可少的核心部分,数字图书馆的易用性很大程度上是通过信息检索系统来体现的。由于数字图书馆的数字化信息资源类型丰富,不受吋间、空间、地域的限制,加大了信息检索服

7、务的难度。随着信息技术和吋间的流逝,这些数字化信息资源会越来越多,且数据的类型越来越丰富,在这种情况下如何来进行信息检索服务呢?这就需要将人数据处理技术应用到数字图书馆检索服务中。0前学界对数字图书馆的信息检索研宄己趋向成熟,而基于大数据的数字图书馆信息检索服务的研宄并不多。大数据环境下,数字图书馆信息服务的核心是面向用户信息需求为用户提供个性化的信息需求。基于人数据的数字图书馆信息检索的特征:(1)个性化搜索。数字图书馆信息检索是建立在对用户信息的收集的基础上进行分析,这种用户信息包括用户的个人信息,学

8、;g信息和行为信息(研究信息)。通过对这些信息的挖掘准确定位用户的信息需求,根据现奋的技术主动为用户提供信息推送服务。搜索引擎必须具备智能化,能根据用户输入的关键词将检索的结果按照相关度的高低呈现给用户即在保证査全率的同时要提高査准率,这就要求搜索引擎具备基于语义的分析能力和智能化的人机对话功能。(2)实吋优化需求。大数据环境下数字图书馆的数字化信息数量大,种类多,数据价值联系低,处理速度快,效率高,而£L数据结构复杂,不仅冇

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。