基于图书馆数据分析的存储策略研究

基于图书馆数据分析的存储策略研究

ID:46420438

大小:77.50 KB

页数:6页

时间:2019-11-23

基于图书馆数据分析的存储策略研究_第1页
基于图书馆数据分析的存储策略研究_第2页
基于图书馆数据分析的存储策略研究_第3页
基于图书馆数据分析的存储策略研究_第4页
基于图书馆数据分析的存储策略研究_第5页
资源描述:

《基于图书馆数据分析的存储策略研究》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库

1、基于图书馆数据分析的存储策略研究基丁图书馆数据分析的存储策略研究摘要:在以数据为中心大数据时代,存储系统成为IT基础设施的核心,存储系统建设与资金投入的矛盾日显。本文以广东省科技图书馆为例,从数据类型特点与存储策略的角度探讨图书馆存储系统建设问题,构思独特新颖,具有较高针对性和实用参考价值。关键词:需求分析;存储系统;存储策略;存储解决方案屮图分类号:TP333在以数据为中心大数据时代,存储系统重耍性逐步取代服务器,成为IT基础设施的核心。图书馆作为信息资源和服务的提供者,电子资源数据类型丰富,服务种类多样,对图书馆存储系统有更高的需求,存储系统建设与资金投

2、入的矛盾日显。图书馆的电子资源类型不同,对存储安全性、访问效率的要求是相差很大的;不同的存储结构,不同的冗余措施,单位容量的设备价格也相差很大。探讨研究建设满足图书馆需求的高性价比的存储系统日益重要[1-2]o探讨图书馆储存系统建设方面的论文很多,绝大多数是基于存储技术层面论述图书馆存储系统建设[3]。本文以广东省科技图书馆为例,尝试从另一个角度,探讨图书馆存储系统建设问题,即从数据类型特点与存储策略的角度探讨图书馆存储系统建设问题。本文构思独特新颖,具有较高针对性和实用参考价值。本文的存储策略是指:以图书馆业务系统数据类型为依据,高性价比为主轴,对图书馆数

3、据进行分类,分析存储系统性能指标,从数据安全性,扩展性,可用性和数据管理方而研究探讨建设高性价比图书馆存储系统问题。1图书馆数据类型与存储系统需求分析图书馆的数据,仅从存取角度看,可分为两大类:第一类是以文件形式存取的数据,基于文件级(file)的操作;第二类是采用关系型数据库形式存储的数据,是基于数据块级(Block)操作。而从数据存储与应用的角度,图书馆电子资源和各业务系统的数据主要有以下几类(以广东省科技图书馆为例)[4-5]:(1)目录类关系数据库:包括馆藏书目数据库、联合目录数据库、电子期刊导航数据库等;(2)文摘题录和电子资源索引数据库:包括CN

4、KI学术期刊全文索引数据库、学位论文索引数据库、超星院士文库、书生之家等电子期刊与图书的索引部分:(3)电子资源全文数据库:包括CNKI学术期刊全文数据库、维普科技期刊全文数据库、学位论文全文数据库、万方数据库、超星院士文库、电子报刊、书生之家电子书等电子期刊与图书;(4)光盘数据:CD、VCD、DVD等多媒体音视频资源;(5)自建文件型数据:包括随书光盘的压缩文件等;(6)自建关系数据库:包括高新技术数据库、西文联合目录、多媒体导航数据库等;(7)网站数据:包括图书馆网站,内部办公网,广东发明网,高新技术网等系列网站的网页数据;(8)各应用系统的数据:包括

5、自动化系统,原文传递系统,发现系统,邮件系统,DNS系统的数据;上述数据,(1),(6)类资源占用的存储空间较少,增长量也不大,对存储空间要求较低,但对安全性要求很高,对效率要求也很高;(2),(5),(7)类资源占用的存储空间比较大,增长平稳,对安全性与效率有较高的要求;(3),(4)类需要海量存储空间,而但空间增长迅速,但对安全性要求不高。(8)类数据原文传递系统,发现系统等图书馆业务系统对存储容量和性能有很高的需求。图书馆的数据种类不同,对存储系统安全性、容量、访问效率的要求是和差很大的;而不同的存储介质,不同的存储结构,不同的冗余措施,单位容量的设备

6、价格相差很大。针对不同数据特点,采取不同的存在策略,对降低图书馆存储建设的成木,提高可用性用着重大意义。2图书馆数据类型特点与存储策略研究2.1数据的安全性及策略2.1.1数据分类从安全性的角度,笔者将图书馆数据分为3种类型:(1)敏感数据,对存储系统安全性需求高,数据丢失不可恢复,对业务影响大。比如自动化系统读者信息库;(2)普通数据,对存储系统安全性需求较高,数据丢失可回复,但工作量很大。例如口建的随书光盘,如果丢失数据,虽然可以用光盘重建,但工作量巨大;(3)非敏感数据:对存储系统安全性需求不高,数据丢失可凹复,但工作量不大,但费吋。如全文期刊数据,如

7、果丢失数据,可以让数据库提供商重新拷贝数据,但由于是海量数据,需要长时间恢复。数据类型与存储系统安全性需求关系如表1所示。表1数据类型与存储系统安全性需求敏感数据普通数据非敏感数据数据來源自动化系统,自建数据库系统等口建光盘库等电子刊,电子书等对存储的安全需求高一般低2.1.2存储介质与数据安全比较数据最终存放在存储介质,介质的安全性是起决定作用的。目前常用的存储介质有磁盘,光盘,SSD固态盘。表2列举了常用介质的安全性、性能与价格的关系比较。表2不同介质安全性、性能与价格比较比较介质光盘SATAFCSASSSD性能低中高高极高安全性较低一般高高较高价格低低

8、高高昂贵2.1.3RAID水平与安全性、性能和价格比

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。