数据分级存储策略

数据分级存储策略

ID:44421355

大小:23.00 KB

页数:3页

时间:2019-10-21

数据分级存储策略_第1页
数据分级存储策略_第2页
数据分级存储策略_第3页
资源描述:

《数据分级存储策略》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库

1、数据分级存储策略口罗敏【提要】文章对数据分级存储的概念、要求、成本、存储方式等方血进行了详细地论述。【关键词】数据分级存储根据统计显示,超过30天的数据的使用率只有不到5%.80%的硬盘数据是不经常被访问的,但这些80%的数据却占据了宝贵而且昂贵的磁盘空间,但这些数据仍然很重要•必须完好的保存.如何来处理这些过往数据及合理利用存储空间,确保以最低的存储成本来实现数据的最住存储7对管理大量数据信息的档案部门来说,这是一个很重要的问题。而分级存储策略的提出可以解决此问题,可以实现存储成本和数据利用Z间的平衡,实现电子文件存储管理的髙效化,

2、简约化.保证电子文件数据的存储安全。一•什么是分级存储任何一种数字文献资源都具有生命周期.不同的时期有其存在的不同意义。在数据刚生成的数日内.访问频率最高,为读者带来的使用价值也最高:随着时间的推移.访问频率降低.数据的价值也随之下降,低访问频率的数据住息的价■奠时闻变化••生•一一t:B・L・一?・.止.竹囊・一t・王・一一•■一量远远超过高访问频率的数据量。不同生命周期的数据是提供给不同使用对彖的•这就为以最低的成本获得最高的使用价值提供了可能。分级存储就是以信息生命周期管理理论为依据,根据数据所能提供的使用价值来决定存储成本.存

3、储设备。文件由分级存储系统依据用户设定的策略(如根据数据类型,重要性、使用频率和时限)有选择地对某些数据进行迁移。直接将其拷贝到分级存储介质上(数据迁移).当文件被正确拷贝后。一个与原文件有相同名字的标志文件被创建。但它只占用比原文件小得多的磁盘空间。当用户访问这个标志文件时.分级存储系统会口动介入进来并将原始文件从正确的分级存储介质上恢复过来并覆盖标志文件{数据回迁)。数据分级存储Z所以重要,是因为它既能最大限度地满足用户需求.又可使存储成本最小化。数据分级存储的优点具体表现在以下4个方面:图1信息的价值随时间变化图图2存储介质性能

4、,容量.成木比例图■减少总体存储成木:不经常访问的数据驻留在较低成本的存储器中,可综合发挥磁盘驱动器的性能优势与磁带的成本优势。■性能优化:分级存储可使不同性价比和不同时期的存储设备发挥最大的综合效力。■改善数据可用性:分级存储把很少使用的历史数据迁移到辅助存储器屮,或归档到离线存储池中,这样就无需反复保存.减少了存储的时间;同时提高了在线数据的可用性,使磁盘的可用空间维持在系统要求的水平上。■数据迁移对应用透明:进行分级存储后.数据移动到另外的存储器时,应用程序不需要改变,使数据迁移对应用透明。=•分级存储应遵循的要求1・数据的安全

5、性分级存储应保证数据的安全性,宜采取在线.近线.离线备份的多层次备份方式.周期性保存数据的历史,以便数据发生损坏时.使用备份数据恢复到错误发生之前的状态.以确保数据的正常访问。并建立严格的备份策略•流程等一系列手段确保利用数据•备份数据的安全。2.数据的高可用性分级存储应保证数据有较高的访问速度,特别是在线数据的实时获取。此2009年第5期?识蓝档京45万方数据夕卜.分级存储还必须考虑存储设备的灾备性能,保证数据的真实性.完整性和长期可读性,保证数据的安全可用。3.容量可扩展性近年来数据量爆炸性增长,数据总量呈指数上升,档案部门也面临

6、着数据量的不断増长。所以分级存储必须考虑各种存储设备的容量扩展性,以保证在一定的时期内有足够的容量以适应不断增长的数据量。4.设备的兼容性分级存储最主要的两种处理为数据迁移和数据冋迁.即根据数据类型、重要性,使用频率和时限实现数据在各级存储设备间的迁移。因此,分级存储必须保证各种存储设备间的兼容性.存储设备与存储管理软件的兼容性、以及各种存储设备对不同存储格式的支持。5.管理的高效性分级存储应遵循分布式存储.集屮管理的原则.对齐级存储设备和数据进行集中统一管理,并对数据资源.存储设备和空间的使用权限和日志进行严格完备的定义,简化存储管

7、理过程。以实现自动化的高效管理。6.经济效益性不经常访问的数据可存储在较低成本的存储设备中.而访问频率较高的数据可存储在性能较高的存储设备中,分级存储应采用多种存储方式、多种存储介质相结合的方式,综合发挥各种存储设备的性能优势或成木优势.在降低单位存储成木的同时,保证并提高数据的安全性和利用率。三,分级存储成木分析图2显示,存储介质的性能与成本呈正比关系:性能越好、存取速度越快,单位存储成本越高,反Z亦然。然而•存储介质的容量和成本是呈反比关系:容量越大•单位存储成本越低•存取速度也就越慢。性能、容量、成本不能同时实现,只能找一个平衡

8、点。根据信息生命周期管理理论,分级存储应该根据数据的使用价值来决定存储成本、存储设备。在线存储中存储的数据访问频度较46锻盟姑奄?2009年第5期高、访问量多,其使用价值比较大,对访问速度的要求比较高.因此应该选用“高性

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。