欢迎来到天天文库
浏览记录
ID:19932975
大小:26.50 KB
页数:4页
时间:2018-10-08
《存储备份技术探析》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库。
1、存储备份技术探析存储备份技术探析摘要:随着互联网络飞速发展,数据量呈现海量增长,单机存储无法满足需求,分布式存储应运而生并且取得了较大的发展。系统中的数据由于自然灾害、异常故障等原因会遭到破坏,因而需要对数据进行备份加以保护。以基于分布式文件服务器的存储备选份恢复系统为研究对象,探讨了分布式存储下海量数据备份恢复的关键问题:存储备份恢复的高效性、一致性和可靠性。关键词:备份;存储;分布式;P2P;技术 1存储与备份技术的高效性 1.1高性能多源下载过程 (1)服务器根据相关
2、信息返回存储需要下载文件的Slave的具体信息;(2)根据文件大小和Slave的负载状态,选择合适的Slave建立socket连接对文件进行分块下载;(3)下载完成后把各个文件块合并成为原始文件。 1.2静态下载 在静态下载中,不考虑备份文件的大小,服务器的负荷量,采取统一的模型进行下载。算法如下:(1)得到备份文件所在服务器的个数n,以及每个服务器的IP地址和端口号;(2)得到文件的总大小size,按照文件分割算法,把文件分割为n块;(3)与每个服务器建立连接,从每个服务器上下载一
3、块文件;(4)下载完成后,把所有文件块合并成一个完整的文件,存储在备份介质上;(5)保存备份文件的相关元数据信息;(6)文件下载、备份完成。 1.3动态下载 在动态下载模型中,要综合考虑各方面因素,动态决定文件是否分块进行多源下载,以及文件块的大小,提高系统资源利用率,进而提高备份效率。对于没有冗余的文件,只能从一个节点上下载。对于较小的文件,使用单线程下载;对于较大的文件,可以采用多线程下载。对于有多个冗余的文件,可以动态选取从负荷量较低的节点进行下载。伪算法表示如下: 首先定义
4、如下变量:文件大小阀值Tl,当文件大小大于Tl时采用多源下载;节点标准负荷T2,若节点负荷大于T2,则节点处于重负荷状态;文件大小size文件冗余数n。 算法表示如下: if(文件没有冗余)存储备份技术探析存储备份技术探析摘要:随着互联网络飞速发展,数据量呈现海量增长,单机存储无法满足需求,分布式存储应运而生并且取得了较大的发展。系统中的数据由于自然灾害、异常故障等原因会遭到破坏,因而需要对数据进行备份加以保护。以基于分布式文件服务器的存储备选份恢复系统为研究对象,探讨了分布式存储下海量
5、数据备份恢复的关键问题:存储备份恢复的高效性、一致性和可靠性。关键词:备份;存储;分布式;P2P;技术 1存储与备份技术的高效性 1.1高性能多源下载过程 (1)服务器根据相关信息返回存储需要下载文件的Slave的具体信息;(2)根据文件大小和Slave的负载状态,选择合适的Slave建立socket连接对文件进行分块下载;(3)下载完成后把各个文件块合并成为原始文件。 1.2静态下载 在静态下载中,不考虑备份文件的大小,服务器的负荷量,采取统一的模型进行下载
6、。算法如下:(1)得到备份文件所在服务器的个数n,以及每个服务器的IP地址和端口号;(2)得到文件的总大小size,按照文件分割算法,把文件分割为n块;(3)与每个服务器建立连接,从每个服务器上下载一块文件;(4)下载完成后,把所有文件块合并成一个完整的文件,存储在备份介质上;(5)保存备份文件的相关元数据信息;(6)文件下载、备份完成。 1.3动态下载 在动态下载模型中,要综合考虑各方面因素,动态决定文件是否分块进行多源下载,以及文件块的大小,提高系统资源利用率,进而提高备份效率。对
7、于没有冗余的文件,只能从一个节点上下载。对于较小的文件,使用单线程下载;对于较大的文件,可以采用多线程下载。对于有多个冗余的文件,可以动态选取从负荷量较低的节点进行下载。伪算法表示如下: 首先定义如下变量:文件大小阀值Tl,当文件大小大于Tl时采用多源下载;节点标准负荷T2,若节点负荷大于T2,则节点处于重负荷状态;文件大小size文件冗余数n。 算法表示如下: if(文件没有冗余) { 无须分块下载,可以采用多线程从存储文件的节点上下载文件; } else{ if
8、(文件大小size<阀值T1) { 无须多源下载,从存储文件的节点中选取负荷最小的节点,下载文件; } elsel 得到存储文件的n个节点的信息; 从n个节点上选择负荷小于阀值T2的节点,节点数目为m; 利用文件分割算法把文件分割为m块; 与选中的m个节点建立连接,从每个节点上下载一个文件块; 下载完成后,把m个文件块合并成为完整的文件; 把文件存储在备份介质; } } 2存储与备份技术的一致性 2.1锁和快照技
此文档下载收益归作者所有