网络存储系统容错编码专业技术进展

网络存储系统容错编码专业技术进展

ID:45963702

大小:24.50 KB

页数:5页

时间:2019-11-19

网络存储系统容错编码专业技术进展_第1页
网络存储系统容错编码专业技术进展_第2页
网络存储系统容错编码专业技术进展_第3页
网络存储系统容错编码专业技术进展_第4页
网络存储系统容错编码专业技术进展_第5页
资源描述:

《网络存储系统容错编码专业技术进展》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库

1、网络存储系统容错编码技术进展英文摘要:Largeprofessionalharddiskstoragesystemsaregenerallyarrangedasarraysystemsconsistingofmanyharddisks.However,asthenumberofharddisksincreases,theprobabilityofdiskfaultanddatalossalsoincreases.Aredundantfault-tolerantcodingtechniquecanbeemployedtha

2、tallowsforfaultsamongharddisks.Currently,onlydoublefault-tolerantarraycodesareinwidespreaduse;butwithexpansionofsystemsize,differentfault-tolerantcodingstreamswillneedtobeinvestigated.Expertsgenerallyagreethattriple-fault-tolerantcodingwillbecomethedominanttechni

3、quewiththenextfivetotenyears.英文关键字:storagesystems;fault-tolerantcoding;arraycode基金项目:国家高技术研究发展(“863”)计划(2008AA01Z401);国家自然科学基金(60903028)1.存储容错编码评价指标近20年来,随着计算机技术的迅猛发展,大规模存储系统的发展也十分迅速。当前,普通PC机的存储器的容量已经达到了太比特级别,这较之20年前的20MB存储容量提高了10000倍。除了传统的磁盘驱动器之外,新型的

4、固态存储(SSD)存储器也已经走向市场。尽管单个存储器的容量发展迅速,但是却仍然赶不上人们对存储容量需求的增长速度。随着大型计算机系统由“以计算为中心”向着“以信息处理为中心”的转变,以及信息量的爆炸式增长,人们对海量存储系统的需求日益提高。海量存储系统本质上是将很多的单个存储器件(下面均以磁盘为例),通过系统的接口,连接整合为一个虚拟的容量巨大的单一存储器,即磁盘阵列。随着阵列中磁盘数目的增多,系统的可靠性也随之下降。工业界一般使用平均数据丢失时间(MTTDL)来衡量阵列

5、的可靠性。设单个磁盘的平均失效时间为MTTFdisk,则对于包含n块磁盘的无冗余阵列来说,其MTTDL可简单估计为:MTTDL=MTTFdisk/n。可见,当n较大时,整个系统的可靠性将成比例下降。这对于较大规模的系统来说是不可接受的。利用冗余数据编码来提高系统可靠性是公认的解决这一问题的较好方法。通过巧妙地将m块标准大小的磁盘上的数据,增加部分冗余校验信息,编码后存放于n块磁盘上,使得系统满足:对于任意k块磁盘失效,都可以通过其他n-k块未失效盘中的数据解码恢复,则称整个系统是k容错的,或者称k为系统的容错数。分析表明

6、[1],对于k容错的系统来说,可以近似估计为:因而,在大规模系统中,容错数可以说是另一种对系统可靠性的描述方式。市场中一般磁盘的MTTFdisk为105左右,系统修复时间MTTR一般为10左右。根据(1)式可以看出,当系统磁盘数为103~104时,一般2容错或是3容错编码就基本上可以满足存储系统的容错要求。系统用于增加容错能力而添加的冗余越多,系统的额外造价也将越高。因而在具有相同容错数的前提下,人们往往追求更小的冗余度,即(n-m)/n的值,其中n为系统磁盘数、m为存储用户数据的磁盘数。根据编码理论的Singleton

7、界,k容错系统的最小冗余度为:k/n。达到这一最小值的编码方法称做MDS码。目前多数存储编码研究都集中于构造不同参数下的MDS码。除了上述指标,任何计算机系统的速度与效率永远是需要考量的重要指标。这里我们不讨论如何有效地并行处理多磁盘中的数据读取(那是另外一个较大的课题),而着重研究由于冗余编码带来的额外计算开销。对于即便是相同的编码方法,由于编/解码算法的不同,可能计算效率的差异较大。由于在计算机系统中,最终的编码运算都会反映为一些二进制运算,因而研究者通常使用编码需要的总的二进制异或运算次数来衡量由于额外冗余编码带来

8、的系统计算开销。对于一个随机存取的存储系统来说,随机小块信息写操作的性能尤为重要。编码运算中每个单元所参与的平均异或次数可以用来衡量这一指标,我们称其为编码的更新复杂度。综合上面讨论,存储系统容错编码问题可以归结为寻求对如下指标进行优化的编码方法系统满足需要的容错性能,容错数为k的系统。  系统有较小(或最优)的冗余

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。