欢迎来到天天文库
浏览记录
ID:34560860
大小:1.61 MB
页数:45页
时间:2019-03-07
《ibm 智慧存档与恢复-ibm protectier重复数据删除解决方案》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库。
1、智慧的存档与恢复—IBMProtecTier重复数据删除解决方案赵健夫高级系统顾问内容市场概述IBM重复数据删除解决方案IBM重复数据删除产品线成功案例与总结内容市场概述IBM重复数据删除解决方案IBM重复数据删除产品线成功案例与总结存储专家的痛点什么是存储相关的两大难题?TheInfoProStorageStudyWave9(4/5/07):F1000Sample.n=149.Othern=14.*Multipleresponsesrecorded存储专家的痛点什么是存储相关的两大难题?TheInfoProStorageStudyWa
2、ve9(4/5/07):F1000Sample.n=149.Othern=14.*Multipleresponsesrecorded为什么虚拟磁带库获得广泛应用恢复:30GB三种磁带上的数据30002500200秒)提高备份恢复速度----特别是恢复速度(1500时间降低成本,简化管理1000利用大容量ATA磁盘大幅降低成本5000相对于真实磁带库更为简化的管理磁盘LTO-1LTO-2STK9,840B避免磁带库的高机械故障数据传输时间文件存取时间注意:倒带/卸载时间易于维护,对环境要求低假定LTO1、磁带准备时间LTO2和9840B磁带装
3、载时间比磁带库成本高的压缩比为2:1比磁带库成本高采用重复数据删除技术的虚拟磁带库数十倍的数据压缩能力比真实磁带库更低的成本内容市场概述IBM重复数据删除解决方案IBM重复数据删除产品线成功案例与总结什么是重复数据删除?Datade-duplication(亦称“智能压缩”)是一种通过消除冗余重复数据减少存储需求的方法.只有不同的数据块保存在存储介质里.重复的数据块仅通过索引或指针来表示CBACBACBACCCABAABABABAABBAA1.Dataelementsare2.Signaturevaluesare3.Duplicated
4、ataelementsanalyzedtodetermineacomppyaredtoidentifyallareeliminatedandareuniquesignatureforeachduplicatesreplacedwithpointerstotheexistingreferenceelement重复数据删除的三个基本方法哈希算法内容识别HyperFactor假设需要进行重复数据一种无需查看数据内容删除的文件是那些具有就可进行重复数据删除有时候被称为内容可寻相同属性(例如,名称)的独特方法址存储方法的对象哈希算法每个“chunk”为8KB1T
5、B数据为125,000,000个8KB每个“签名”20bytes则需要2.9GB内存确保足够的处理性能100TB的备份数据量需要306GB内存哈希算法1.将数据分成小片(变长或定长)每个“chunk”为8KB1TB数据为125,000,000个8KB每个“签名”20bytes则需要2.9GB内存确保足够的处理性能100TB的备份数据量需要306GB内存哈希算法1.将数据分成小片(变长或定长)ABCDE每个“chunk”为8KB2.为每一小片生成哈希值1TB数据为125,000,000个8KB每个“签名”20bytesABCDE则需要2.9GB内存确保足
6、够的处理性能hhhhh100TB的备份数据量需要306GB内存哈希算法1.将数据分成小片(变长或定长)ABCDE每个“chunk”为8KB2.为每一小片生成哈希值1TB数据为125,000,000个8KB每个“签名”20bytesABCDE则需要2.9GB内存确保足够的处理性能hhhhh100TB的备份数据量需要306GB内存3.分下一块数据并寻找是否有相同的哈希值ABCDE哈希算法1.将数据分成小片(变长或定长)ABCDE每个“chunk”为8KB2.为每一小片生成哈希值1TB数据为125,000,000个8KB每个“签名”20bytesABCDE则
7、需要2.9GB内存确保足够的处理性能hhhhh100TB的备份数据量需要306GB内存3.分下一块数据并寻找是否有相同的哈希值ABCDE4.存储哈希值不同的数据片重复数据删除的三种算法-Hash•Hash冲突•Hash技术的索引数据量评估内容感知1.遍历数据确定所有文件FileAFileBFileCFileD内容感知1.遍历数据确定所有文件FileAFileBFileCFileD2.定位文件原始版本FilAFileAextents12341,2,3,43.比较不同版本,定位参考点FileAFileBFileCFileD内容感知1.遍历数据确定所有文件
8、FileAFileBFileCFileD2.定位文件原始版本FilAFileAextents
此文档下载收益归作者所有