非结构化存储实施方案.doc

非结构化存储实施方案.doc

ID:56196235

大小:541.94 KB

页数:5页

时间:2020-03-19

非结构化存储实施方案.doc_第1页
非结构化存储实施方案.doc_第2页
非结构化存储实施方案.doc_第3页
非结构化存储实施方案.doc_第4页
非结构化存储实施方案.doc_第5页
资源描述:

《非结构化存储实施方案.doc》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库

1、非结构化数据存储方案一、存储类型体系:1.1存储类型体系结构图1.2存储类型体系描述(1)块存储:将存储区域划分为固定大小的小块,是传统裸存设备的存储空间对外暴露方式。块存储系统将大量磁盘设备通过SCSI/SAS或FCSAN与存储服务器连接,服务器直接通过SCSI/SAS或FC协议控制和访问数据。主要包括DAS和SAN两种存储方式。对比如下图:(1)分布式文件存储:文件存储以标准文件系统接口形式向应用系统提供海量非结构化数据存储空间。分布式文件系统把分布在局域网内各个计算机上的共享文件夹集合成一个虚拟共享文件夹,将整个分布式文件资源

2、以统一的视图呈现给用户。它对用户和应用程序屏蔽各个节点计算机底层文件系统的差异,提供用户方便的管理资源的手段和统一的访问接口。主要包括NAS和HDFS两种存储方式。a)网络附加存储NAS结构如图:a)HDFS分布式文件系统存储结构如图:(1)对象存储:对象存储为海量非结构化数据提供Key-Value这种通过键-值查找数据文件的存储模式,提供了基于对象的访问接口,有效地合并了NAS和SAN的存储结构优势,通过高层次的抽象具有NAS的跨平台共享数据优点,支持直接访问具有SAN的高性能和交换网络结构的可伸缩性。主要包括swift和ceph

3、两种实现形式。a)Swift,OpenStackObjectStorage(Swift)是OpenStack项目的子项目之一,被称为对象存储。它构建在比较便宜的标准硬件存储基础设施之上,无需采用RAID(磁盘冗余阵列),通过在软件层面引入一致性散列技术和数据冗余性,牺牲一定程度的数据一致性来达到高可用性和可伸缩性,支持多租户模式、容器和对象读写操作,适合解决非结构化数据存储问题。b)ceph,Linux下PB级分布式文件系统,可轻松扩展PB容量,提供了对多种工作负载的高性能和高可靠性。它大致分为四部分:客户端(数据用户),元数据服务

4、器(缓存和同步分布式元数据),一个对象存储集群(包括数据和元数据),以及最后的集群监视器(执行监视功能)。二、非结构化大数据分布式存储架构非结构化PB级大数据分布式存储架构,相对于其各自存储结构及不同应用场景,结合国产化大数据平台特性,现给出两种解决方案。第一种是基于OpenStack子项目swift的分布式大数据存储方案,另一种是基于ceph的分布式大数据存储方案2.1.1基于openStack子项目swift的大数据分布式存储a)Swift集群部署架构图:b)实现原理:用户上传文件PUTDATA和下载文件GETDATA,分别请求

5、同一个对象。上传文件时,PUT请求通过负载均衡管理器随即挑选一台ProxyServer,将请求转发给后者,后者通过查询本地Ring文件,选择3个不同节点中的后端来存储文件,然后同时将该文件向这三个存储节点发送文件。这个过程需要满足NWR策略,然后给用户返回写成功的信息。下载文件时,GET请求也通过负载均衡管理器随机挑选一台ProxyServer,后者上的Ring文件查询到这个文件的存储节点位置并同时向后端查询,至少两个节点“表示”可以提供该文件,然后ProxyServer从中选择一个节点下载文件。a)架构关键技术说明:ØProxyS

6、erver:是提供SwiftAPI的服务器进程,负责Swift其余组件间的相互通信。ØStorageServer:提供了磁盘设备上的存储服务。包含架构图上的Object、Container和Account。2.2基于ceph的大数据分布式存储a)Ceph集群部署架构图

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。