欢迎来到天天文库
浏览记录
ID:8220930
大小:2.17 MB
页数:28页
时间:2018-03-10
《ArchSummit北京-《经验分享:构建OpenStack高可用云服务平台》-吴德新》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库。
1、经验分享构建OpenStack高可用云服务平台目录•我们是谁•高可用介绍•OpenStack高可用方案•案例分享海云是谁•北京海云捷迅科技有限公司,简称AWcloud海云,国内领先的企业级OpenStack云服务提供商•AWcloud海云成立于2010年,2012年开始专注OpenStack私有云服务•核心成员来自IBM/RedHat/甲骨文/绿盟/东软•公司总部位于北京,在深圳、武汉、上海等地设有分支机构•2013年10月获得宝德科技A轮1500万人民币融资•2015年06月获得INTEL领投的B轮数千万人民币融资海云业务•私有云解决
2、方案(PrivateCloudSolution):基于海云OpenStack发行版,支持KVM、Hyper-V、VMware等异构虚拟化平台,为企业客户构建和管理私有云平台。•私有云托管(PrivateCloudHosting):海云为企业客户提供私有云托管服务,帮助客户一站式解决数据中心、硬件、存储、云平台、运维等所有问题。客户按需租赁整体云平台,按需付费。•融合一体方案:海云为企业客户提供AWcloud超融合一体机,帮助企业实现IT系统快速部署、自动化运维。•IDC数据中心云平台联合运营:联合国内知名IDC企业,整合优势资源,为ID
3、C企业提供基于OpenStack技术的公有云平台,为IDC企业迅速转型为VDC,提供平台支持、技术支持和服务支持。•OpenStack咨询与培训:为企业客户提供OpenStack运维、开发的咨询和培训。海云的技术团队,具备丰富的一线运营经验,可以为企业客户提供成熟的OpenStack运营和运维服务。高可用介绍•Availablity=Fn(MTBF,MTTR)可用性百分比每年停机时间•通过避免单点故障来减少停机时间99%87.6小时99.5%43.8小时•冗余服务99.9%8.8小时–Active-Active•无状态应用99.95%4
4、.4小时•应用内置支持99.99%53分钟–Active-Passive99.999%5.3分钟•通过外部集群软件Haproxy+Keepalived•Haproxy负载均衡•Keepalived切换虚IP•基于VRRP•高版本可以配置单播•避免Keepalived“脑裂”•ping网关•只有从节点可以failover,发生切换后通知管理员•配置简单,适合于切换虚IP•没有完整的服务管理和Fence机制Pacemaker•使用Corosync维护成员关系•Quorum机制•通过STONITH支持Fence•丰富的服务管理脚本•控制服务依
5、赖,主机亲和力•丰富的文档OpenStack架构http://docs.openstack.org/openstack-ps/content/figures/2/figures/osog_0001.png基础服务的高可用•MySQL•Galera多主,但只有一个可写,避免死锁同步复制,运维方便,吞吐量有影响•原生的主从方案+MHA•RabbitMQ•RabbitMQ内置集群机制•不要使用Haproxy,直接使用oslo.messaging的驱动控制节点高可用架构问题•单节点故障恢复时间,大概在一分钟左右,这期间的客户端请求可会出错•Ra
6、bbitMQ节点的消息同步是异步的,所以有可以碰到丢消息的情况•RabbitMQ出现过悬空consumer的问题,自制监控脚本,用删队列并让客户端自动重建队列的方法解决。高版本增加客户端应用层面心跳有可能解决•使用memcached作为Keystone的token存储时,发现客户端集群没有fence/unfence机制,导致在节点故障时仍然连接故障节点,延长重试时间后,又发现有丢token的现象。改为使用MySQL存放token,后来开发了Redis驱动•服务启动顺序有依赖关系,需要保证按顺序启动•经过优化后,全部控制节点从断电到完成恢
7、复需要5分钟时间存储:数据平面(Ceph)•支持数据多副本•数据按照CRUSH算法存放,可以考虑物理拓年•客户端通过CRUSH算法来计算数据存储位置•CephMonitor使用Paxos算法保证一致性http://pinrojas.com/2014/05/20/ceph-you-will-love-the-way-it-flies/网络节点•DHCP运行多个Agent,地址分配由Neutron控制•虚拟路由器通过Keepalived互备•在L版本里修复和L2pop的冲突•不支持连接跟踪信息failover•单个网络节点在可用性和性能都可
8、能成为瓶颈•社区DVR功能并不成熟•可以根据需求考虑使用物理网络设备管理三层虚拟机高可用方案•在虚拟机内运行集群•SDN的限制•多播•Neutron的allowed-address-pairs•虚IP的切换
此文档下载收益归作者所有